收藏本站腾讯微博新浪微博

经典论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

蓝色理想 最新研发动态 网站开通淘帖功能 - 蓝色理想插件 论坛内容导读一页看论坛 - 给官方提建议

论坛活动及任务 地图和邮件任务 请多用悬赏提问 热夏来袭,选一款蓝色理想的个性T恤吧!

手机上论坛,使用APP获得更好体验 急需前端攻城狮,获得内部推荐机会 论坛开通淘帖功能,收藏终于可以分类了!

搜索
查看: 4149|回复: 3

[资源] 现行中国标准 文字 简繁转换 工具 测试

[复制链接]
发表于 2009-11-29 21:08:57 | 显示全部楼层 |阅读模式
現行中國標準 文字 簡繁轉換 工具 測試
标签:  工具  文字  中文  簡繁轉換  

http://www.swfcabin.com/swf-files/1259497275.swf

<如果你覺得文字框太小,點擊這里看全屏版,有可能要最小化窗口后還原>

Q说明:终于把这个东西弄完了第一阶段,需要大家的大量测试,以便修改错漏。

这个东西,是方便简繁转换的文字工作者使用的,和其他简繁转换工具有什么不同?
首先,整理了繁体及异体字转为简体的诸多细节,校勘了一些以往的错漏,并根据09年的现行语言文字改革方案作了一些细节修正。(基本上是 3000x3 字的逐字校对)
其次,简体到繁体的部分,参照了台湾教育部的标准文字方案,改进了以往我们转换成繁体时“想当然”但是现在的“现代繁体字”根本就不使用和错漏的部分,约 2750字逐字校对。另外3100余字词一简多繁字词校对。

本来,是准备采用两套方案,一套是台湾标准,一套是香港标准。因为在很多“正字”的选择和习惯用字上,两地有较大差异。但是由于香港地区的语言文字比较不规范,港用语音词多且没有统一的使用标准,没有准确的参考资料。如果各位能提供相关资料,我可以后续添加这个部分的转换功能。

其他小工具,文字转换中的标点和空格空行整理等等,是比较实用的一些功能,可以试试。

另外一个比较特别的功能,是台湾注音符号转汉语拼音。如果你有看不明白的时候,直接转过来看吧。

下面提供一些測試文字樣本:

莊子 《逍遙遊》
北冥有魚,其名為鯤。鯤之大,不知其幾千里也。化而為鳥,其名為鵬。鵬之背,不知其幾千里也;怒而飛,其翼若垂天之雲。是烏也,海運則將徙於南冥。南冥者,天池也。齊諧者,志怪者也。諧之言曰:“鵬之徙於南冥也,水擊三千里,摶扶搖而上者九萬里,去以六月息者也。”野馬也,塵埃也,生物之以息相吹也。天之蒼蒼,其正色邪?其遠而無所至極邪?其視下也亦若是,則已矣。且夫水之積也不厚,則其負大舟也無力。覆杯水於坳堂之上,則芥為之舟,置杯焉則膠,水淺而舟大也。風之積也不厚,則其負大翼也無力。故九萬里則風斯在下矣,而後乃今培風;背負青天而莫之夭閼者,而後乃今將圖南。蜩與學鳩笑之曰:“我決起而飛,槍榆、枋,時則不至而控於地而已矣,奚以之九萬里而南為?”適莽蒼者三餐而反,腹猶果然;適百里者宿舂糧;適千里者三月聚糧。之二蟲又何知!小知不及大知,小年不及大年。奚以知其然也?朝菌不知晦朔,惠蛄不知春秋,此小年也。楚之南有冥靈者,以五百歲為春,五百歲為秋;上古有大椿者,以八千歲為春,八千歲為秋。而彭祖乃今以久特聞,眾人匹之,不亦悲乎!

《石州引》賀鑄   薄雨初(收/催)寒,斜照弄晴(風色收寒,雲影弄晴),春意空闊。長亭柳色(蓓)才黃,遠客一枝(倚馬何人)先折。煙橫水際(漫),映帶幾點歸鴉(鴻),東風消盡龍沙雪。還記出門來(關來/門時),恰而今時節 。

繁体字不是说换个输入法就能搞对的。试试输入这句话:
卖人参旁边的发廊发生了令人郁闷的哄抢郁金香事件,
参与群众听到警笛后往皇后街逃窜并向警方投掷可乐听…
由发生腹泻消息人士泄露未经证实,稍后一并跟踪详情。
和你不相干的事不要去干,干了又干不好,还要和人家干仗。惹了祸我是你干爹也脱不了干系,看着干着急。
呼吁老板们少搞点酒杯和奖杯,多嘘寒问暖下岗职工,别和职工闹别扭激化冲突,多发工资,不要怒发冲冠。
张三丰真人创立武当派,丰功伟绩,丰采非凡。
不要把丈夫当成自己的马夫和伙夫,要效仿贤德,举案齐眉。
谷歌不是在谷子地里唱歌,而是在山谷里唱歌。
她计划在商场打折的时候大血拼,我却觉得划不来。
仿造不是仿效,仿佛有些不同。
百川汇于海,词汇太多用不完。
在名胜古迹上不要留下你的笔迹。
茶几很干净,几乎看不到污点。
她和隔壁家的大小姐成了姊妹,我还不知道她是个空姐呢。
佛罗里达离中国可是十万八千里呢,哪里能很快就到?
不了解她们脑袋里想些什么,经常就歇斯底里了起来。
翻过今年的日历,对于2012来讲,现在就是历史。
他告诉我一个土方子,把土霉素碾成粉放在皮鞋里,可防止脚臭和鞋子发霉。
谁的面子这么大,用方便面就打发我们,起码也要担担面呀!
老舍写的茶馆里那种老北京胡衕情节让人恋恋不舍。
歌舞升平,步步高升这些吉祥话在节日里用得很多。
精彩绝伦的表演令人赞叹不已,自叹不如。
摩托车托运到底靠不靠得住呢?
历史系的同学请联系好实习单位,这关系到就业问题。
弓弦为武,丝弦为文,怎能混为一谈?
群贤毕至,少长咸集,一起分享咸鸭蛋吧!
要找准方向,虽然你向往光明。
你觉得凶案现场走过的那个凶巴巴的人有嫌疑?
溜须拍马是不须要的卑劣手段。
在写着“小心烟火”的加油站抽菸真是不要命。
扬起头自豪的看着迎风飘扬的五星红旗。
据说有人在梦游的时候还能跑到水池里游泳,真吊诡。
下周岳父岳母要参加一个旅游团,去五岳之首的东岳泰山游览。
环境太脏,对心脏不好的人是个负担。
片言只字道不尽,只有打个电话给你。
在网志上能够找到兴趣志向相同的朋友是件乐事。
制药业不能也搞一国两制,需要有统一标准,不合格的药品不准生产。
将精美的钟表送给心爱的人叫做“聊表心意,情有独钟”,送给老态龙钟的人就有点不敬了。
香港的一些八卦周刊经常会派出狗仔队潜伏在明星寓所周围。
请注意,你的注册信息可能和以前的有出入,请核对。如有登录困难,请向客服处咨询。

ㄧㄤˊ ㄑㄧˇ 扬起 ㄊㄡˊ 头 ㄗˋ ㄏㄠˊ 自豪 ㄉㄜ· 的 ㄎㄢˋ 看 ㄓㄜ· 着 ㄧㄥˊ ㄈㄥ 迎风 ㄆㄧㄠ ㄧㄤˊ 飘扬 ㄉㄜ· 的ㄨˇ ㄒㄧㄥ ㄏㄨㄥˊ ㄑㄧˊ 五星红旗。

扬起头自豪的看着迎风飘扬的五星红旗。
ㄧㄤˊ ㄑㄧˇ ㄊㄡˊ ㄗˋ ㄏㄠˊ ㄉㄜ· ㄎㄢˋ ㄓㄜ· ㄧㄥˊ ㄈㄥ ㄆㄧㄠ ㄧㄤˊ ㄉㄜ· ㄨˇ ㄒㄧㄥ ㄏㄨㄥˊ ㄑㄧˊ

博客原文:http://home.blueidea.com/space.p ... o=blog&id=16378

[[i] 本帖最后由 QUESTER 于 2009-11-29 08:14 编辑 ]
 楼主| 发表于 2009-11-29 21:11:12 | 显示全部楼层
转换结果参照:

繁體字不是說換個輸入法就能搞對的。試試輸入這句話:
賣人蔘旁邊的髮廊發生了令人鬱悶的哄搶鬱金香事件,
參與群眾聽到警笛後往皇後街逃竄並向警方投擲可樂听…
由發生腹瀉消息人士洩露未經證實,稍後一并跟蹤詳情。
和你不相干的事不要去幹,幹了又幹不好,還要和人家幹仗。惹了禍我是你乾爹也脫不了干係,看著乾著急。
呼籲老闆們少搞點酒杯和獎盃,多噓寒問暖下崗職工,別和職工鬧彆扭激化衝突,多發工資,不要怒髮衝冠。
張三丰真人創立武當派,豐功偉績,丰采非凡。
不要把丈夫當成自己的馬伕和伙伕,要傚倣賢德,舉案齊眉。
谷歌不是在穀子地里唱歌,而是在山谷裡唱歌。
她計劃在商場打折的時候大血拼,我卻覺得划不來。
倣造不是倣傚,彷彿有些不同。
百川匯於海,詞彙太多用不完。
在名勝古蹟上不要留下你的筆跡。
茶几很乾淨,幾乎看不到汙點。
她和隔壁家的大小姐成了姊妹,我還不知道她是個空姐呢。
佛羅里達離中國可是十萬八千里呢,哪裡能很快就到?
不瞭解她們腦袋裡想些什麼,經常就歇斯底里了起來。
翻過今年的日曆,對於2012來講,現在就是歷史。
他告訴我一個土方子,把土黴素碾成粉放在皮鞋裡,可防止腳臭和鞋子發霉。
誰的面子這麼大,用方便麵就打發我們,起碼也要擔擔麵呀!
老舍寫的茶館裡那種老北京胡衕情節讓人戀戀不捨。
歌舞昇平,步步高陞這些吉祥話在節日裡用得很多。
精彩絕倫的表演令人讚歎不已,自嘆不如。
摩托車託運到底靠不靠得住呢?
歷史系的同學請聯繫好實習單位,這關係到就業問題。
弓弦為武,絲絃為文,怎能混為一談?
群賢畢至,少長咸集,一起分享鹹鴨蛋吧!
要找準方向,雖然你嚮往光明。
你覺得兇案現場走過的那個凶巴巴的人有嫌疑?
溜鬚拍馬是不須要的卑劣手段。
在寫著“小心煙火”的加油站抽菸真是不要命。
揚起頭自豪的看著迎風飄颺的五星紅旗。
據說有人在夢遊的時候還能跑到水池裡游泳,真弔詭。
下周岳父岳母要參加一個旅遊團,去五嶽之首的東嶽泰山遊覽。
環境太髒,對心臟不好的人是個負擔。
片言隻字道不盡,只有打個電話給你。
在網誌上能夠找到興趣志向相同的朋友是件樂事。
製藥業不能也搞一國兩製,需要有統一標準,不合格的藥品不准生産。
將精美的鐘錶送給心愛的人叫做“聊表心意,情有獨鍾”,送給老態龍鍾的人就有點不敬了。
香港的一些八卦週刊經常會派出狗仔隊潛伏在明星寓所周圍。
請注意,你的註冊信息可能和以前的有出入,請核對。如有登錄困難,請向客服處諮詢。

yáng qǐ 揚起 tóu 頭 zì háo 自豪 de 的 kàn 看 zhe 著 yíng fēng 迎風 piāo yáng 飄颺 de 的wǔ xīng hóng qí 五星紅旗。

揚起頭自豪的看著迎風飄颺的五星紅旗。
yáng qǐ tóu zì háo de kàn zhe yíng fēng piāo yáng de wǔ xīng hóng qí

[[i] 本帖最后由 QUESTER 于 2009-11-29 08:15 编辑 ]
回复 支持 反对

使用道具 举报

发表于 2009-12-3 13:52:09 | 显示全部楼层
繁體的“著作、著書立傳、著名”都變成了“着作、着书立传、着名”
简体的“游行、游泳”都变成了“遊行、遊泳”
简体的“制造、制度”都变成了“製造、製度”
简体的“皇后、天后”都变成了“皇後、天後”
简体的“丫头、枝丫”都变成了“丫頭、枝丫”
简体的“炮仗、炮弹”都变成了“炮仗、炮彈”
简体的“胡说、胡须”都变成了“胡說、胡須”
简体的“借钱、借口”都变成了“借錢、借口”
简体的“茶几、几何”转繁体无变化
简体的“秋天、秋千”转繁体无变化

不继续测了,找到一份有用的资料鼠标可以参考下:http://input.foruto.com/ccc/data/proof/02.htm

[[i] 本帖最后由 moonjeep 于 2009-12-3 01:34 编辑 ]
回复 支持 反对

使用道具 举报

 楼主| 发表于 2009-12-3 15:22:42 | 显示全部楼层

回复 3# moonjeep 的帖子

嗯,这些问题已经注意到了,是由于词库部分的顺序和"现代词汇"量不充足造成的,
需要进行一有些细节调整.
谢谢你给的资料, 其实规则都是一样的,只是词汇量和前后搭配的辨别比较复杂.
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|小黑屋|Archiver|手机版|blueidea.com ( 湘ICP备12001430号 )  

GMT+8, 2020-9-21 18:26 , Processed in 0.106178 second(s), 9 queries , Gzip On, Memcache On.

Powered by Discuz! X3.2 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表