光学字符识别助译员轻松录入

发布时间 : 2015/12/31 本文来源 :唐能翻译

翻译公司上海介绍OCR是Optical Character Recognition(光学字符识别)的首字母缩写。对于译者来说,大量的源语文件是印刷品,要想在翻译这些资料的时候使用CAT软件,就必须首先将印刷品转换为电子文档。手工录入费时费力,而使用扫描仪扫描书籍,得到的是图象文件,其中的字符其实都是以像素的形式储存的,无法编辑、搜寻和引用,也无法导入TM软件建立翻译项目。翻译公司上海介绍要想将这些图像中的文字转换为可以编辑的字符,就必须借助OCR软件来实现。在汉字识别方面,比较成熟的有汉王系列的OCR软件。而对于英文,目前最佳的选择可能是俄罗斯的Abby FineReader,此外还有OmniPage、TextBridge等。配合普通的平板扫描仪,使用Abby FineReader可以在一天时间内轻松识别完成三、四百页的外语书。国外许多大学的电子图书馆中的书籍,就有不少是通过OCR配合专业扫描仪识别录入的。
上海汽车翻译说起文字处理,还有一个容易被人们忽视的小问题,就是汉字的输入法。使用Déjà Vu这样的TM软件翻译的时候,系统会自动插入术语词库中已有的对应词,这时译者需要做的,是补充其他字词,并调整自动插入字词的顺序来完成一句话的翻译。这样的情况下,使用以词为单位的拼音输入法效率更高。据笔者的经验,近年来最优秀的以词为单位的拼音输入法,要数拼音加加(http://dir.jjol.cn/Pyjj/),其三重码设置配合以左右上档键和空格键选字,可以使用户抛开数字键快速选字选词,使拼音输入也可以不再需要看键盘,快速盲打,极大地改善了用户的工作方式。




本站所有文章均为原创,如需转载请注明出处!

标签:翻译公司上海,上海汽车翻译
59