笨者之帚
发表于 2012-7-3 14:57
这书似乎有色拉寺现代排版印刷出来的,可以扫描或者以高拍仪录入。
藏文识别软件,这里倒是有一个:
http://ishare.iask.sina.com.cn/f/15168069.html?from=like
但从来没用过,不知准确率几何?
宝藏谷
发表于 2012-7-3 15:19
藏文识别软件 我这里有 准确率还行
像这样大部头的作品还是需要专业人士精心制作,毕竟咱汉族弟子做自己的事也在积累功德。
chodrak
发表于 2012-7-3 15:43
書名見六樓。如果有藏文識別軟件,那就方便多了。可以掃描現代版的印刷品,效果應該是不錯的。
fstibet
发表于 2012-7-3 17:15
宝藏谷 发表于 2012-7-3 15:19 static/image/common/back.gif
藏文识别软件 我这里有 准确率还行
像这样大部头的作品还是需要专业人士精心制作,毕竟咱汉族弟子做自己 ...
请问师兄:藏文识别软件识别后是不是喜马拉雅藏文字体?谢谢!
拌面
发表于 2012-7-3 17:55
建议请江波前辈用数码照相机拍下来,然后通过电子邮件发给楼主不是也可以吗? 如果其中那些页面没有拍清楚,可以再要求重新拍照,然后再发过去。也许应该也可以吧。这应该跟电子版藏文效果差不多吧。只是随便一说,是否采纳看各位高见。
笨者之帚
发表于 2012-7-3 19:26
fstibet 发表于 2012-7-3 17:15 static/image/common/back.gif
请问师兄:藏文识别软件识别后是不是喜马拉雅藏文字体?谢谢!
应该不是,我装了,识别出来的结果是乱码,不知道需要什么字体,我用office2010打开是乱码。
我的电脑是Win7,自带喜马拉雅字体,还装了100多种藏文字体,3种梵文字体,但都无法搞定那个识别结果。
附件上传给大家看看
开始安装软件:
版权声明,似乎是清华大学和西北民族大学联合研制的
安装到最后要求重启机器:
运行界面:
原本的页面和识别的结果:
宝藏谷
发表于 2012-7-3 20:12
回楼上诸位:
1:老笨师兄勤奋有嘉,按道理藏文识别没有问题的,ORC技术已经很成熟,乱码的原因可能是tif文件本身精度不够,建议扫描成tif格式的文件专用。
你用的这个软件偶没见过,慢慢试。
2:喜马拉雅字体可以和班智达字体互相转换,又需要另外一个软件。且字数在一千字以内可以的,多了就乱码。
笨者之帚
发表于 2012-7-3 21:33
可否问一下,你用的软件是啥?哪儿开发的?
我扫瞄的文件,精度应该是足够的。
笨者之帚
发表于 2012-7-3 21:40
拌面 发表于 2012-7-3 17:55
建议请江波前辈用数码照相机拍下来,然后通过电子邮件发给楼主不是也可以吗? 如果其中那些页面没有拍清楚, ...
楼主是藏文盲,不会录入,必须要转成电子版的,才能作出对照版,数码相机拍下来是不成的。
拌面
发表于 2012-7-3 22:45
笨者之帚 发表于 2012-7-3 21:40 static/image/common/back.gif
楼主是藏文盲,不会录入,必须要转成电子版的,才能作出对照版,数码相机拍下来是不成的。
奥。不好意思。在下误解了。还以为只是核对藏汉翻译的是否准确。对藏文很陌生。不知道怎么处理。那。。。在下就没有招了。还需要其他高人出手了。
礼进
发表于 2012-7-3 23:05
笨者之帚 发表于 2012-7-3 14:57 static/image/common/back.gif
这书似乎有色拉寺现代排版印刷出来的,可以扫描或者以高拍仪录入。
藏文识别软件,这里倒是有一个:
既然有这个现代排版,那应该是有现成电子版的。电子版之间字体相互转换倒是很容易。有没有渠道可以和天竺色拉昧联系一下,要一下电子版?
北方將領
发表于 2012-7-3 23:23
這個色拉寺應該是拉薩色拉昧
不是天竺色拉昧
宝藏谷
发表于 2012-7-4 00:30
笨者之帚 发表于 2012-7-3 21:40:51 楼主是藏文盲,不会录入,
哈哈 俺也是藏文盲,藏文部分是请阿卡做的,俺提要求,所以略知一二。刚电话问了一下楼主师兄问题,答复如下:
1:用的这个软件是对的,(其他藏文识别还有清华紫光开发的,现在也停滞,)阿卡也在用。
2:师兄有木有用西北民族大学的同元藏文软件,有同元字库也行。
3:识别的藏文字体都可以,输出是同元的字体,转换喜马拉雅字体也一键搞定。
宝藏谷
发表于 2012-7-4 00:45
阿卡说宗大师的解释藏文电子版没有,给了原版,发出来供参考。
small2
发表于 2012-7-4 08:21
本帖最后由 small2 于 2012-7-4 08:22 编辑
有藏文扫描PDF的,可惜不是文本,是图片!464页,52MB。