markov 发表于 2021-12-14 23:04

请问藏文拷贝出现乱码的问题,谢谢!

源文件是pdf,从pdf拷贝藏文到word,出现乱码
把pdf转成Word,再把藏文拷贝到另外一个word文件,还是出现乱码
这个问题怎么解决?
谢谢!

天涯一尘 发表于 2021-12-15 10:37

会不会是word没有相应的藏文字体?

华严九心 发表于 2021-12-15 11:48

本帖最后由 华严九心 于 2021-12-15 11:49 编辑

从pdf转,一般乱码居多,一般藏文不能转通过转pdf为word获得。唯一的办法,就是想办法获得藏文word源档。或者另行录入藏文。
似乎别无他法。

云水堂主 发表于 2021-12-15 13:02

PDF好像是以某种图片形式显示,提取藏文,不是以字符方式识别。目前就楼上的办法。PDF方便传递、打印(有些打印文具店没有藏文字体安装)

lalalala 发表于 2021-12-15 13:22

可以上传到google drive,再用google docs打开。这样可以使用他们自带的OCR功能,精确度要看图片质量,可以后期人工校对。很多pdf文件其实就是把一页一页的图片连在一起,如tbrc上的所有文件。这是我的常用工具之一,很有帮助。

markov 发表于 2021-12-15 16:47

含有藏文的word,本机带藏文字库,拿到别的机器上,如打印店一般都不能正常显示。
如果转成pdf,那么到哪里都能正常显示打印了。

但是如果再把pdf里的藏文拷贝出来,或者pdf再转回word,藏文就乱码。
今天试着用wps拷贝,转成的word的藏文,拷贝到wps里正常,但存成文件再打开又乱码。

BTW,pdf源文件不是图片,而是字符型的,可以直接拖蓝拷贝。
页: [1]
查看完整版本: 请问藏文拷贝出现乱码的问题,谢谢!