请问藏文拷贝出现乱码的问题,谢谢!
源文件是pdf,从pdf拷贝藏文到word,出现乱码把pdf转成Word,再把藏文拷贝到另外一个word文件,还是出现乱码
这个问题怎么解决?
谢谢!
会不会是word没有相应的藏文字体? 本帖最后由 华严九心 于 2021-12-15 11:49 编辑
从pdf转,一般乱码居多,一般藏文不能转通过转pdf为word获得。唯一的办法,就是想办法获得藏文word源档。或者另行录入藏文。
似乎别无他法。
PDF好像是以某种图片形式显示,提取藏文,不是以字符方式识别。目前就楼上的办法。PDF方便传递、打印(有些打印文具店没有藏文字体安装) 可以上传到google drive,再用google docs打开。这样可以使用他们自带的OCR功能,精确度要看图片质量,可以后期人工校对。很多pdf文件其实就是把一页一页的图片连在一起,如tbrc上的所有文件。这是我的常用工具之一,很有帮助。 含有藏文的word,本机带藏文字库,拿到别的机器上,如打印店一般都不能正常显示。
如果转成pdf,那么到哪里都能正常显示打印了。
但是如果再把pdf里的藏文拷贝出来,或者pdf再转回word,藏文就乱码。
今天试着用wps拷贝,转成的word的藏文,拷贝到wps里正常,但存成文件再打开又乱码。
BTW,pdf源文件不是图片,而是字符型的,可以直接拖蓝拷贝。
页:
[1]