豆包，图像OCR王者 – 自己的博客

昨天跟外甥交流的时候提到微软的markitdown，当时我说没有宣传的那么神，不止是由图片转换的PDF文件，就算是word文档，转换出来也是一言难尽。
今天还是想进一步测试一下，发现问题主要还是出在OCR上，于是就开始测试了下各OCR模型及相关服务，试来试去，还是百度家的paddle相对堪用，免费且额度足够，也不能要求太高。
当然，这要跟谁比，把同样13M的PDF文件扔给豆包，基本上是秒回，里面无论结构还是引用符号，基本算是完美了。把他扔给Codex和Hermes，他们也是自愧不如。
所以我一直认为，如果豆包能够解决文档本地化处理而非上传，每个月68块钱的收费我是毫无意见的。
只是，这豆包的交流水平，实在是……

Leave a Reply Cancel Reply