豆包,图像OCR王者

昨天跟外甥交流的时候提到微软的markitdown,当时我说没有宣传的那么神,不止是由图片转换的PDF文件,就算是word文档,转换出来也是一言难尽。
今天还是想进一步测试一下,发现问题主要还是出在OCR上,于是就开始测试了下各OCR模型及相关服务,试来试去,还是百度家的paddle相对堪用,免费且额度足够,也不能要求太高。
当然,这要跟谁比,把同样13M的PDF文件扔给豆包,基本上是秒回,里面无论结构还是引用符号,基本算是完美了。把他扔给Codex和Hermes,他们也是自愧不如。
所以我一直认为,如果豆包能够解决文档本地化处理而非上传,每个月68块钱的收费我是毫无意见的。
只是,这豆包的交流水平,实在是……

Leave a Reply

您的邮箱地址不会被公开。 必填项已用 * 标注

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>