百度文字识别性能不错

昨晚又测试了一下百度文字识别,对竖版繁体古籍的识别情况。民国时期的出版物,一般在文字中人名、著作名等旁边有竖线,或者波浪线,以进行标识。
识别结果令人满意,那些额外的标识线并没有产生影响。
原先百度的文字识别功能中,普通版与高清版的免费使用额度不同,高清版要少于普通版。现在普通版的额度降低到与高清版持平,但从二者识别结果看,高清版不止是提高了识别精度,还能根据文档的排版情况,自动区分是竖版还是横版,左先还是右先。由此看高清版是全方位的升级版,降低至普通版免费额度后,估计将会完全替代普通版。
而下一步的升级,应该是根据上下文的文字调整了,现在看,还没有这个功能。

Leave a Reply

您的邮箱地址不会被公开。 必填项已用 * 标注

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>