工作后,聪明人见多了,比不了也就不吝使用笨办法,堆时间耗力气。
上个月使用rag管理PDF文档的挫败感,让我不得不重回老路子,高效批处理不行就改用手动。
AI对PDF文档识别率低,是因为它使用了平庸的识别路线,在精度和速度方面打了折扣。于是选用主打准确度的豆包客户端,将需要识别的PDF文件上传,然后指定需要读取的指标,要求其以json格式返回识别的数据。
结果非常满意的,麻烦的就是需要一个一个文件处理,两天下来,鼠标都把手指头皮蹭掉一块。
有多少人工智能,就有多少人工,这句话真是没错。
有结果就好,管他呢。