昨天未带手机出行早早回来,本来想看三星杯决赛,柯洁对申真谞的所谓“三千年决战”。结果没想到,执黑的申真谞21手就出现了滑鼠,下在了一路上。
高考历年录取数据已经整理入库,本来利用看比赛的时间,让机器跑一下采集一些周边数据。结果比赛早早结束,也就继续人工整理。
上次数据入库的时候,发现历年院校的专业不是很一致,搜索一下,原来教育部在2012年高校专业目录基础上,做了一些增补调整。
本想把数据导入数据库,发现网上基本都是清一色的原版内嵌表格的PDF文件。
自己动手,丰衣足食。还是准备使用百度的云平台接口的表格识别接口。但登录进去之后,发现半年没用,示例已经完全改变,弃用了原先的aip,直接使用token模式。
区块链时代,token才是王道啊。
好在有了前段时间的知识积累,转化也快,时间已晚,只是测试了单张页面识别,准确率很高。
躺下后在脑子里又理顺一下,早上返回之后重新整理,算是完美收工。