设防的官网

山东省考试院在去年底,就发布了今天普通高校拟在山东招生专业选考科目的要求。但因为其中这个“拟”字,所以一直还在等待正式的发文。
不觉已经五月份了,看了一下现在各大网站,还有去年的公告,正式的发文估计是等不到了。所以今天还是下手准备材料了,时间其实挺紧的了。
等打开这个网页,发现居然还有技术含量,无法复制、无法下载。一个公开的网站,公开的数据,有什么可以费尽心思做防备工作的。
在网上搜了一下,有专门写的爬虫程序,试用了一下效果不好,主要问题出现在ssl方面。解决了ssl问题,又出现了其他莫名其妙的问题。
索性自己重头开始,先通过手段下载了某个网页,使用beautifulsoup4进行网页解析。期间遇到不少问题,好在还有前面的经验做基础,算是成功下载入库。
现在看来,后面很多问题还是指望不上官方的,需要自己动手了。

Leave a Reply

您的电子邮箱地址不会被公开。 必填项已用 * 标注

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>