网络爬虫中的模拟登陆获取数据(实例教学)
3,137 阅读
原文地址:http://blog.csdn.net/qy20115549/article/details/52249232
目录
#模拟登陆的原因
很多网站,我们是无法直接获得服务器返回的数据,需要输入用户名及密码才能看到数据。如我们登陆人人网时,网站网址http://www.renren.com/。如图所示,看到的是一个登陆的界面,必须输入用户名及密码才能看到返回的数据。
登陆后,看到的数据,便可以通过爬虫将网站的html,或者json数据抓下来,解析。
#实战(demo)
