6

文章标签:爬虫

网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

刘旺學長 刘旺學長 5月,1 周前

【技术分享】Ubuntu下使用微信教程

使用Linux(ubuntu)系统开发的同学福利。

使用Linux(ubuntu)系统开发的同学福利。

刘旺學長 刘旺學長 5月,2 周前

关于Django的ORM查询缺点

在Django性能优化方面,数据库访问效率是重要的环节,使用ORM遇到的一个很常见的是 “N+1”问题,自然Django也不例外。

在Django性能优化方面,数据库访问效率是重要的环节,使用ORM遇到的一个很常见的是 “N+1”问题,自然Django也不例外

刘旺學長 刘旺學長 7月,2 周前

【2020年冠状病毒肺炎 - 武汉加油】预测湖北确诊患者人数以及非湖北新增人数(使用线性回归模型)

这场突然爆发的新型冠状病毒肺炎是如何发生和传播的?死亡率和传播速度有多高?爆发接近两周将剧增蔓延? 这一场战疫已经持续了一个春节假期,你知道关于它传播速度的多少?

这场突然爆发的新型冠状病毒肺炎是如何发生和传播的?死亡率和传播速度有多高?爆发接近两周将剧增蔓延? 这一场战疫已经持续了

刘旺學長 刘旺學長 8月,2 周前

【数据分析】用python快速获取微博用户数据,图片,视频

连续爬取一个或多个新浪微博用户(如Dear-迪丽热巴、郭碧婷)的数据,并将结果信息写入文件。写入信息几乎包括了用户微博的所有数据,主要有用户信息和微博信息两大类,前者包含用户昵称、关注数、粉丝数、微博数等等;后者包含微博正文、发布时间、发布工具、评论数等等,因

连续爬取一个或多个新浪微博用户(如Dear-迪丽热巴、郭碧婷)的数据,并将结果信息写入文件。写入信息几乎包括了用户微博的所有数据

刘旺學長 刘旺學長 1 年,8月前

【urllib】url编码问题简述

urllib库是python提供的一种用于操作URL的模块, python2中是urllib和urllib2两个库文件,python3中整合在了urllib一个库中。 即在Python中导入和调用方法也发生了改变。

urllib库是python提供的一种用于操作URL的模块, python2中是urllib和urllib2两个库文件,pyt

刘旺學長 刘旺學長 2 年,5月前

【python】有意思的python小项目GitHub地址汇总

有意思的python小项目GitHub地址汇总

有意思的python小项目GitHub地址汇总

Python 3025 0