Python-POI-Spider
Python-POI-Spider copied to clipboard
Python兴趣点(POI)爬虫,通过百度地图API爬取指定城市兴趣点列表,包含其:坐标、名称、联系方式
Python-POI-Spider
Python兴趣点(POI)爬虫,通过百度地图API爬取指定城市兴趣点列表,包含其:坐标、名称、联系方式
特色
- 可指定城市
- 可查询轮流多个兴趣点
- 可获得详细JSON信息,包含经纬度、名称、联系号码等内容
- 自动翻页查询(百度接口每次最多只返回20条数据)
- 自动整理合并
- 自动生成POI结果目录
- 自动针对POI生成JSON文件
- 自动异常处理(并行达到上限重新查询)
使用步骤
- 进入百度地图开放平台,注册进入控制台,创建应用,基础服务选择地点检索
- 完成创建后,可以在应用管理查看是否有应用Key(AK)
- 打开POI_Spider.py并进入编辑
- 更改ak,估计在第39行上下,更改为你的应用的ak
- 运行程序
- 输入想要查询的城市
- 输入不在打印出来的列表里的兴趣
- 程序自动运行
- 项目目录查看结果
运行结果
运行后,会针对指定城市各个兴趣点进行爬取及整理,保存到JSON文件里
运行时可能会出现错误,显示到达日限额,这就是需要给百度充钱了~
下面就是会输出的内容(指定的城市是北京,兴趣点是地产)
[
{
"address": "北京市大兴区黄村西大街99号",
"area": "大兴区",
"city": "北京市",
"detail": 1,
"location": {
"lat": 39.737639,
"lng": 116.333112
},
"name": "龙熙房地产",
"province": "北京市",
"street_id": "49d959383f8ac442c61e5172",
"telephone": "(010)69258681",
"uid": "49d959383f8ac442c61e5172"
},
{
"address": "北京市海淀区安宁庄前街与清上园东路交叉路口西南侧(清上园)",
"area": "海淀区",
"city": "北京市",
"detail": 1,
"location": {
"lat": 40.045964,
"lng": 116.337601
},
"name": "麦田房产",
"province": "北京市",
"street_id": "7b17dcbee42d831776e5b6b4",
"uid": "7b17dcbee42d831776e5b6b4"
}
]
环境配置
-
系统
MacOS/Windows/Linux 都支持
-
环境
Python3.x都支持
-
网络
能进百度就行