热爱python,分享pytohn爬虫和web开发的知识
数据说明: 本次爬取美团共5个字段信息,包括: 商户名字, 评分,评论数量,地址,
电话
一、首页部分

Python学习交流群:392521592,每天分享更新。
我们可以看到有很多分类 我们今天主要抓取的是分类里面的美食这一项。然后我们可以看到在美食这个分类下面还有很多的小分类,我们今天为了简介 就不一一的去处理这些小分类,而是通过
点击美食来到这个页面

Python学习交流群:392521592,每天分享更新。
二、二级页面

Python学习交流群:392521592,每天分享更新。
在每一分类链接里面获取每一个商户的详情页的id
由于页面是ajax加载 但是在分类的页面源代码里面有一个所有商户的id 所以直接匹配id 然后拼接url
得到每个商户详情页的url

三、详情页面

Python学习交流群:392521592,每天分享更新。
因为这个数据是直接加载出来的,所以我们可以用beautifulsoup 来直接解析我们需要的数据

Python学习交流群:392521592,每天分享更新。
最后附上运行结果

Python学习交流群:392521592,每天分享更新。
如果大家有什么不理解的地方,可以在评论里面提出来,如果觉得还不错,请点赞或者分享给你的朋友,以鼓励我不断前行。
