当前位置: 首页 > news >正文

给企业做网站公司网站外链推广平台

给企业做网站公司,网站外链推广平台,微信昵称大全,厦门国外网站建设公司排名1. 分析爬取地址 打开某乎首页,点击热榜 这个就是我们需要爬取的地址,取到地址某乎/api/v3/feed/topstory/hot-lists/total?limit50&desktoptrue 定义好请求头,从Accept往下的请求头全部复制,转换成json headers {Accep…

1. 分析爬取地址

打开某乎首页,点击热榜
在这里插入图片描述
这个就是我们需要爬取的地址,取到地址某乎/api/v3/feed/topstory/hot-lists/total?limit=50&desktop=true
定义好请求头,从Accept往下的请求头全部复制,转换成json在这里插入图片描述

headers = {'Accept': '*/*','Accept-Encoding': 'gzip, deflate','Accept-Language': 'zh-CN,zh;q=0.9','Cookie': '你的请求头中的cookie','Sec-Ch-Ua': 'Not/A)Brand\';v=\'99\', \'Google Chrome\';v=\'115\', \'Chromium\';v=\'115','Sec-Ch-Ua-Mobile': '?0','Sec-Ch-Ua-Platform': 'Windows','Sec-Fetch-Dest': 'empty','Sec-Fetch-Mode': 'cors','Sec-Fetch-Site': 'same-origin','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36','X-Ab-Param': '','X-Ab-Pb': 'CgInBxIBAA==','X-Api-Version': '3.0.76','X-Requested-With': 'fetch','X-Zse-93': '101_3_3.0','X-Zse-96': '2.0_6hUp=vt8=9zOcwtPHcLjutT0sL2PhwOPys0v=fvQr7yneBCmMO2zkvXcYfoc5esu'
}

2. 分析请求结果

通过请求可以看出,hot-lists/total?limit=50&desktop=true请求后的返回参数直接是json格式,则不需要单独处理在这里插入图片描述
定义好需要抓取的参数按元素获取即可

    order_list = []  # 热榜排名title_list = []  # 热榜标题desc_list = []  # 热榜描述url_list = []  # 热榜链接hot_value_list = []  # 热度值answer_count_list = []  # 回答数data_list = json_data['data']order = 1  # 热榜排名初始值

GET请求接口

    response = requests.get(url=url, headers=headers)json_data = response.json()

循环数组json并赋值

        order_list.append(order)# 热榜标题title = data['target']['title_area']['text']print(order, '热榜标题:', title)title_list.append(title)desc_list.append(data['target']['excerpt_area']['text'])url_list.append(data['target']['link']['url'])hot_value_list.append(data['target']['metrics_area']['text'])answer_count_list.append(data['feed_specific']['answer_count'])order += 1```
将结果导出到csv,注意定义一下编码集为utf_8_sig
df = pd.DataFrame({'热榜排名': order_list,'热榜标题': title_list,'热榜链接': url_list,'热度值': hot_value_list,'回答数': answer_count_list,'热榜描述': desc_list,}
)
# 保存结果到csv文件
df.to_csv('知乎热榜.csv', index=False, encoding='utf_8_sig')
### 3. 结果验证
![在这里插入图片描述](https://img-blog.csdnimg.cn/eb0b9fdced6241e9bd7d6e941826b389.png)
###  注意:如果请求返回的json格式乱码,调整请求头Accept-Encoding,去掉br后即可
http://www.dinnco.com/news/29605.html

相关文章:

  • 聊城网站制作需要多少钱大数据分析网站
  • 苏州高端网站建设设计百度推广app下载
  • 建美食网站有哪些原因深圳seo关键词优化
  • 做vue用哪个网站网站收录提交入口大全
  • wordpress日主题二开美化版网站优化一年多少钱
  • 呼和浩特做网站的公司有哪些网络广告推广平台
  • 网络优化网站建设学习外链网站推荐
  • 用js做简单的网站页面上海短视频推广
  • 做网站需要什么条件西安做网站的公司
  • 广州市白云区注册公司代办seo是付费还是免费推广
  • 小米路由HD可以做网站吗国家卫生健康委
  • 制作app的教程seo策略是什么意思
  • 英文网站建设口碑好百度收录查询入口
  • 营销型企业网站分公司做网页要多少钱
  • dede手机网站制作网络营销好找工作吗
  • 艺术学院网站模板360网站推广怎么做
  • 昆明企业建站程序seo百度贴吧
  • 工程建设网最新信息网站俄罗斯搜索引擎yandex推广入口
  • 做服装搭配图的网站有哪些查网站流量查询工具
  • wordpress 多网站吗今日热搜前十名
  • 作风建设年网站网站优化培训学校
  • 佛山信息科技有限公司合肥网站优化排名推广
  • 怎么做文化传媒公司网站张掖seo
  • 东昌府企业做网站推广北京seo排名厂家
  • 网站建设公司后端招聘要求搜索引擎优化包括哪些
  • 西宁建设厅人事局网站仓山区seo引擎优化软件
  • 洪泽区做网站备案查询站长之家
  • 网页制作站点怎样上百度做广告
  • 网站么做淘宝客赚佣金seo网站优化系统
  • 政府网站建设必要性最新的新闻 最新消息