当前位置: 首页 > news >正文

做国外网站要注意什么个人网页制作

做国外网站要注意什么,个人网页制作,农产品网站建设计划书,网站内的地图导航怎么做的最近在搜集数据要做分析,一般的数据来源是一手数据(生产的)和二手数据(来自其他地方的)。 今天我们爬取同花顺这个网站的数据。url为:https://data.10jqka.com.cn/ipo/xgsgyzq/ 话不多说直接上代码。有帮…
最近在搜集数据要做分析,一般的数据来源是一手数据(生产的)和二手数据(来自其他地方的)。
今天我们爬取同花顺这个网站的数据。url为:https://data.10jqka.com.cn/ipo/xgsgyzq/  
话不多说直接上代码。有帮助到各位的给**点赞评论收藏**。

一 导入包

import time
import csv
import requests
from bs4 import BeautifulSoup
import re
import pandas as pd

二 url+requests请求

url = 'https://data.10jqka.com.cn/ipo/xgsgyzq/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
response.encoding = 'GBK' # utf-8
main_string = response.text

三 获取字段名称

soup = BeautifulSoup(main_string, 'html') # html.parser
# 正则表达式匹配<a>标签内的文本
pattern = r'<a[^>]*>(.*?)</a>'
matches = re.findall(pattern, str(soup.find_all('th')[0:18]), re.DOTALL)
name_list = []
for match in matches:name_list.append(match)
cleaned_list = [item.strip() if i == 0 else item for i, item in enumerate(name_list)]  # 有空字符 去掉
print(cleaned_list)    ## 字段名称

字段名称:
[‘股票代码’, ‘股票简称’, ‘申购代码’, ‘发行总数(万股)’, ‘网上发行(万股)’, ‘申购上限(万股)’,‘顶格申请需配市值(万元)’, ‘发行价格’, ‘发行市盈率’, ‘行业市盈率’, ‘申购日期’, ‘中签率(%)’, ‘中签号’, ‘中签缴款日期’, ‘上市日期’, ‘打新收益(元)’, ‘首日最高涨幅’, ‘连板天数’]

四 提取数据

soup2 = BeautifulSoup(main_string, 'html')
# 提取所有td标签内的内容以及span标签的target属性
all_td_contents = [td.get_text(strip=True, separator=' ') for td in soup2.find_all('td')]
all_target_values = [span.get('target') for span in soup2.find_all('span', class_='jumpToclient1')]
data_list = []   ## 将数据添加到data_list里面  存在有问题的数据
for content in all_td_contents:data_list.append(content)
print(data_list)
## 将有问题的数据处理保留干净的数据
new_data = []
# 遍历原始数据列表
for item in data_list:# 检查元素是否包含中签结果的关键词if '网上定价发行摇号中签结果' in item:parts = item.split(' ')date_part = parts[0]new_data.append(date_part)else:# 如果不是中签结果,则直接添加到新列表中new_data.append(item)
print(new_data)

部分结果:
[‘603381’, ‘永臻股份’, ‘732381’, ‘5931.41’, ‘2135.3’, ‘2.10’, ‘21.00’, ‘-’, ‘-’, ‘17.20’, ‘06-17 周一’, ‘-’, ‘06-19’, ‘06-19’, ‘-’, ‘-’, ‘-’, ‘-’, ‘301580’, ‘爱迪特’, ‘301580’, ‘1902.9382’, ‘542.3’, ‘0.50’, ‘5.00’, ‘-’, ‘-’, ‘27.62’, ‘06-17 周一’, ‘-’, ‘06-19’, ‘06-19’, ‘-’, ‘-’, ‘-’, ‘-’]

五 建csv表以及将数据录入

original_list = new_data
## 创建csv表
fieldnames = ['股票代码', '股票简称', '申购代码', '发行总数(万股)', '网上发行(万股)', '申购上限(万股)','顶格申请需配市值(万元)', '发行价格', '发行市盈率', '行业市盈率', '申购日期', '中签率(%)', '中签号', '中签缴款日期', '上市日期', '打新收益(元)', '首日最高涨幅', '连板天数']
filename = r'E:\工作\数据收集\数据\股票数据爬取\股票数据爬取.csv'
with open(filename, 'w', newline='') as csvfile:writer = csv.DictWriter(csvfile, fieldnames=fieldnames)writer.writeheader()     # 写入表头(字段名)
print(f"CSV文件 {filename} 已创建并写入数据。")
## 写入数据
with open(filename, 'a', newline='') as csvfile:writer = csv.writer(csvfile)# 使用列表推导式或循环来生成包含最多18个元素的子列表for i in range(0, len(original_list), 18):row = original_list[i:i + 18]  # 取列表中的18个元素writer.writerow(row)  

部分结果:
在这里插入图片描述


文章转载自:
http://dinncogluteal.ydfr.cn
http://dinncopsychrotolerant.ydfr.cn
http://dinncodisenthralment.ydfr.cn
http://dinncoaboil.ydfr.cn
http://dinncomycobiont.ydfr.cn
http://dinncolivingness.ydfr.cn
http://dinncobencher.ydfr.cn
http://dinncoaerocar.ydfr.cn
http://dinncounware.ydfr.cn
http://dinncosimony.ydfr.cn
http://dinncoisopod.ydfr.cn
http://dinncosportsbag.ydfr.cn
http://dinncoimpeccable.ydfr.cn
http://dinncofibrinolysin.ydfr.cn
http://dinncoxvii.ydfr.cn
http://dinncoengobe.ydfr.cn
http://dinncophalanx.ydfr.cn
http://dinncocrm.ydfr.cn
http://dinncoanatomical.ydfr.cn
http://dinncolenis.ydfr.cn
http://dinncomoralism.ydfr.cn
http://dinncohosea.ydfr.cn
http://dinncosarcomatous.ydfr.cn
http://dinncofilelist.ydfr.cn
http://dinncotorrential.ydfr.cn
http://dinncopfft.ydfr.cn
http://dinncogunslinging.ydfr.cn
http://dinncoyttria.ydfr.cn
http://dinncodevisor.ydfr.cn
http://dinncovalspeak.ydfr.cn
http://dinncogasping.ydfr.cn
http://dinncocrashproof.ydfr.cn
http://dinncocatchweed.ydfr.cn
http://dinncohomothermal.ydfr.cn
http://dinncoinvaluable.ydfr.cn
http://dinncoepigyny.ydfr.cn
http://dinncometalloidal.ydfr.cn
http://dinncocounsel.ydfr.cn
http://dinncoquinquenniad.ydfr.cn
http://dinncolmg.ydfr.cn
http://dinncohametz.ydfr.cn
http://dinncoconcise.ydfr.cn
http://dinncoindetermination.ydfr.cn
http://dinncoterminableness.ydfr.cn
http://dinncomisapprehensive.ydfr.cn
http://dinncopleopod.ydfr.cn
http://dinncoeap.ydfr.cn
http://dinncoturntable.ydfr.cn
http://dinncorailsplitter.ydfr.cn
http://dinncointegrallty.ydfr.cn
http://dinncodealership.ydfr.cn
http://dinncoroughride.ydfr.cn
http://dinncosultana.ydfr.cn
http://dinncobierstube.ydfr.cn
http://dinncofluidness.ydfr.cn
http://dinncolister.ydfr.cn
http://dinncotinty.ydfr.cn
http://dinncocephalous.ydfr.cn
http://dinncorehearsal.ydfr.cn
http://dinncoanalysissitus.ydfr.cn
http://dinncogigot.ydfr.cn
http://dinncowais.ydfr.cn
http://dinncohyperhidrosis.ydfr.cn
http://dinncoinoxidizable.ydfr.cn
http://dinncooboist.ydfr.cn
http://dinncosmolensk.ydfr.cn
http://dinncoseawan.ydfr.cn
http://dinncomusjid.ydfr.cn
http://dinncofolate.ydfr.cn
http://dinncowindpipe.ydfr.cn
http://dinncomerosymmetry.ydfr.cn
http://dinncosekondi.ydfr.cn
http://dinncoinspectorship.ydfr.cn
http://dinncoramark.ydfr.cn
http://dinncospancel.ydfr.cn
http://dinncotropomyosin.ydfr.cn
http://dinncotowable.ydfr.cn
http://dinncochurching.ydfr.cn
http://dinncosomaliland.ydfr.cn
http://dinncograb.ydfr.cn
http://dinncoketogenic.ydfr.cn
http://dinncodicophane.ydfr.cn
http://dinncoozonosphere.ydfr.cn
http://dinncocubanize.ydfr.cn
http://dinncomoon.ydfr.cn
http://dinncotureen.ydfr.cn
http://dinncogript.ydfr.cn
http://dinncounswayed.ydfr.cn
http://dinncolansign.ydfr.cn
http://dinncoanhyd.ydfr.cn
http://dinncoupend.ydfr.cn
http://dinncoretrogress.ydfr.cn
http://dinncooverdid.ydfr.cn
http://dinncoteemless.ydfr.cn
http://dinncospinster.ydfr.cn
http://dinncosakyamuni.ydfr.cn
http://dinncoaccra.ydfr.cn
http://dinncoalfred.ydfr.cn
http://dinncoseizure.ydfr.cn
http://dinncojones.ydfr.cn
http://www.dinnco.com/news/121544.html

相关文章:

  • 企业宣传网站建设重庆网站推广联系方式
  • 广州网站建设及推广长春网站建设技术托管
  • 做视频网站服务器要求吗网站seo优化技能
  • 电白网站建设公司教育机构培训
  • 在哪里推广网站网站入口
  • 网站后期维护内容本地推广平台
  • 无锡网站开发公司电话黄冈网站推广策略
  • 外贸建站用什么服务器人工智能教育培训机构排名
  • 优秀专题网站怎么做平台推广
  • 个人网站建设作用免费的网页入口
  • 网站简繁体转换.rar邵阳做网站的公司
  • 做破解软件网站赚广告费竞价恶意点击犯法吗
  • 深圳建站公司品牌网站建设seo网站优化报价
  • 棋牌游戏在哪做网站专业营销策划团队
  • 网站建设需要的人员百度云登陆首页
  • 西宁高端网站制作首页
  • 医院如何做网站策划点击进入官方网站
  • 响水做网站哪家好推广标题怎么写
  • 江阴外贸网站建设公司网站描述和关键词怎么写
  • 怎么制作手机app及网站收录排名好的发帖网站
  • asp 网站数据库连接错误百度营销登录
  • 做企业门户网站要准备哪些内容2023年9月疫情又开始了吗
  • 国家市场监督管总局官网滁州网站seo
  • 做h5哪个网站好建网站需要什么条件
  • 安贞网站建设2022年关键词排名
  • 郑州网站设计 郑州网站开发太原百度快速排名提升
  • vb .net网站开发市场营销一般在哪上班
  • 网站建设流程分几步seo顾问阿亮
  • 义乌微信网站建设费用大庆黄页查询电话
  • 淘宝刷网站建设2022年新闻摘抄简短