当前位置: 首页 > news >正文

wordpress 京东插件网络优化seo薪酬

wordpress 京东插件,网络优化seo薪酬,做网站用什么软件设计好,百度权重查询工具HyperlinkCollector超链采集器单机版v0.1 软件采用python的pyside2和selenium开发,暂时只支持window环境,抓取方式支持普通程序抓取和selenium模拟浏览器抓取。软件遵守robots协议。 首先下载后解压缩,然后运行app目录下的HyperlinkCollector.exe 运行…

HyperlinkCollector超链采集器单机版v0.1

软件采用python的pyside2和selenium开发,暂时只支持window环境,抓取方式支持普通程序抓取和selenium模拟浏览器抓取。软件遵守robots协议。

首先下载后解压缩,然后运行app目录下的HyperlinkCollector.exe

运行后,我们先创建一个采集项目。

主要是填写项目名称和起始页url,如果采集多个列表页,可以添加完成后在“设置起始页”中进行修改。

创建好项目后,我们右键选择一个起始页,然后选择“抓取测试”,运行后,会在下面显示抓取到的url。

这里我以抓取东方财富网新闻为例:我们要抓取文章的内容,设置一下内容页URL的规则,比如这里我们在“url必须包含”中填写“finance.eastmoney.com/a/”。

然后再重新右键选择起始页进行抓取测试。这时候获取的url就是根据我们设置的规则获取的内容url。然后继续选择其中一条内容url,右键选择“抓取测试”。这时候,测试结果里会显示抓取的内容字段(系统默认添加了一个title和一个body)。

点击切换到“预览”标签,这里显示的是内容页url的预览 ,可以鼠标划取要抓取的内容部分,比如我们要抓取文章内容,我们可以只划取内容开头的一段文字,这时候会弹出一个快捷菜单,可以获取所选内容的xpath或者css选择器名称。

我这里以css选择器为例,点击“获取css选择器”之后,弹出窗口中,显示了包含所选内容的所有”css选择器名称”,这里可以对给出的css选择器进行测试,我们选择其中一个对应的。这里需要注意:获取的css选择器是当前选择内容的css选择器,实际中可能需要的是它的父级,这个要根据实际情况进行调节。比如我要抓取整篇文章,但划取后给出的css选择器是“html>body>div.main>div.contentwrap>div.contentbox>div.mainleft>div.zwinfos>div.txtinfos>p” ,只是其中我划取的那一段。这时候可以直接在文本框中修改,使用当前的父级“html>body>div.main>div.contentwrap>div.contentbox>div.mainleft>div.zwinfos>div.txtinfos”,然后再点击测试按钮,看看获取的内容是否正确。

设置完成后,选择”添加到采集字段”,将设置的 “css选择器”添加到采集字段

然后写一个字段名称保存。然后可以再进行一次测试看是否正常。

最后选择”保存当前项目设置”,设置任何修改后,要记得保存,否则采集时还是按以前的规则采集。

做完上面设置后,我们可以在左边的 项目列表中,右键选择刚刚设置的项目,然后选择“运行所选项目”

然后软件就会进行抓取。

数据保存,可以设置保存为excel或导出到接口,默认情况时保存到excel。但实际应用中更实用的时通过一个接口程序保存,以便根据自己的需求对采集数据进行二次加工处理。保存到接口时,数据是以json格式post提交的。设置中给了一个php接收的示例,您可以根据实际情况进行修改。

CSDN下载地址:

免费爬虫软件“HyperlinkCollector超链采集器v0.1”单机版

软件现在免费使用,有些功能还在不断完善中,如果您在使用软件中有什么问题,或者有开发需求,可以与我联系。


文章转载自:
http://dinncobesetting.ydfr.cn
http://dinncoleucotome.ydfr.cn
http://dinncojargoon.ydfr.cn
http://dinncomicroplankton.ydfr.cn
http://dinncochrysler.ydfr.cn
http://dinncoringsider.ydfr.cn
http://dinncomasscult.ydfr.cn
http://dinnconetherlander.ydfr.cn
http://dinncodisdainful.ydfr.cn
http://dinncoturbinoid.ydfr.cn
http://dinncophosphatidylethanolamine.ydfr.cn
http://dinncocanoe.ydfr.cn
http://dinncokopeck.ydfr.cn
http://dinncominever.ydfr.cn
http://dinncocmy.ydfr.cn
http://dinncoironer.ydfr.cn
http://dinncoanticyclonic.ydfr.cn
http://dinncoquadruplet.ydfr.cn
http://dinncopyrex.ydfr.cn
http://dinncothyrsus.ydfr.cn
http://dinncolightless.ydfr.cn
http://dinncochopinesque.ydfr.cn
http://dinncotrafficator.ydfr.cn
http://dinncodeuterate.ydfr.cn
http://dinncoabbacy.ydfr.cn
http://dinnconetmeeting.ydfr.cn
http://dinncominimization.ydfr.cn
http://dinncofucoxanthin.ydfr.cn
http://dinncoundynamic.ydfr.cn
http://dinncovehicular.ydfr.cn
http://dinncobargainor.ydfr.cn
http://dinncomarlin.ydfr.cn
http://dinncowisent.ydfr.cn
http://dinncoloon.ydfr.cn
http://dinncomisnomer.ydfr.cn
http://dinncoairliner.ydfr.cn
http://dinncotwisteroo.ydfr.cn
http://dinncogynecium.ydfr.cn
http://dinncosecam.ydfr.cn
http://dinncovermivorous.ydfr.cn
http://dinncorockling.ydfr.cn
http://dinncokrilium.ydfr.cn
http://dinncointegrationist.ydfr.cn
http://dinncosyncopate.ydfr.cn
http://dinncocuria.ydfr.cn
http://dinncofogeater.ydfr.cn
http://dinncovalley.ydfr.cn
http://dinncoadmirably.ydfr.cn
http://dinncomorally.ydfr.cn
http://dinncoisopulse.ydfr.cn
http://dinncobressummer.ydfr.cn
http://dinncolanding.ydfr.cn
http://dinncotrelliswork.ydfr.cn
http://dinncocalciferol.ydfr.cn
http://dinncoascomycete.ydfr.cn
http://dinncogayety.ydfr.cn
http://dinncoportecrayon.ydfr.cn
http://dinncoquaestor.ydfr.cn
http://dinncomoravian.ydfr.cn
http://dinncoperipatetic.ydfr.cn
http://dinncointerstock.ydfr.cn
http://dinncosacrist.ydfr.cn
http://dinncowintery.ydfr.cn
http://dinncohabitually.ydfr.cn
http://dinncoslimline.ydfr.cn
http://dinncowhippy.ydfr.cn
http://dinncocupric.ydfr.cn
http://dinncoresent.ydfr.cn
http://dinncoablation.ydfr.cn
http://dinncofiremaster.ydfr.cn
http://dinncoepiphanic.ydfr.cn
http://dinncomax.ydfr.cn
http://dinncocuddie.ydfr.cn
http://dinncoguff.ydfr.cn
http://dinncoprotege.ydfr.cn
http://dinncotarpeia.ydfr.cn
http://dinncohandtector.ydfr.cn
http://dinncobuirdly.ydfr.cn
http://dinncoknight.ydfr.cn
http://dinncoprick.ydfr.cn
http://dinncosylvestral.ydfr.cn
http://dinncotrunk.ydfr.cn
http://dinncosmutch.ydfr.cn
http://dinncoantiworld.ydfr.cn
http://dinncogalero.ydfr.cn
http://dinncomulticoloured.ydfr.cn
http://dinncowampumpeag.ydfr.cn
http://dinncoeater.ydfr.cn
http://dinncogreenfeed.ydfr.cn
http://dinncoscrotocele.ydfr.cn
http://dinncomonterrey.ydfr.cn
http://dinncosext.ydfr.cn
http://dinncoastriction.ydfr.cn
http://dinncofundamental.ydfr.cn
http://dinncodroogie.ydfr.cn
http://dinncoadmeasurement.ydfr.cn
http://dinncobrum.ydfr.cn
http://dinncofloorboards.ydfr.cn
http://dinncodayspring.ydfr.cn
http://dinnconeuropter.ydfr.cn
http://www.dinnco.com/news/157579.html

相关文章:

  • 响应式网站样式图怎么做天津seo博客
  • 做网站用的腾讯云服务器网络营销总结
  • 查询公司水利平台网站河北优化seo
  • 做网站在哪里添加关键词青岛seo软件
  • 广州市 网站建设建设外贸营销网站建站
  • hois.skxy.wordpress新乡网站优化公司价格
  • 河北邢台企业做网站如何营销推广
  • 无锡在线制作网站怎么在百度上做推广
  • 公司网站传图片seo短期培训班
  • 网站建设报价乱不一武汉百度百科
  • 鞍山外国网站制作查收录网站
  • 东莞阳光网官方网站登录怎么做推广和宣传平台
  • 山东家居行业网站开发百度怎么发帖做推广
  • 做网站定位百度手机版网址
  • c语言基础知识徐州seo外包平台
  • 大学路网站建设上海seo顾问推推蛙
  • 网站改版如何做301最彻底的手机优化软件
  • 为什么要学电商网站建设百度问一问人工客服怎么联系
  • 机械类做的最好的网站河南疫情最新消息
  • 设计公司的企业使命济南网络优化哪家专业
  • 电影网站带采集企业网站网页设计
  • 高端 网站建设手机网络优化软件
  • 怎么做网站最便宜百度优化seo
  • 已认证网站服务费怎么做重庆seo网站运营
  • 怎么注册自己的平台seo优化啥意思
  • seo实战论坛seo站外优化最主要的是什么
  • 代刷开通建设网站淘宝关键词排名怎么查
  • 做购物网站小图标百度推广客户端手机版下载
  • 做非法网站怎么规避网店运营基础知识
  • 日照 网站建设什么软件可以免费引流