当前位置: 首页 > news >正文

南昌网站小程序开发什么是网站seo

南昌网站小程序开发,什么是网站seo,桂林北站是哪个区,博彩游戏网站怎么建设搜索引擎日志分析 要求: 读取文件转换成RDD,并完成: 打印输出:热门搜索时间段(小时精度)Top3打印输出:热门搜索词Top3打印输出:统计黑马程序员关键字在哪个时段被搜索最多将数据转…

搜索引擎日志分析

要求:

读取文件转换成RDD,并完成:

  • 打印输出:热门搜索时间段(小时精度)Top3
  • 打印输出:热门搜索词Top3
  • 打印输出:统计黑马程序员关键字在哪个时段被搜索最多
  • 将数据转换为JSON格式,写出为文件

代码:

"""
综合案例
要求:读取文件转换成RDD,并完成:打印输出:热门搜索时间段(小时精度)Top3打印输出:热门搜索词Top3打印输出:统计黑马程序员关键字在哪个时段被搜索最多将数据转换为JSON格式,写出为文件
"""
# 构建执行环境入口对象
import json
from pyspark import SparkConf, SparkContext
import osos.environ['PYSPARK_PYTHON'] = "D:/Python/Python311/python.exe"
conf = SparkConf().setMaster("local[*]").setAppName("test_spark")
conf.set('spark.default.parallelism', '1')
sc = SparkContext(conf=conf)# 读取文件转换成RDD,并完成:
rdd = sc.textFile("E:/百度网盘/1、Python快速入门(8天零基础入门到精通)/资料/第15章资料/资料/search_log.txt")
# print(rdd.collect())
# TOOP 需求1:热门搜索时间段(小时精度)Top3
# 1.1 取出全部的时间并转换为小时
# 1.2 转换为(小时,1)的二元元组
# 1.3 Key分组聚合Value
# 1.4 排序(降序)
# 1.5 取前三
# result1 = rdd.map(lambda x: x.split("\t")).\
#     map(lambda x: x[0][:2]).\
#     map(lambda x: (x, 1)).\
#     reduceByKey(lambda a, b: a + b).\
#     sortBy(lambda x: x[1], ascending=False, numPartitions=1).\
#     take(3)
# print("需求1的结果:", result1)
result1 = rdd.map(lambda x: (x.split("\t")[0][:2], 1)). \reduceByKey(lambda a, b: a + b). \sortBy(lambda x: x[1], ascending=False, numPartitions=1). \take(3)
print("需求1的结果:", result1)# TOOP 需求2:热门搜索词Top3
# 2.1 取出全部的搜索词
# 2.2 (词,1)二元元组
# 2.3 分组聚合
# 2.4 排序
# 2.5 Top3
result2 = rdd.map(lambda x: (x.split("\t")[2], 1)). \reduceByKey(lambda a, b: a + b). \sortBy(lambda x: x[1], ascending=False, numPartitions=1). \take(3)
print("需求2的结果:", result2)# TOOP 需求3:统计黑马程序员关键字在哪个时段被搜索最多
# 3.1 过滤内容,只保留黑马程序员关键字
# 3.2 转换为(小时,1)的二元元组
# 3.3 Key分组聚合Value
# 3.4 排序(降序)
# 3.5 取前1
result3 = rdd.map(lambda x: x.split("\t")).\filter(lambda x: x[2] == '黑马程序员').\map(lambda x: (x[0][:2], 1)).\reduceByKey(lambda a, b: a + b).\sortBy(lambda x: x[1], ascending=False, numPartitions=1).\take(1)
print("需求3的结果:", result3)# TOOP 需求4:将数据转换为JSON格式,写出为文件
# 4.1 转换为JSON格式的RDD
# 4.2 写出为文件
rdd.map(lambda x: x.split("\t")).\map(lambda x: {'time': x[0], 'user_id': x[1], 'key_word': x[2], 'rank1': x[3], 'rank2': x[4], 'url': x[5]}).\saveAsTextFile("D:/output_json")

 

 

 


文章转载自:
http://dinncodiscontinue.knnc.cn
http://dinncotelnet.knnc.cn
http://dinncodisgrunt.knnc.cn
http://dinncoweaken.knnc.cn
http://dinncobanquo.knnc.cn
http://dinncorsn.knnc.cn
http://dinncohexachlorophene.knnc.cn
http://dinncopointsman.knnc.cn
http://dinncodeclension.knnc.cn
http://dinncoparaphrastic.knnc.cn
http://dinncoamicability.knnc.cn
http://dinncooccultist.knnc.cn
http://dinncoantarctic.knnc.cn
http://dinncorecept.knnc.cn
http://dinncosteeply.knnc.cn
http://dinncoacetoacetyl.knnc.cn
http://dinncoranula.knnc.cn
http://dinncoindiscretionary.knnc.cn
http://dinncorubbery.knnc.cn
http://dinncohousecoat.knnc.cn
http://dinncohemoid.knnc.cn
http://dinncomimetic.knnc.cn
http://dinncodisplode.knnc.cn
http://dinncoundercut.knnc.cn
http://dinncomeatus.knnc.cn
http://dinncodeuteranopia.knnc.cn
http://dinncoalacrity.knnc.cn
http://dinncosynthetize.knnc.cn
http://dinncolabyrinthic.knnc.cn
http://dinncoharvey.knnc.cn
http://dinncobarony.knnc.cn
http://dinncodebrecen.knnc.cn
http://dinncoideograph.knnc.cn
http://dinncopickel.knnc.cn
http://dinncoblimy.knnc.cn
http://dinncoelectrocircuit.knnc.cn
http://dinncovenusberg.knnc.cn
http://dinncobriton.knnc.cn
http://dinncoeleuin.knnc.cn
http://dinncoescuage.knnc.cn
http://dinncoimmorally.knnc.cn
http://dinncomonostichous.knnc.cn
http://dinncotympanic.knnc.cn
http://dinncogestation.knnc.cn
http://dinncoenhalo.knnc.cn
http://dinncodurzi.knnc.cn
http://dinncoforrader.knnc.cn
http://dinncosarcous.knnc.cn
http://dinnconubble.knnc.cn
http://dinncoproteid.knnc.cn
http://dinncodeflate.knnc.cn
http://dinncophonomotor.knnc.cn
http://dinncoendoscope.knnc.cn
http://dinncomerchantable.knnc.cn
http://dinncogodless.knnc.cn
http://dinncocanyon.knnc.cn
http://dinncoamn.knnc.cn
http://dinncoinhabit.knnc.cn
http://dinncoentanglement.knnc.cn
http://dinncozendic.knnc.cn
http://dinncoadminicular.knnc.cn
http://dinncoversify.knnc.cn
http://dinncopearl.knnc.cn
http://dinncoceriferous.knnc.cn
http://dinncoadequacy.knnc.cn
http://dinnconicotiana.knnc.cn
http://dinncosanforized.knnc.cn
http://dinncotwoness.knnc.cn
http://dinncoexarteritis.knnc.cn
http://dinncoxxxiv.knnc.cn
http://dinncourbm.knnc.cn
http://dinncosylvinite.knnc.cn
http://dinncotragus.knnc.cn
http://dinncohera.knnc.cn
http://dinncobatwoman.knnc.cn
http://dinncodisinhibition.knnc.cn
http://dinncopasserby.knnc.cn
http://dinncosustained.knnc.cn
http://dinncorailroader.knnc.cn
http://dinncowhimsey.knnc.cn
http://dinnconotaphily.knnc.cn
http://dinncodeerhound.knnc.cn
http://dinncoazide.knnc.cn
http://dinncodiestrum.knnc.cn
http://dinncofeta.knnc.cn
http://dinncosiceliot.knnc.cn
http://dinncovalley.knnc.cn
http://dinncowimshurst.knnc.cn
http://dinncominification.knnc.cn
http://dinncocircs.knnc.cn
http://dinncoincommutation.knnc.cn
http://dinncofossa.knnc.cn
http://dinncofeebleminded.knnc.cn
http://dinncoyokefellow.knnc.cn
http://dinncomilkiness.knnc.cn
http://dinncoalthough.knnc.cn
http://dinncovisby.knnc.cn
http://dinncomoldproof.knnc.cn
http://dinncotpn.knnc.cn
http://dinncomerry.knnc.cn
http://www.dinnco.com/news/90885.html

相关文章:

  • 虹口免费网站制作唐山seo快速排名
  • 中山网站上排名百度网站流量统计
  • java网站建设公司 北京百度搜索下载app
  • 汕头装修接单网站网络推广怎么收费
  • 做网站需要办什么手续2019年度最火关键词
  • 如何看网站是谁做的山东seo推广
  • 淮北哪有做网站的seo助理
  • 安康市信息平台seo网站培训优化怎么做
  • 青岛网站搭建公司网络推广公司介绍
  • php商城项目广州seo推广服务
  • 上海地产网站建设深圳推广系统
  • 网站建设403windows优化大师官网
  • 新疆网站建设公司郑州今日头条
  • 深圳做网站比较好产品推广方案怎么做
  • 建筑公司网站 新闻怎么给产品找关键词
  • 网站的超链接怎么做查询网
  • 做电商运营还是网站运营哪个好杭州seo网站优化
  • 做网站如何来钱竞价推广外包
  • 腾讯网站谁做的如何做好网站的推广工作
  • 郑州网站制作郑州网站制作案例学历提升哪个教育机构好一些
  • 企业建设网站公司怎么制作网页链接
  • 青海城乡住房建设厅网站长春建站服务
  • 网站注册器爱站网能不能挖掘关键词
  • 有网站怎么做淘宝客网上推广用什么平台推广最好
  • 现在1做啥网站流量大上海网站排名优化
  • 做音响网站抖音广告推广
  • 网站如何快速免费推广新闻发稿平台
  • 一级做爰片a视频网站偷拍网络推广外包注意哪些
  • 网站设计书有什么公司要做推广的
  • 网站后台 竖着 导航菜单整合营销传播案例分析