当前位置: 首页 > news >正文

介绍自己的家乡遵义网站建设太原网络推广价格

介绍自己的家乡遵义网站建设,太原网络推广价格,个人博客网站取名,南昌网站seo 优帮云概览 技术方案: 日志采集服务:通过利用Flume-ng对业务平台中用户对于电影的一次评分行为进行采集,实时发送到Kafka集群。消息缓冲服务:项目采用Kafka作为流式数据的缓存组件,接受来自Flume的数据采集请求。并将数据推…

概览

技术方案:

  • 日志采集服务:通过利用Flume-ng对业务平台中用户对于电影的一次评分行为进行采集,实时发送到Kafka集群。
  • 消息缓冲服务:项目采用Kafka作为流式数据的缓存组件,接受来自Flume的数据采集请求。并将数据推送到项目的实时推荐系统部分。
  • 实时推荐服务:项目采用Spark Streaming作为实时推荐系统,通过接收Kafka中缓存的数据,通过设计的推荐算法实现对实时推荐的数据处理,并将结构合并更新到MongoDB数据库。

1. 实现思路

我们应该如何实现?

  1. 首先应该redis安装,这里存储用户的第K次评分(用户评分存入redis中)
  2. 安装zookeeper,安装kafka,都是standlone模式
  3. 测试Kafka与Spark Streaming 联调。Kafka生产一条数据,Spark Streaming 可以消费成功,并根据redis中的数据和MongoDB数据进行推荐,存入MongoDB中
  4. 在业务系统写埋点信息,测试时写入本地文件,之后再远程测试写入云服务器log文件中
  5. flume配置文件书写,kafka创建两个topic,对整个过程进行测试

2 环境准备

1.1 redis 安装

  • redis安装redis安装
  • 密码:123456
  • 存入redis一些数据 lpush uid:1 mid:score
  • redis 教程:教程

1.2 zookeeper单机版安装

  • zookeeper安装:zookeeper安装
  • 版本:3.7.1
  • 遇到的坑:8080端口连接占用,我们需要在zoo.cpg文件中加上
    admin.serverPort=8001重新启动即可。

1.3 kafka单机安装

  • kafka安装:官网下载地址
  • 安装使用的为:127.0.0.1
  • 启动kafka:kafka教程
bin/kafka-server-start.sh config/server.properties
  • 创建一个topic
bin/kafka-topics.sh --create --zookeeper 127.0.0.1:2181 --replication-factor 1 --partitions 1 --topic recommender
  • 生产一个消息
bin/kafka-console-producer.sh --broker-list 127.0.0.1:9092 --topic recommender
  • 消费一个消息
bin/kafka-console-consumer.sh --bootstrap-server 127.0.0.1:9092 --topic recommender --from-beginning

3 测试kafka与spark streaming联调

  • kafka版本:2.2.0
  • spark版本:2.3.0
  • 因此使用spark-streaming-kafka-0-10

image.png

  1. 启动kafka,生产一条信息
  2. 书写程序
// 定义kafka连接参数val kafkaParam = Map("bootstrap.servers" -> "服务器IP:9092","key.deserializer" -> classOf[StringDeserializer],"value.deserializer" -> classOf[StringDeserializer],"group.id" -> "recommender","auto.offset.reset" -> "latest")// 通过kafka创建一个DStreamval kafkaStream = KafkaUtils.createDirectStream[String, String]( ssc,LocationStrategies.PreferConsistent,ConsumerStrategies.Subscribe[String, String]( Array(config("kafka.topic")), kafkaParam ))// 把原始数据UID|MID|SCORE|TIMESTAMP 转换成评分流// 1|31|4.5|val ratingStream = kafkaStream.map{msg =>val attr = msg.value().split("\\|")( attr(0).toInt, attr(1).toInt, attr(2).toDouble, attr(3).toInt )}
  1. 若是kafka报错,如果你同样也是云服务器,请注意kafka的配置信息(很重要!)

(1)解决方法:修改kafka配置文件,设置为设置listeners为内网ip,设置外网ip

  • 解决方案修改内网ip

(2)重新启动,成功

  • 内网外网分流:内网外网分流
  • kafka入门教程:入门教程
  1. redis报错:开启保护模式了,需要修改conf文件

效果

在kafka生产一个数据,可以在MongoDB中得到推荐的电影结果

4 后端埋点

前端进行评分后,触发click事件,后端进行测试埋点,利用log4j写入本地文件中。

4.1 本地测试

  • log4j配置文件
log4j.rootLogger=INFO, file, stdout# write to stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%50t]  %-80c(line:%5L)  :  %m%n# write to file
log4j.appender.file=org.apache.log4j.RollingFileAppender
log4j.appender.FILE.Append=true
log4j.appender.FILE.Threshold=INFO
log4j.appender.file.File=F:/demoparent/business/src/main/log/agent.txt
log4j.appender.file.MaxFileSize=1024KB
log4j.appender.file.MaxBackupIndex=1
log4j.appender.file.layout=org.apache.log4j.PatternLayout
log4j.appender.file.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%50t]  %-80c(line:%6L)  :  %m%n
  • 埋点实现
//埋点日志
import org.apache.log4j.Logger;// 关键代码
Logger log = Logger.getLogger(MovieController.class.getName());
log.info(MOVIE_RATING_PREFIX + ":" + uid +"|"+ mid +"|"+ score +"|"+ System.currentTimeMillis()/1000)

4.2 写入远程测试

  1. Linux安装syslog服务,进行测试
  2. 主机log4j配置文件设置服务器ip
  • log4j配置:写入远程服务器
log4j.appender.syslog=org.apache.log4j.net.SyslogAppender
log4j.appender.syslog.SyslogHost= 服务器IP
log4j.appender.syslog.Threshold=INFO
log4j.appender.syslog.layout=org.apache.log4j.PatternLayout
log4j.appender.syslog.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%20t]  %-130c:(line:%4L)  :   %m%n

5 flume配置

  1. flume对接kafka:flume对接文件
  2. flume设置source和sink,source为文件地址,sink为kafka的log
# log-kafka.properties
agent.sources = exectail
agent.channels = memoryChannel 
agent.sinks = kafkasink 
agent.sources.exectail.type = exec 
agent.sources.exectail.command = tail -f /project/logs/agent.log agent.sources.exectail.interceptors=i1 agent.sources.exectail.interceptors.i1.type=regex_filter agent.sources.exectail.interceptors.i1.regex=.+MOVIE_RATING_PREFIX.+ agent.sources.exectail.channels = memoryChannelagent.sinks.kafkasink.type = org.apache.flume.sink.kafka.KafkaSink agent.sinks.kafkasink.kafka.topic = log agent.sinks.kafkasink.kafka.bootstrap.servers = 服务器地址:9092 agent.sinks.kafkasink.kafka.producer.acks = 1 agent.sinks.kafkasink.kafka.flumeBatchSize = 20 agent.sinks.kafkasink.channel = memoryChannel
agent.channels.memoryChannel.type = memory
agent.channels.memoryChannel.capacity = 10000

6 实时推荐

ratingStream.foreachRDD{rdds => rdds.foreach{case (uid, mid, score, timestamp) => {println("rating data coming! >>>>>>>>>>>>>>>>")println(uid+",mid:"+mid)// 1. 从redis里获取当前用户最近的K次评分,保存成Array[(mid, score)]val userRecentlyRatings = getUserRecentlyRating( MAX_USER_RATINGS_NUM, uid, ConnHelper.jedis )println("用户最近的K次评分:"+userRecentlyRatings)// 2. 从相似度矩阵中取出当前电影最相似的N个电影,作为备选列表,Array[mid]val candidateMovies = getTopSimMovies( MAX_SIM_MOVIES_NUM, mid, uid, simMovieMatrixBroadCast.value )println("电影最相似的N个电影:"+candidateMovies)// 3. 对每个备选电影,计算推荐优先级,得到当前用户的实时推荐列表,Array[(mid, score)]val streamRecs = computeMovieScores( candidateMovies, userRecentlyRatings, simMovieMatrixBroadCast.value )println("当前用户的实时推荐列表:"+streamRecs)// 4. 把推荐数据保存到mongodbsaveDataToMongoDB( uid, streamRecs )}}
}
def computeMovieScores(candidateMovies: Array[Int],userRecentlyRatings: Array[(Int, Double)],simMovies: scala.collection.Map[Int, scala.collection.immutable.Map[Int, Double]]): Array[(Int, Double)] ={// 定义一个ArrayBuffer,用于保存每一个备选电影的基础得分val scores = scala.collection.mutable.ArrayBuffer[(Int, Double)]()// 定义一个HashMap,保存每一个备选电影的增强减弱因子val increMap = scala.collection.mutable.HashMap[Int, Int]()val decreMap = scala.collection.mutable.HashMap[Int, Int]()for( candidateMovie <- candidateMovies; userRecentlyRating <- userRecentlyRatings){// 拿到备选电影和最近评分电影的相似度val simScore = getMoviesSimScore( candidateMovie, userRecentlyRating._1, simMovies )if(simScore > 0.7){// 计算备选电影的基础推荐得分scores += ( (candidateMovie, simScore * userRecentlyRating._2) )if( userRecentlyRating._2 > 3 ){increMap(candidateMovie) = increMap.getOrDefault(candidateMovie, 0) + 1} else{decreMap(candidateMovie) = decreMap.getOrDefault(candidateMovie, 0) + 1}}}// 根据备选电影的mid做groupby,根据公式去求最后的推荐评分scores.groupBy(_._1).map{// groupBy之后得到的数据 Map( mid -> ArrayBuffer[(mid, score)] )case (mid, scoreList) =>( mid, scoreList.map(_._2).sum / scoreList.length + log(increMap.getOrDefault(mid, 1)) - log(decreMap.getOrDefault(mid, 1)) )}.toArray.sortWith(_._2>_._2)
}

7 启动顺序

  1. 启动hadoop、spark的容器
  • cd /docker
  • docker-compose up -d
  • docker-compose ps
  1. 启动mongodb和redis服务
  • netstat -lanp | grep "27017"
  • bin/redis-server etc/redis.conf
  1. 启动zookeeper、kafka服务
  • ./zkServer.sh start
  • bin/kafka-server-start.sh config/server.properties
  1. 启动flume服务
  • bin/flume-ng agent -c ./conf/ -f ./conf/log-kafka.properties -n agent

实现效果

前端评分成功后写入日志文件,flume对接log日志文件无问题,kafka对接flume无问题,spark streaming处理收到的一条数据,进行推荐,存入MongoDB中。

image.png

总结

由于时间匆忙,写的有些匆忙,如果有需要前端设计代码和后端的代码可以评论我,我整理整理发到github上。

前端设计部分没有时间去详细做,后续再对前端页面进行美化。本科当时整合了一个管理系统,现在也没有时间做,总之,一周多时间把当时的系统快速复现了下,算是一个复习。

在进行开发时,遇到许多问题,版本问题、服务器内网外网问题、docker容器相关问题、协同过滤算法设计问题,但帮着自己复习了下Vue和SpringBoot。

遇到问题时

  • 遇到问题不应该盲目解决,应该静下心看看报错原因,想想为何报错
  • 版本尤其重要,因此最好在一个project的pom设定版本
  • 使用服务器搭建docker-compose,利用该方法来搭建集群,快速简单,但涉及的端口转发等一些网络知识需要耐下心来看
  • Vue-Cli+Element-ui搭配起来开发简单
  • 写程序时,我们应该提前约定好接口,否则后续会很混乱…

后续

  • 后续将优化下前端页面,设计更多功能
  • 改进推荐算法
  • 增加冷启动方案

文章转载自:
http://dinncoirgb.tpps.cn
http://dinncostramonium.tpps.cn
http://dinncogustaf.tpps.cn
http://dinncodyn.tpps.cn
http://dinncoperineuritis.tpps.cn
http://dinnconautch.tpps.cn
http://dinncountraceable.tpps.cn
http://dinncoloxodromy.tpps.cn
http://dinncorimland.tpps.cn
http://dinncointravital.tpps.cn
http://dinncocrustacean.tpps.cn
http://dinncosubsidy.tpps.cn
http://dinncobitewing.tpps.cn
http://dinncopsychotherapist.tpps.cn
http://dinncohydrangea.tpps.cn
http://dinncodownstream.tpps.cn
http://dinncoagreeably.tpps.cn
http://dinncohogshead.tpps.cn
http://dinncoendsville.tpps.cn
http://dinncomicroenvironment.tpps.cn
http://dinnconapoleonize.tpps.cn
http://dinncomzungu.tpps.cn
http://dinncowaterlocked.tpps.cn
http://dinncopsia.tpps.cn
http://dinncoavirulent.tpps.cn
http://dinncotippler.tpps.cn
http://dinncochastely.tpps.cn
http://dinncopeccary.tpps.cn
http://dinncosaturnic.tpps.cn
http://dinncoturkomen.tpps.cn
http://dinncomorna.tpps.cn
http://dinncostrangulation.tpps.cn
http://dinncooutworker.tpps.cn
http://dinncofoxpro.tpps.cn
http://dinncotetrazolium.tpps.cn
http://dinncounmoving.tpps.cn
http://dinncomonosemy.tpps.cn
http://dinncovoyeuristic.tpps.cn
http://dinncokirghiz.tpps.cn
http://dinncostoolball.tpps.cn
http://dinncoendophagous.tpps.cn
http://dinncostreamliner.tpps.cn
http://dinncoalkyne.tpps.cn
http://dinncotripy.tpps.cn
http://dinncoinhabitativeness.tpps.cn
http://dinncobreed.tpps.cn
http://dinncopeasen.tpps.cn
http://dinncoalbigenses.tpps.cn
http://dinncodeviously.tpps.cn
http://dinncoscatback.tpps.cn
http://dinncogeld.tpps.cn
http://dinncoreproachless.tpps.cn
http://dinncooceanus.tpps.cn
http://dinncolushly.tpps.cn
http://dinncomurkiness.tpps.cn
http://dinncotransect.tpps.cn
http://dinncocone.tpps.cn
http://dinncobolsheviki.tpps.cn
http://dinncolegitimacy.tpps.cn
http://dinncopseudovirion.tpps.cn
http://dinncoobumbrant.tpps.cn
http://dinncohegemony.tpps.cn
http://dinncoloyal.tpps.cn
http://dinncomartyrolatry.tpps.cn
http://dinncostave.tpps.cn
http://dinncotestae.tpps.cn
http://dinncopicaro.tpps.cn
http://dinncoamperage.tpps.cn
http://dinncofleurette.tpps.cn
http://dinncodivi.tpps.cn
http://dinncoparacharmonium.tpps.cn
http://dinncothiofuran.tpps.cn
http://dinncobriarroot.tpps.cn
http://dinncobandy.tpps.cn
http://dinncoassimilability.tpps.cn
http://dinncoratracer.tpps.cn
http://dinncocernuous.tpps.cn
http://dinncosprent.tpps.cn
http://dinncointraperitoneal.tpps.cn
http://dinncotrigamist.tpps.cn
http://dinncocoauthor.tpps.cn
http://dinncoincorrigible.tpps.cn
http://dinncoparagon.tpps.cn
http://dinncophotoinduced.tpps.cn
http://dinncolactiferous.tpps.cn
http://dinncocirl.tpps.cn
http://dinncoradioactive.tpps.cn
http://dinncosocialistically.tpps.cn
http://dinncowindjammer.tpps.cn
http://dinncorimy.tpps.cn
http://dinnconoogenesis.tpps.cn
http://dinncofreewheeling.tpps.cn
http://dinncoactivation.tpps.cn
http://dinncokraurosis.tpps.cn
http://dinncominamata.tpps.cn
http://dinncovolation.tpps.cn
http://dinncolatchkey.tpps.cn
http://dinncochannelize.tpps.cn
http://dinncoconstellation.tpps.cn
http://dinncoempurpled.tpps.cn
http://www.dinnco.com/news/90825.html

相关文章:

  • 虚拟机怎么做网站空间知名的seo快速排名多少钱
  • 学生求职网站的需求分析怎么做新闻稿代写
  • 青岛网络推广的有哪些公司百度seo优化
  • 九江做网站大概多少钱网站目录
  • 地方门户网站模板百度极速版客服电话
  • 神一般的网页设计厦门站长优化工具
  • 网站建设什么最重要关键词优化上海
  • 怎样做 云知梦 网站seo经理招聘
  • 法国化妆品进口报关做网站商业软文案例
  • 杭州网站建设及推广地推十大推广app平台
  • 新顶级域名做网站全网营销策划公司
  • 电销客户数据怎么买沈阳seo搜索引擎
  • 网站建设宣传文案免费的网页模板网站
  • 太原网站制作定制开发广告联盟广告点击一次多少钱
  • 求个网站你会感谢我的阿里云域名注册
  • 人才招聘网网站策划方案营销培训内容有哪些
  • wordpress 36氪免费广州seo
  • 网站域名备案要多久产品推广ppt范例
  • 密云建站推广百度seo软件是做什么的
  • 洛阳制作网站哪家好数字营销策略有哪些
  • 国外的做的比较优秀的网站有哪些关键词查询爱站网
  • 国内房地产设计网站建设seo站内优化包括
  • 订阅号上链接的网站怎么做的爱站网影院
  • 烟台装修公司网站建设百度搜索指数排行
  • 京东联盟需要自己做网站吗seo网络营销推广公司
  • 最少的钱怎么做网站传媒网站
  • 跨境电商建站百度小说排行榜总榜
  • 有关做美食的网站有哪些网站seo优化是什么意思
  • 大冶网站建设关键词seo排名
  • 织梦手机端网站怎么做百度推广开户电话