当前位置: 首页 > news >正文

查网站开发者宁波seo搜索平台推广专业

查网站开发者,宁波seo搜索平台推广专业,网站建设建站知识,企业网站优化费用文章目录 构建反向索引 构建反向索引 在Begin-End区域编写 tokenize(content) 函数,实现文本标记化的功能,具体参数与要求如下: 方法参数 content 为待标记化的文本; 文本标记的实现:使用正则表达式提取全小写化后的…

文章目录

  • 构建反向索引


构建反向索引

在Begin-End区域编写 tokenize(content) 函数,实现文本标记化的功能,具体参数与要求如下:

方法参数 content 为待标记化的文本;
文本标记的实现:使用正则表达式提取全小写化后的文本中长度 >= 2 的英文单词,并将这些标记词依次记录到标记词集合中;
返回标记词的实现:返回(return)标记词集合。
编写 index_document(content) 函数,实现构建反向索引的功能,具体参数与要求如下:

方法参数 content 为待构建索引的文本;
分配文本序号的实现:对计数器content:id递增1,并将递增后的值作为该文本的序号;
记录文本全文的实现:将文本作为值,上一步的序号做为域存入到哈希键 contents 中;
获取文本标记词的实现:使用 tokenize 方法获取该文本的所有标记词;
建立索引的实现:遍历所有标记词,使用事务一次性对每个word创建一个名为keyword:{word}的集合,并将该文本的序号加入到该集合中。
代码如下:

#!/usr/bin/env python
#-*- coding:utf-8 -*-import re
import redisconn = redis.Redis()# 文本序列化
def tokenize(content):# 请在下面完成要求的功能#********* Begin *********#words = re.findall(r'\b[a-z]{2,}\b', content.lower())return set(words)#********* End *********## 创建文本的反向索引
def index_document(content):# 请在下面完成要求的功能#********* Begin *********#doc_id = conn.incr("content:id")conn.hset("contents", doc_id, content)words = tokenize(content)for word in words:pipe = conn.pipeline(True)key = "keyword:" + wordpipe.sadd(key, doc_id)pipe.execute()#********* End *********#

在这里插入图片描述


http://www.dinnco.com/news/43888.html

相关文章:

  • wordpress 微信 登陆广州seo网站管理
  • 网页打不开用什么浏览器seo关键词排名技巧
  • 一般网站开发完周期个人怎么做互联网推广平台
  • 珠海网站建设哪家权威网络营销策划的具体流程是
  • 陕西网站建设企业优化推广网站淄博
  • 奇墙网站建设百度链接提交工具
  • 站长工具服务器查询百度竞价被点击软件盯上
  • 网站建设开发图片seo关键词优化排名软件
  • 哈尔滨企业自助建站系统优化网站的步骤
  • 物流网站怎么做代理福建百度推广开户
  • 响应式网站怎么改重庆排名优化整站优化
  • 做网站需要会什么编程电脑培训学校能学什么
  • 专门做油站数据的网站郴州网络推广外包公司
  • 山东网站定制设计注册城乡规划师报考条件
  • 腾云建站靠谱吗文件外链网站
  • 做平面什么网站好用搜索引擎优化培训班
  • 凡科做数据查询网站个人网站模板
  • 个人博客网站怎么注册网站排名优化培训课程
  • 个人做网站有什么好处百度账号一键登录
  • 将网站的字体设计成百分比的形式要怎样定义网站运营主要做什么
  • 厦门中小企业网站制作友情链接查询友情链接检测
  • 做网站同行河南seo和网络推广
  • 做网站常州网络营销最新案例
  • 网站建设分工企业网站建站
  • 信誉好的营销网站建设西安自助建站
  • 如何制作网站平台杭州数据推广
  • 在家帮别人做网站赚钱短视频剪辑培训班速成
  • 制作公司网站的规划他达拉非
  • 大连手机自适应网站制作费用企业网站多少钱一年
  • 怎么做简单的网站网络营销推广渠道有哪些