当前位置: 首页 > news >正文

网上购物商城网站建设毕业设计百度搜索引擎营销

网上购物商城网站建设毕业设计,百度搜索引擎营销,wordpress获取根目录路径,建设银行 网站设置密码文章目录 前言为什么叫倒排索引数据结构如何生成如何查询TF、IDF参考文档 前言 上一章,简单介绍了 ES 的节点类型。 本章,我们要介绍 ES 中非常重要的一个概念:倒排索引。 ES 的全文索引就是基于倒排索引实现的。 本章内容建议重点学习&…

文章目录

      • 前言
      • 为什么叫倒排索引
      • 数据结构
      • 如何生成
      • 如何查询
      • TF、IDF
      • 参考文档

前言

上一章,简单介绍了 ES 的节点类型。
本章,我们要介绍 ES 中非常重要的一个概念:倒排索引。
ES 的全文索引就是基于倒排索引实现的。
本章内容建议重点学习,因为面试也常问。

为什么叫倒排索引

倒排索引指的是将每一个关键字映射到它出现的文档中。如下图所示
在这里插入图片描述

因为结构是倒着的,因此被称为倒排索引。

数据结构

倒排索引分为 2 部分:一部分叫 term directory(term 词典),一部分叫 posting list(倒排列表)。如下图所示
在这里插入图片描述

  • term directory
    term 字典,存放着每个单词到对应倒排列表的映射关系

  • posting list
    Docs 是一个数组。其中 1:2:[2,6] 意思如下

    • 1:文档ID
    • 2:词频(term frequency)
    • [2,6]:出现在文档中的第 2,6 个 term。

如何生成

这里涉及到我们之前讲过的分词器。工作流程如下图所示
在这里插入图片描述

大体就包含2部分,根据分词器将文本分词,然后根据分词生成倒排索引。

如何查询

例如我们查询:To do right
则该文本会先被分词为:to, do, right
对应的结果如下图所示:
在这里插入图片描述

TF、IDF

默认情况下,ES 会根据文档与搜索词的相关性得分对结果降序返回。相关性得分与以下 2 个概念有关(稍做了解,后续会出文章做更深入的介绍)

  • Term Frequency(TF):term 在文档中出现的频率,得分正相关。出现频率越高,得分越高
  • Inverted Document Frequency(IDF):term 在 所有文档 中出现的频率,得分负相关。出现频率越高,得分越低。

参考文档

Indexing: Inverted Index

http://www.dinnco.com/news/10091.html

相关文章:

  • 网站建设linux快手seo软件下载
  • 网站备案密码 多少位百度快照客服
  • 企业网站哪个好百度客服中心
  • 一台vps可以做几个网站手机百度极速版app下载安装
  • 什么是wordpress主题武汉网络推广seo
  • 企业网站开发多少钱seo搜索引擎入门教程
  • 做一个购物网页优化网站的目的
  • php网站开发软件是什么潍坊seo教程
  • 小语种网站案例郑州网站关键词优化公司哪家好
  • 找网站建设企业某网站seo诊断分析
  • asp.net 网站建设免费网站流量
  • 全国政务网站哪家做的好网站开发流程
  • 做网站需要买什么东西网站域名备案信息查询
  • 可以举报一个做网络网站发大财吗最近新闻摘抄50字
  • 哈尔滨网站制作维护盘古百度推广靠谱吗
  • 网站制作文案杭州杭州线上推广
  • 济阳做网站哪家好搜索引擎搜索器
  • 网站建设好后如何连接服务器免费顶级域名注册
  • 淘宝优惠券网站怎么做班级优化大师官网登录
  • 推广做黄页网站无锡seo关键词排名
  • 一起买买买网站建设推广公司运营模式
  • 空白网站怎么做短链接在线生成免费
  • 做网站大公司有哪些新站seo竞价
  • 自己做网站怎么跳过备案大数据下的精准营销
  • 专业app网站建设哪家好颜色广告
  • xxx网站建设规划百度怎么发自己的小广告
  • 做婚庆网站有哪些最新社会舆情信息
  • 如何推广自己的公司西安百度seo排名
  • 高端网站建设kgu关键词排名点击软件首页
  • 网站的开发环境怎么写网页怎么优化