思维导图备注

走进搜索引擎
首页 收藏书籍 阅读记录
  • 书签 我的书签
  • 添加书签 添加书签 移除书签 移除书签

第6章 搜索引擎日志分析

浏览 3 扫码
  • 小字体
  • 中字体
  • 大字体
2022-01-25 05:12:13
请 登录 再阅读
上一篇:
下一篇:
  • 书签
  • 添加书签 移除书签
  • 目录
  • 扉页
  • 版权页
  • 作者序
  • 第1章 引言
    • 1.1 搜索引擎概述
    • 1.2 搜索引擎的主要需求
    • 1.3 搜索引擎的4大系统
  • 第2章 搜索引擎的下载系统
    • 2.1 爬虫的发展历史
    • 2.2 万维网及其网页分析
    • 2.3 有关爬虫的基本概念
    • 2.4 网页抓取原理
    • 2.5 网页库
    • 2.6 下载系统回顾及未来发展
    • 参考文献
  • 第3章 搜索引擎的分析系统
    • 3.1 知识准备
    • 3.2 信息抽取及网页信息结构化
    • 3.3 网页查重
    • 3.4 中文分词
    • 3.5 PageRank
    • 3.6 分析系统结构图
    • 参考文献
  • 第4章 搜索引擎的索引系统
    • 4.1 知识准备
    • 4.2 全文检索
    • 4.3 文档编号
    • 4.4 倒排索引
    • 4.5 数据规模的估计
    • 4.6 涉及存储规模的一些计算
    • 4.7 倒排索引文件的创建过程
    • 参考文献
  • 第5章 搜索引擎的查询系统
    • 5.1 知识准备
    • 5.2 网页信息检索
    • 5.3 中文自动摘要
    • 5.4 生成搜索结果页
    • 5.5 搜索结果页的缓存
    • 5.6 推测用户查询意图
    • 5.7 查询系统的当前热点和发展方向
    • 参考文献
  • 第6章 搜索引擎日志分析
    • 6.1 简介
    • 6.2 知识准备
    • 6.3 查询日志分析
    • 6.4 点击日志分析
    • 6.5 隐私问题
    • 6.6 本章总结
    • 参考文献
  • 第7章 排序学习(Learning to Rank)
    • 7.1 排序概述
    • 7.2 传统的排序模型
    • 7.3 排序学习简介以及研究现状
    • 7.4 排序学习模型的应用实例
    • 7.5 排序学习方法的框架
    • 7.6 评测数据集
    • 7.7 排序学习模型简介
    • 7.8 排序学习模型性能比较
    • 7.9 排序学习的研究方向
    • 7.10 总结
    • 参考文献
  • 第8章 搜索引擎的性能调优
    • 8.1 系统调优概述
    • 8.2 瓶颈识别
    • 8.3 涉及CPU的优化方法
    • 8.4 涉及内存的优化方法
    • 8.5 涉及磁盘的优化方法
    • 8.6 涉及网络的优化方法
    • 参考文献
  • 《走进搜索引擎(第2版)》读者交流区
  • 反侵权盗版声明
暂无相关搜索结果!
    展开/收起文章目录

    二维码

    手机扫一扫,轻松掌上学

    《走进搜索引擎》电子书下载

    请下载您需要的格式的电子书,随时随地,享受学习的乐趣!
    EPUB 电子书

    书签列表

      阅读记录

      阅读进度: 0.00% ( 0/0 ) 重置阅读进度