Zeng's Page


  • 首页

  • 标签

  • 归档

  • 相册

  • 搜索

Elasticsearch笔记02

Posted on 2021-08-15 | In DevOps

倒排索引

倒排索引是单词文档矩阵的一种存储形式
分词系统将文档切分成单词序列

单词文档矩阵 = 单词词典 + 倒排文件
单词词典:所有单词的集合,包括单词本身的信息和指向倒排列表的指针
倒排文件:所有单词的倒排列表顺序地存储在磁盘里形成的文件

倒排列表最简单的形式仅记录包含某个单词的文档编号(DocID),复杂一些的,还记录了单词在某个文档出现的次数,即单词频率(TF),还可能包含某个单词的文档数,即文档频率(DF),和单词在文档中的位置(Pos)

Read more »

【摘】MySQL问题

Posted on 2021-08-11 | In DevOps

主从延迟

主从复制中有两个很重要的日志文件,binlog和relay log,分别位于主库与从库中。其中 binlog 是主从复制的基础,通过将操作事件写入 binlog 通过 I/O 线程传送至从库进行同步。

主从延迟可能的原因:

  • 从库中 SQL 线程重放的过程是随机写盘的,并且 SQL 线程是单线程的,因此数据来不及重放的话就会导致主从延迟。
  • 主库并发高会导致写操作不断写入 binlog,对于 SQL 线程说可能会应接不暇,也会产生主从延迟。
  • 重放过程中如果遇到锁等待也是产生延迟的原因之一。
Read more »

【摘】Elasticsearch和Solr

Posted on 2021-07-30 | In DevOps

Elasticsearch是一个实时分布式搜索和分析引擎。它让你以前所未有的速度处理大数据成为可能。Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎。无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。Elasticsearch也使用Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能,但是它的目的是通过简单的 RESTful API 来隐藏Lucene的复杂性,从而让全文搜索变得简单。

Read more »

【摘】Elasticsearch笔记

Posted on 2021-07-29 | In DevOps

特点

PB级 结构化和非结构化数据
开源
全文搜索引擎
非规范化,提高搜索性能

Read more »

【摘】broker/agent/proxy/delegate的区别

Posted on 2021-06-29 | In 其它

Broker:中介式代理

Broker 是一种中介式代理。在网络与分布计算中, 两个层次上的对等实体, 若不便彼此直接交往, 则可通过Broker实现通信。这些可以有各种各样的定义和实现, 也表现在不同的层次上。简单一点, Broker提供了分布式服务和资源的透明访问,屏蔽了异构组件之间的差异。

Read more »

1234…21
Lz. Zeng

Lz. Zeng

Continuous Self-Improvement

104 发布
18 分类
28 标签
© 2022 Lz. Zeng
NexT.Pisces
 |         Words: 97.2k
0%