首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏用户4352451的专栏

    B+

    三、B+ B+是B-的变体,也是一种多路搜索,其定义基本与B相同,除了: 非叶子结点的子树指针与关键字个数相同; 非叶子结点的子树指针P[i],指向关键字值属于[K[i], K[i+1 四、BB+的对比 B和B+的区别在于,B+的非叶子结点只包含导航信息,不包含实际的值,所有的叶子结点和相连的节点使用链表相连,便于区间查找和遍历。 2、B+的优点 由于B+在内部节点上不好含数据信息,因此在内存页中能够存放更多的key。 数据存放的更加紧密,具有更好的空间局部性。 因此访问叶子几点上关联的数据也具有更好的缓存命中率; B+的叶子结点都是相链的,因此对整棵的便利只需要一次线性遍历叶子结点即可。而且由于数据顺序排列并且相连,所以便于区间查找和搜索。 而B则需要进行每一层的递归遍历。相邻的元素可能在内存中不相邻,所以缓存命中性没有B+好。 3、应用 BB+经常被用于数据库中,作为MySQL数据库索引。

    72520发布于 2020-08-26
  • 来自专栏烟草的香味

    B+,索引

    引言 时隔一年,我又想起当初看数据库时,看到的B+,就是数据库的索引使用的数据结构。再整理一下,看看自己没有忘记很多吧。 概述 B+之前,先来看一下二叉查找(1,2,3,4,5,6,7) ? 但想想数据库查找数据的场景: select * from user where id > 10, 显然,对于这种查找区间来说,二叉查找并不高效。那么B+是如何解决这个问题的呢? 没错,这就是B+。 这个结构是怎么想出来的我不知道啊,但是我今天突然发现,他的存储方式和跳表十分之像啊。莫非是受到了跳表的启发?亦或是跳表受到了B+的启发?咱也不知道。 算一下,如果是3叉,高度为3(这个高度为索引的高度),可索引的数组长度为:(3^4=81);如果是5叉,高度为3,可索引数组长度为:(5^4=625);如果是100叉,高度为3,可索引长度为:( B+是不是分叉越多越好 那肯定不是越多越好啊,要是一层就把所有数据都存储了,要他还有什么用,根本没有起到快速定位的作用。 但我想说的并不是这。

    1.2K20发布于 2019-12-02
  • 来自专栏宇宙之_一粟

    BB+

    BB+都是用于外查找的数据结构,都是平衡多路查找。 两者的区别 在B+中,具有n个关键字的结点含有n棵子树,即每个关键字对应一颗子树;而在B中,具有n个关键字的结点含有(n+1)棵子树。 在B+中,除根节点外,每个结点中的关键字个数n的取值范围是[m/2]~m,根节点n的取值范围是2~m;而在B中,除根节点外,其他所有非叶结点的关键字个数n的取值范围是[m/2]-1~m-1,根节点n B+中的所有叶结点包含了全部关键字,即其他非叶结点中的关键字包含在叶结点中;而在B中,关键字是不重复的。 B+中的所有非叶结点仅起到索引的作用,即结点中的每个索引项只含有对应子树的最大关键字和指向该子树的指针,不包含该关键字对应记录的存储地址;而在B中,每个关键字对应一个记录的存储地址。 通常在B+树上有两个头指针,一个指向根节点,另一个指向关键字最小的叶结点,所有叶结点链接成一个不定长的线性链表,所以B+可以进行随机查找和顺序查找;而B只能进行随机查找。

    1.2K41发布于 2020-10-26
  • 来自专栏IT当时语_青山师_JAVA技术栈

    BB+的区别及MySQL为何选择B+

    BB+的区别及MySQL为何选择B+ 1. BB+的定义 BB+都是一种多路搜索,常用于数据库和文件系统中进行索引操作。在介绍BB+的区别之前,先来了解一下它们的定义。 B+ B+也是一种多路搜索,与B相似,但在B+中,所有的数据都存储在叶子节点中,而非在非叶子节点中。B+满足以下条件: 所有关键字都出现在叶子节点的链表中,且链表中的关键字恰好是有序的。 BB+的区别 BB+虽然都是多路搜索,但它们的区别还是比较明显的。 存储结构 B的非叶子节点中既包含索引,也包含数据,而B+的非叶子节点中只包含索引,数据都存储在叶子节点中。 查询性能 B+的查询性能更优,因为B+的数据都存储在叶子节点中,而B的数据既可能存储在非叶子节点中,也可能存储在叶子节点中。 MySQL采用的是B+作为索引的数据结构,原因如下: B+的查询性能更好,因为数据都存储在叶子节点中,查询时只需要遍历一次叶子节点即可得到查询结果。

    2.2K10编辑于 2023-05-05
  • 来自专栏CSDN搜“看,未来”

    浅谈 B+

    目前常见的主要的三种存储引擎是:哈希、B+、LSM。LSM下次再说,hash讲过了。 没有什么B-,那是 B-tree,国内一直翻译成B-,其实就是B。 B我也不想说了,因为已经被升级过了,叫B+。 下图来自 小灰的算法之旅,懂得人自然就懂了: ---- 对比一下B: 这个是B。 ---- B+对于B的改进 1、所有数据都在叶子节点。算法更容易理解了。回头抽空手写一下B+,正好跳表也要重写了。 2、底层叶子节点使用链表串起来了。 这第二个改进不可谓不秀。 单这么看自然是不明所以的,但是凡事都要放在上下文中去看,B+的上下文对应的就是磁盘IO的索引呐,那如果我要范围查询呢?比如说我要上面里面 4-10 的所有数据,B 怎么作为?B+怎么作为?

    54220发布于 2021-10-09
  • 来自专栏java达人

    LSMB+比较

    这就是B+的原理,但是写起来就很糟糕,因为会产生大量的随机IO,磁盘寻道速度跟不上。 关于b B+最大的性能问题是会产生大量的随机io。随着新数据的插入,叶子节点会慢慢分裂。 例如,Oracle 的常用索引使用 B+ 。下面是一个B+的例子 根节点和分支节点很简单,记录每个叶子节点的最小值,用指针指向叶子节点。 关于lsm LSM 本质上是读写之间的平衡。与B+相比,它牺牲了部分读取性能来提高写入性能。 读取的时候,因为我们不知道数据在哪棵树上,所以必须遍历所有的,但是每棵中的数据都是有序的。 以上就是LSM最本质的原理,有了原理,再看具体的技术就很简单了: 关于lsm内存结构,可以是B+,还可以为跳跃表(skip-list)或是一个有序字符串表(SSTables)。

    1.3K20编辑于 2022-05-16
  • 来自专栏花落的技术专栏

    红黑、BB+

    一般一页为4KB(8个扇区,每个扇区512B,8*512B=4KB)。 局部性原理: 当一个数据被用到时,其附近的数据也通常会马上被使用。 程序运行期间所需要的数据通常比较集中。 B/B+的索引数量 B 的节点中存储:指针、关键字(主键)、数据 B+ 的非叶子节点:指针、关键字 B+的叶子节点:指针(链表)、关键字、数据 注意,这里不是绝对的,比如有的 B+ 中叶子节点存储的不是数据 而且上述是假设数据为 1KB,如果数据没那么大,高度为 3 的 B 能存储更多的数据,但是如果用在大型数据库索引上还是不够。 B+ B+ 如上图,B+的核心在于非叶子节点不存储数据。 进行两次 I/O 就可以索引千万级别的数据,高度为 4B+ ,进行 3 次 I/O 就能索引十亿级别的数据量,这个效果还是很好的。 B/B+的优点 更适合磁盘存储,减少了的层级,进而减少 I/O 次数; B B+ 对比 都是 B ,但是 B+更适合范围查询,比如 Mysql,且查询次数很稳定,为 logn。

    1.3K40发布于 2021-11-25
  • 来自专栏我的技术专刊

    红黑、BB+

    一般一页为4KB(8个扇区,每个扇区512B,8*512B=4KB)。 局部性原理: 当一个数据被用到时,其附近的数据也通常会马上被使用。 程序运行期间所需要的数据通常比较集中。 B/B+的索引数量 B 的节点中存储:指针、关键字(主键)、数据 B+ 的非叶子节点:指针、关键字 B+的叶子节点:指针(链表)、关键字、数据 注意,这里不是绝对的,比如有的 B+ 中叶子节点存储的不是数据 而且上述是假设数据为 1KB,如果数据没那么大,高度为 3 的 B 能存储更多的数据,但是如果用在大型数据库索引上还是不够。 B+ B+ 如上图,B+的核心在于非叶子节点不存储数据。 进行两次 I/O 就可以索引千万级别的数据,高度为 4B+ ,进行 3 次 I/O 就能索引十亿级别的数据量,这个效果还是很好的。 B/B+的优点 更适合磁盘存储,减少了的层级,进而减少 I/O 次数; B B+ 对比 都是 B ,但是 B+更适合范围查询,比如 Mysql,且查询次数很稳定,为 logn。

    97200编辑于 2021-12-05
  • 来自专栏乐行僧的博客

    B-B+,B*

    1.减少磁盘的IO 2.更快的搜索算法 操作系统中, 管理内存是按照页page 4K 管理的 管理磁盘是按照block 16K 现在有n = 1000w个索引需要从磁盘中进行读取和搜索? avl和m为300的B-? avl的高度:log2n = 24层 最差的情况一个节点只存储一个索引? 最差需要24次磁盘IO B-高度:log(300)n = 3 层 最多花费3次磁盘IO B+ B+是B-的一种变形 非叶子结点只存储索引,不存储数据 B+的叶子结点包含全部的关键字信息 ,而B-的数据分散在各个结点当中。 B+存放的索引项相对于B-能够存储的更多。 B* B*B+的变体,在B+的非根和叶子结点在增加指向兄弟结点的指针 B*提高了结点的利用率。

    1.4K30编辑于 2022-02-25
  • 来自专栏Java架构师必看

    BB+、B*——简单介绍

    BB+、B*——简单介绍 强烈推介IDEA2020.2破解激活,IntelliJ 如果允许每个节点可以有更多的数据项和更多的子节点,就是多叉; 【2】2-3,2-3-4就是多叉,多叉通过重新组织节点,减少的高度,能对二叉进行优化。如下图就是一个2-3; ? 【3】文件系统及数据库系统的设计者利用磁盘预读(预先读取)原理,将一个节点的大小设置为页<page:数据读取的最小单位>的大小(通常为4k),这样每个节点只需要一次 IO就能载入内存;B(B+)广泛应用于文件存储系统及数据库文件系统中 三、BB+、B* ---- 【1】B介绍:前面介绍的2-3、2-3-4就是 B,在 MySql 中经常听说某种索引是基于 BB+的,如下图: ? 【2】B+介绍:B+ 是B的变体,也是一种多路搜索,如下图: ? 【3】B* 介绍:B* B+的变体,在B+的非根和非叶子节点增加了指向兄弟的指针,如下图: ?

    1.6K20发布于 2021-04-30
  • BB+区别

    具体区别1、叶子节点B不存指针,B+存双向指针,方便范围查找2、B非叶子节点也存储数据,B+不存储数据3、B不会有冗余索引,是唯一的,B+会有冗余索引4、存放同样的数据,B的层级比B+要高 ,因为B+有冗余索引,所以相同层级的叶子节点的数据就会更多,(可以有更多的分叉)索引:如果存在主键,主键索引就是聚集索引如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引。

    39210编辑于 2024-06-06
  • 来自专栏JavaEE

    多叉 & B & B+ & B*

    2-3 2-3是最简单的B,它有以下特点: 首先它也要满足排序的特点,即左子节点都比父节点小,右子节点都比父节点大,如果3节点,那么中间那个元素要介于左节点和右节点之间,即6是介于4和11之间的 (2). 2-3-4: 和2-3的区别就是,它还允许节点有三个元素且有四个子节点。 4. B: B是balance,平衡的意思,所以,B首先是一棵平衡,而平衡首先得是一棵排序数。 比如2-3的阶就是3,2-3-4的阶就是4; B的搜索:从根节点开始,对节点内的元素进行二分查找,如果找到就结束,否则进入查找元素所属范围的子节点再进行二分查找,直到找到或者到达叶子节点; B的所有节点都会存放数据 B+B+是B的变体,和B的区别就是,B+所有数据都存放在叶子节点。 B+一般用于文件系统; 6. B*: B*又是B+的变体,就是在B+的基础上,在非根非叶子节点之间增加了指向兄弟节点的指针。

    1.9K20发布于 2020-12-22
  • 来自专栏xingoo, 一个梦想做发明家的程序员

    B B- B+ B*

    1.关键字集合分布在整颗中;        2.任何一个关键字出现且只出现在一个结点中;        3.搜索有可能在非叶子结点结束;        4.其搜索性能等价于在关键字全集内做一次二分查找 M/2的结点;删除结点时,需将两个不足M/2的兄弟结点合并; B+        B+是B-的变体,也是一种多路搜索:        1.其定义基本与B-同,除了:        2.非叶子结点的子树指针与关键字个数相同 B+的搜索与B-也基本相同,区别是B+只有达到叶子结点才命中(B-可以在 非叶子结点命中),其性能也等价于在关键字全集做一次二分查找;     B+的特性:        1.所有关键字都出现在叶子结点的链表中 更适合文件索引系统; B*B+的变体,在B+的非根和非叶子结点再增加指向兄弟的指针; ?    ;       所有关键字在整颗中出现,且只出现一次,非叶子结点可以命中; B+:在B-基础上,为叶子结点增加链表指针,所有关键字都在叶子结点中出现,非叶子结点作为叶子结点的索引;B+总是到叶子结点才命中

    2.2K71发布于 2018-01-17
  • 来自专栏面试

    B+的结构

    O(log⁡n)O(logn)) 范围查询优化:叶子节点的链表结构允许直接遍历相邻节点,避免回溯至根节点,大幅减少范围查询的I/O次数 4. 与B的区别B+在以下方面区别于B 数据存储位置:B内部节点存数据,B+仅叶子节点存数据。链表结构:B+树叶子节点通过链表连接,B无此设计。 一棵B+可以存放多少行数据? 文件系统中,最小单位是块,一个块大小就是4k;InnoDB存储引擎最小储存单元是页,一页大小就是16k。 B-Tree,叶子节点和非叶子节点都保存数据,相同的数据量,B+更矮壮,也是就说,相同的数据量,B+数据结构,查询磁盘的次数会更少。

    88410编辑于 2025-03-18
  • 来自专栏性能与架构

    mysql B+索引

    上图就是一棵B+,每个部分有3个主要概念:物理磁盘块、数据项(蓝色)、指针(红色) 如磁盘块1,包含数据项 17、35,包含指针 P1、P2、P3,P1指向小于17的磁盘块,P2指向在17和35之间的磁盘块 真实的数据存于叶子节点中,即 3、5、9、10、13、15、28、29、36、60、75、79、90、99 非叶子节点中并不存放真实数据项,只存放指引搜索方向的数据项,如 17、35 并不真实存在于数据表中 B+ 查找过程 如果要查找数据项29 1. 35之间,锁定磁盘块1的P2指针,通过P2指向的磁盘地址,把磁盘块3由磁盘加载到内存,发生第二次IO 3. 29在26和30之间,锁定磁盘块3的P2指针,通过指针加载磁盘块8到内存,发生第三次IO 4. 内存中做二分查找找到29,结束查询 总计三次IO,即可找到目标数据项 3层的B+可以表示上百万的数据,对查询性能的提高是巨大的

    1.1K80发布于 2018-04-02
  • 来自专栏社区的朋友们

    理解 B+ 算法

    定义 参考百度百科及wiki百科定义:B +是一个N叉排序,每个节点通常有多个孩子,一棵B+包含根节点、内部节点和叶子节点。 B+ 主要价值在于存储用于在面向块的存储环境中高效检索的数据,通常用于数据库和操作系统的文件系统中。B+ 的特点是能够保持数据稳定有序,其插入与修改拥有较稳定的对数时间复杂度。 B+ 元素自底向上插入。 另外说明的一点,B+中的B并不是代表二叉(Binary),而是代表平衡(Balance)。 对于m阶B+,m的值越大,固定高度的B+存放的值就越多。 而B+内部结点只需要1个盘块。当需要把内部结点读入内存中的时候,B 就比B+多一次盘块查找时间(在磁盘中就是盘片旋转寻道的时间)。

    3.1K00发布于 2017-10-20
  • 来自专栏glm的全栈学习之路

    B(B-)、B+ 简述

    要是那个人说b和b-不一样 那你可以认为他是zz了hh,b就是b- 说起来b的发明主要是为了减少磁盘io操作 将的结构设计成矮胖型而不是瘦高型,因为数据库索引是存储在磁盘上的,当数据量比较大时 ,我们不能把所有索引加载到内存中,只能逐一加载每一个磁盘页,这里的磁盘页对应索引的节点 一个m阶的B具有如下几个特征: 1.根结点至少有两个子女。 2.每个中间节点都包含k-1个元素和k个孩子,其中 m/2 <= k <= m 3.每一个叶子节点都包含k-1个元素,其中 m/2 <= k <= m 4.所有的叶子结点都位于同一层。 一个m阶的B+具有如下几个特征: 1.有k个子树的中间节点包含有k个元素(B中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点。 下图是一个b+( b-改造加链表) ?

    1.5K40发布于 2021-03-08
  • 来自专栏后端从入门到精通

    B+(4)联合索引 --mysql从入门到精通(十六)

    B+(3)聚簇索引,二级索引 --mysql从入门到精通(十五) 联合索引 联合索引又称复合索引,比方说我们想让b+按c2,c3两个列进行大小排序,那意思是:1)先按c2进行排序。 其本质也是个二级索引,但不同的是: 联合索引只有一颗b+。 如果为c2,c3分别建立索引有两颗b+。 InnoDB索引注意事项: 根节点保持不变 B+的形成过程,1)给新表建立主键索引(聚簇索引),聚簇索引不是人为创建的,默认就有,此刻就会创建根节点页面,里面没有数据。 一个页面最少存储两条记录 我们知道b+只要三层层级就能存储庞大的数据,查询效率非常高,每次往下查询都会过滤掉很多没必要的子目录,那如果一个大目录页只放一个子目录是什么效果呢?

    78921编辑于 2022-07-26
  • 来自专栏技术教程

    MySQL索引B+详解

    下面是对 MySQL 索引 B+ 的详细解析: B+ 的核心设计目标适配磁盘存储: 磁盘 I/O(读取/写入数据块)是数据库操作的主要性能瓶颈。 B+ 设计成每个节点大小通常等于一个磁盘页(如 16KB),最大化每次 I/O 读取的数据量。降低高度: B+ 是一个“矮胖”的多叉。 极高的分支因子意味着在相同数据量下,B+ 的高度远低于二叉(如 AVL 、红黑),从而减少了访问叶子节点所需的磁盘 I/O 次数(通常只需 3-4 次 I/O 就能找到数据)。 二、 B+ 的结构详解(以 InnoDB 为例)一棵典型的 B+ 包含以下几种节点:根节点 (Root Node):的顶端节点。 查找过程需要两次 B+ 搜索:在辅助索引 B+ 中找到主键值。用该主键值在聚簇索引 B+ 中查找完整的行数据(回表)。

    1.2K20编辑于 2025-07-02
  • 来自专栏leetcode_solutions

    BB+的区别

    B+的叶节点是链接的,所以对中的所有对象进行全扫描只需要一次线性遍历所有叶节点。另一方面,B需要遍历中的每一层。这种全遍历可能会涉及比B+叶的线性遍历更多的高速缓存未命中。 B+的叶子节点由一条链相连,而B的叶子节点各自独立。 使用B+的好处 由于B+的内部节点只存放键,不存放值,因此,一次读取,可以在内存页中获取更多的键,有利于更快地缩小查找范围。 针对以上两个问题,B+诞生了,B+相比B,本质上是一样的,区别就在与B+的所有根节点都不带有任何数据信息,只有索引信息,所有数据信息全部存储在叶子节点里,这样,整个的每个节点所占的内存空间就变小了 不仅如此,B+还有一个相应的优质特性,就是B+的查询效率是非常稳定的,因为所有信息都存储在了叶子节点里面,从根节点到所有叶子节点的路径是相同的。 那么,我们最后再总结一下B+的优点:        (1) B+的磁盘读写代价更低               B+的内部结点并没有指向关键字具体信息的指针。因此其内部结点相对B更小。

    5K41发布于 2019-03-14
领券