开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1336|回复: 7
收起左侧

[其它数据库例题] Infobright列数据库的构架分析

[复制链接]

结帖率:61% (35/57)
发表于 2013-2-3 14:34:21 | 显示全部楼层 |阅读模式   海南省海口市
如上图所示,Infobright采用了和MySQL一致的构架,分为两层。上层是服务及应用管理,下层是存储引擎。Infobright的默认存储引擎是brighthouse,但是Infobright还可以支持其他的存储引擎,比如MyISAM、MRG_MyISAM、Memory、CSV。Infobright通过三层来组织数据,分别是DP(Data Pack)、DPN(Data Pack Node)、KN(Knowledge Node)。而在这三层之上就是无比强大的知识网络(Knowledge Grid)。
数据块(DP)是存储的最低层,列中每64K个单元组成一个DP。DP比列更小,具有更好的压缩比率;又比单个数据单元更大,具有更好的查询性能。
数据块节点(DPN),DPN和DP之间是一对一的关系。DPN记录着每一个DP里面存储和压缩的一些统计数据,包括最大值、最小值、null的个数、单元总数count、sum等等。
KN里面存储着指向DP之间或者列之间关系的一些元数据集合,比如值发生的范围(MIin_Max)、列数据之间的关联。大部分的KN数据是装载数据的时候产生的,另外一些事是查询的时候产生。
在这三层之上是知识网络(Knowledge Grid),Knowledge Grid构架是Infobright高性能的重要原因。
Knowledge Grid可分为四部分,DPN、Histogram、CMAP、P-2-P。
DPN如上所述。Histogram用来提高数字类型(比如date,time,decimal)的查询的性能。Histogram是装载数据的时候就产生的。DPN中有mix、max,Histogram中把Min-Max分成1024段,如果Mix_Max范围小于1024的话,每一段就是就是一个单独的值。这个时候KN就是一个数值是否在当前段的二进制表示。
Histogram的作用就是快速判断当前DP是否满足查询条件。如上图所示,比如select id from customerInfo where id>50 and id<70。那么很容易就可以得到当前DP不满足条件。所以Histogram对于那种数字限定的查询能够很有效地减少查询DP的数量。
CMAP是针对于文本类型的查询,也是装载数据的时候就产生的。CMAP是统计当前DP内,ASCII在1-64位置出现的情况。如下图所示
比如上面的图说明了A在文本的第二个、第三个、第四个位置从来没有出现过。0表示没有出现,1表示出现过。查询中文本的比较归根究底还是按照字节进行比较,所以根据CMAP能够很好地提高文本查询的性能。
Pack-To-Pack是Join操作的时候产生的,它是表示join的两个DP中操作的两个列之间关系的位图,也就是二进制表示的矩阵。
Knowledge Grid还是比较复杂的,里面还有很多细节的东西,可以参考官方的白皮书和Brighthouse: an analytic data warehouse for ad-hoc queries这篇论文。
发表于 2013-4-10 21:53:25 | 显示全部楼层   天津市天津市
矜持住。小松鼠,我没有那么多的源码分享了o>_<o~


三克油论坛:mm.boygg.com
三克油美女:mm.boygg.com
三克油电影:mm.boygg.com
ROSI美女:rosi.boygg.com
rosi写真:rosi.boygg.com
品色导航:boygg.com
回复 支持 反对

使用道具 举报

发表于 2013-4-10 19:56:29 | 显示全部楼层   天津市天津市
头像是美女
不怎么漂亮  一般般
回复 支持 反对

使用道具 举报

结帖率:100% (6/6)
发表于 2013-2-11 20:36:50 | 显示全部楼层   福建省*
宇智波·佐助 发表于 2013-2-11 10:28
头像是美女

不怎么漂亮  一般般
回复 支持 反对

使用道具 举报

结帖率:37% (7/19)
发表于 2013-2-11 10:28:23 | 显示全部楼层   北京市北京市
浅笑/忧伤 发表于 2013-2-3 15:37
矜持住。小松鼠,我没有那么多的源码分享了o>_

头像是美女
回复 支持 反对

使用道具 举报

结帖率:100% (6/6)
发表于 2013-2-3 15:38:26 | 显示全部楼层   广东省深圳市
矜持住。小松鼠,我没有那么多的源码分享了o>_<o~
回复 支持 反对

使用道具 举报

结帖率:100% (6/6)
发表于 2013-2-3 15:37:43 | 显示全部楼层   广东省深圳市
矜持住。小松鼠,我没有那么多的源码分享了o>_<o~
回复 支持 反对

使用道具 举报

结帖率:100% (2/2)
发表于 2013-2-3 14:35:48 | 显示全部楼层   四川省广元市
沙发占了再说,支持楼主!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表