大雀软件园

首页 软件下载 安卓市场 苹果市场 电脑游戏 安卓游戏 文章资讯 驱动下载
技术开发 网页设计 图形图象 数据库 网络媒体 网络安全 站长CLUB 操作系统 媒体动画 安卓相关
当前位置: 首页 -> 数据库 -> 其他相关 -> 《数据建模》读书笔记

《数据建模》读书笔记

时间: 2021-08-13 作者:daque

迩来逛书局创造一本数据建立模型的好书——《数据建立模型:领会与安排的东西和本领》(data modeler’s workbench:tools and techniques for analysis and design),作家steve hoberman。粗读完一遍后,发觉这该书简直不愧于翻译和海外大师们的叹为观止:“这该书充溢了对矫正数据模子和安排有益的本领和本领,而且它还极富观赏欢乐——一个了不得的贯串!任何一个数据建立模型者都该当具有一本steve hoberman的对于数据建立模型东西和本领的书。”    纵然我对本人所控制的数据建立模型常识有确定的自夸,读完该书后,仍旧受益无穷。本着好书大师一道瓜分的办法,我把该书的每个章节的归纳和本领倡导列出来,以简单手边姑且没有该书的伙伴在数据建立模型时参考。该书所引见的东西和模版可在作家的web站点载入,地方是:   www.wiley.com/compbooks/hoberman   第一章:运用趣闻、类比和演练文稿来证明数据建立模型的观念   在普遍的凡是勾通中。咱们大概会说出并听到很多故事、大概趣闻那些故事波及的论题范畴很大。有些例子是周末爆发在咱们本人身边的工作,大概是与咱们的处事名目相关的体验。那些趣闻无助于于巩固咱们和范围人们的联系,促进咱们的喜悦情结,并且对咱们有培养效率。咱们不妨把由谈话表白出来的货色局面化。偶尔,当故事中断时,给咱们留住的是往日不曾想到的消息或更多的看法。在证明数据建立模型观念时,趣闻是极端灵验的。因为犹如下几个:   它们创造起长久的局面。   它们令人着迷、使人喜悦。   它们增经人们之间的联系。   它们减缓压力。   胜利臆造并报告一个数据建立模型上面的趣闻有底下三个大略的办法:   1)设置一个论题。要在意中保护,你报告的这个趣闻有一个一定的目的或论题,也即是说,这个故事是为领会释一个数据建立模型的观念或术语。   2)采用你的故事。咱们不妨采用的故事典型五花八门。咱们要商量采用一个风趣并有益,并且不妨领会精确地传播中心企图的简略的故事。   3)演示你的故事。一旦找到了符合的故事,你要好好演示一番,直到你自大它不妨在两秒钟的功夫内充溢表白你的论题。要制止报告拖泥带水的故事。   数据模子类比   类比即是把两个或多个观念举行彼此比拟,以夸大它们之间的一致或分别。类比是引见外路实物或陈腐实物的一个很好的本领,更加是向非计划机专科的人士引见计划机的专科常识时。hoberman在数据建立模型中最罕见的几个类比方下(他用那些类比轻快的感动处置层给他涨了一倍的报酬^_^):   主体域模子是一个高高在上的视点。   数据模子是一个安排图。   企业模子是一个寰球舆图。   规范即是都会筹备。   元数据仓库储存库是一个典籍馆。   数据堆栈是“心脏”。   第二章:元数据宾果游戏   大略来说,即经过宾果卡片游戏的办法,安排名目共青团和少先队分子的主动性,来决定数据模子,并决定元数据的灵验性。元数据宾果游戏夸大“共赢”,即使幸运好,游戏中断时每部分都能赢。   第三章:保证高品质的设置   本章会合计划一个被称为“设置查看单”(definition checklist)的东西,它包括了保证设置的品质居于最高程度的规则。   第四章:数据建立模型者的名目安置   本章中心引见决定数据建立模型阶段、工作、东西和时间限制的四个东西:   ·数据建立模型阶段的东西:用来决定最高档次上的数据建立模型办法。   ·阶段—工作—东西:索取出“数据建立模型阶段”的各个阶段并把她们领会成数据建立模型工作。   ·优先级三角:你不妨从以次三项中取两项极值:很高的品质、最短的功夫与最低的本钱,但你长久也别想三者一举多得。   ·真实的预算东西:“主体域处事量时间限制”按照运用步调的典型,决定每个数据建立模型阶段应占所有项手段百分比。“工作处事量东西”索取在“阶段—工作—东西”中决定的每项工作,并列出它们应占所有数据建立模型处事产物的百分比。这两个东西的拉拢可使你向名目司理供给一份具备确定透彻度的有理预算。   第六章:主体域领会   本章重要商量五个要害的东西,这五个东西对数据建立模型处事的主体域领会阶段有帮组效率。它们该当依照底下的程序被逐一实行:   1)主体域查看单:新运用步调中的主体域的完备列表,再有各个主体域的设置和同义词(或别号)。   2)主体域crud(create read update delete)矩阵:包括新运用步调和现有运用步调之间的主体域上面的分辨和反复之处,决定运用步调的范畴。   3)in-the-know模版:决定实行这个新运用步调的数据间模处事产物所须要的、被用作资源的职员和文书档案。   4)主体域家属树:包括每一个主体域的源运用步调和几何其余的要害消息,证明主体域数据未来自何处。   5)主体域力度矩阵:运用一个电子表格的方法,记载每一个襟怀和究竟主体域的颁布档次。   第六章:主体域建立模型   本章阐明三个队主体域消息举行建立模型的宏大东西:   ·“交易整理板”模子。   ·“运用步调整理板”模子。   ·“早期实际性查看”模子。   第七章:论理数据领会   本章关心四个论理数据领会东西,它们该当依照底下的步骤被运用:   1)数据元素家属树:包括运用步调的数据元素的完备列表,以及每个数据元素的根源和变幻消息,再有其余几个要害的数据元素元数据。   2)数据元素粒度矩阵:用一个电子表格的方法,来记载每个襟怀和究竟的颁布档次。   3)数据品质记载沙盘:展现每个数据元素的员数据和少许本质数据的比较。   4)数据品质确认沙盘:记载每个数据元素的元数据和少许本质数据的比较的截止。   第八章:典型化之旅和反向典型化存在指南(激烈引荐:是我暂时所读过最佳的联系型数据库的典型化本领文书档案)   典型化是一个剔除冗余并运用准则的进程,它的手段是为了更好的领会和表白生存于数据元素之间的依附性和介入性。典型化包括6个档次,最高层是第六范式(5nf)。普遍的本领文书档案上都觉得到达3nf即可,steve hoberman给咱们指领会更高的目的:5nf。graeme simsion写过一真名为《data modeling essentials》的书,在这该书中,他写道:“较高档次的范式常被在业者曲解并所以而被忽略,或为了扶助不真实的建立模型功夫而被援用。”然而,咱们须要领会那些较高档次的典型化,由于它们展现了特殊的典型化时机,并帮组咱们进一步缩小冗余消息、矫正安排的精巧性。纵然余下的三个典型化档次有大概只是爆发度数很少的变革,但它们仍旧具备少许普及精巧性和功效的时机。底下是bcnf&4nf&5nf的设置(比海内讲义上陈设的数学公式简单领会得多:[page_break]bcnf=3nf+底下的准则:   每一个数据元素都实足依附于键、所有键,并且除依附于这个键除外,不依附于任何其余数据元素。   4nf=3nf+底下的准则:   要把主键中具有三个或更多外建数据元素、切割特殊键之间不生存牵制的那些实业领会成两个或更多个实业。   5nf=4nf+底下的准则:   把主键中具有三个或更多的外键数据元素,且那些外键数据元素之间生存着牵制的实业领会变成一切的牵制都须要的多对多的联系。   当咱们攀上5nf的高峰后,再按照本质需要情景来举行“反向典型化”减少数据冗余,进而简化开拓,普及查问速率。反向典型化是如许一个进程:在设置了一个真实的、实足典型化了的数据构造之后,你借助这个进程,有采用地引入少许反复的数据,以激动特出本能需要的实行。steve hoberman的“反向典型化存在指南”给怎样符合减少冗余供给了一套可计划的评阅规范。经过参观每个联系的6个题目,累加各个题目的得分之后,当得分大于即是10时,咱们将对该联系举行反向典型化。   “反向典型化存在指南”的计分准则:   1.联系是什么典型的:该题目决定咱们所领会的联系的典型。父实业对于子实业具备怎么办的联系?   档次联系(20分)   一致联系(-10分)   决定联系(-20分)   2.介入率是几何:该题目决定一个联系中的每个实业的介入性。换句话说,对于一个给定的父实业数值,大约会有几个子实业数值?父与子的联系越逼近“一对一”,咱们对它举行反向典型化的时机就越大。   多达“一对五”的比例(20分)   多达“一对第一百货商店”的比例(-10分)   胜过“一对第一百货商店”的比例(-20分)   3.父实业中有几何个数据元素   少于10个数据元素(20分)   数据元素的数目介于10到20之间(-10分)   多于20个数据元素(-20分)   4.运用率是几何:当用户须要来自子的消息时,常常情景下,它们能否还须要来自父的消息呢?换句话说,这两个实业的啮合或关系水平怎样?   彼此之间的关系很强(30分)   彼此之间的关系较弱大概没相关联(-30分)   5.父实业时一个占位符吗:在不远的未来,咱们能否还安排向父实业介入更多的数据元素或联系?即使谜底是“不”,那么举行反向典型化的可行性就更强。   是(20分)   不(-20分)   6.变化对比例是几何:该题目是为了决定,在同一功夫周期内,两个实业的插入和革新的频度能否邻近。即使个中一个实业很少变革,而另一个实业却变化一再,那么,咱们就特殊目标于维持它们的典型化状况,把它们放在各自的表中。   沟通(20分)   各别(-20分)   “反向典型化存在指南”的运用本领:   1)把模子中的联系依照优先级排序   2)采用一个联系   3)对这个联系回复发问   4)即使得分即是或大于10,就举行反向典型化   5)归来办法二,直到实行一切的联系。   第九章:笼统化安定指南和组件   看过我的“浅谈数据库安排本领(上) ”的伙伴该当还牢记我举的第二个例子:网上电子商务平台上的商品消息表的安排。本章将我在上头例子中所用的本领飞腾到了表面阶段,沿用了面向东西的安排,将一切商品的公有属性索取出来,笼统成一个超类,再介入一个表来记载各个各别实业之间的详细来实行超类的派生,进而实行安排的精巧性。当展示底下两种前提的任何场所,笼统化都是极端有效的:   安排须要长久保护下来:诉求此后尽大概的不窜改数据库安排   需要大概爆发变革:运用步调的需要爆发变革,而诉求交易过程重组或举行功效晋级   数据堆栈:当新的分门别类典型从源运用步调中传过来时,咱们不必对数据堆栈的安排举行任何变换,而只需在分门别类典型实业介入一个新行即可   元数据仓库储存库:和数据堆栈的诉求一致   固然,笼统化会大大减少处事量和开拓的搀杂度,而人们常常关心的利害常短期的运用和暂时的本钱,而不关怀未来的高得多的本钱。以是,我特殊赞许赶快软硬件开拓这个看法:在首先简直不举行预先安排,然而一旦需要爆发变革,此时动作一名探求特出的步调员,该当从新查看所有框架结构安排,在此次窜改中安排出不妨满意遥远一致窜改的体例框架结构。   “笼统组件”即是袖珍的笼统模子片断,在很多的建立模型场所(不管是什么行业、构造,以至什么主体域的建立模型场所)中,它们都可被重复运用。在键模阶段屡次运用笼统化之后,你将发端看到展示的笼统化构造的趋向。那些“笼统组件”犹如下的手段:   加速安排速率   加速开拓速率   供给通用且有效的组织   第十章:数据模子粉饰本领   本章经过关心怎样矫正论理和物理数据模子的视觉表面,使咱们的安排胜过径直的运用步调需要。本章中计划了五个类型的粉饰本领:   论理数据元素陈设本领:那些本领是一个引荐的、对你的论理数据模子中的每一个实业的数据元素举行排序的本领。   物理数据元素排序本领:那些本领关心数据模子中每一个实业的最好构造。   实业构造本领:那些本领关心数据模子中的每一个实业的最好构造   联系构造本领:那些本领关心怎样安排臃肿的联系线条以及看上去穿梭(而不是绕过)无干实业的联系   招引提防力的本领:那些本领关心怎样在咱们的波及中超过的某些元素、实业或联系。   第十一章:筹备一个长盛不衰的数据建立模型生存   对数据建立模型者的十大警告清单:   1)记取:精巧性、精确性和后台   2)建立模型不过你的处事的第一小学局部   3)试验其余脚色   4)领会95/5准则:95%的功夫将耗费在5%的数据元素上   5)数据建立模型从不令人腻烦:即使你从来在做数据建立模型处事,并且创造本人常常感触腻烦,那么,你简直该变换一下了。这大概不是数据建立模型范围自己令人腻烦,而是你地方的一定的工作、公司或行业不复令人激动。浮夸一下,试验着道一个各别的名目或行业中举行数据建立模型处事吧!   6)站在本领前沿   7)尽管不要在模子上牵掣情绪成分:建立模型者必需领会,人们在政审进程中的看法并不是对准模子的创造者,而是对准这个模子的实质。即那句古语:对事不对人。   8)让你的创作力打开党羽:在商量记载数据需乞降矫正安排的新本领时,重要大概有创作性。有创作性大概就表示着窜改该书中的某些东西。这还大概表示着提出你本人的电子表格或其余东西。   9)简单的表面太高贵了:在安排震动进程中,你要保证把这个看法铭记在意。为这个运用步调掏荷包的部分和构造憧憬看到的是能看得着的适用截止。   10)变成一个了不得的会讲故事的人:动作一名数据建立模型者,讲故事是处事的一个很要害的局部。为了帮组熏陶和感化名目司理以及对咱们行业不足领会的其余人,咱们须要讲故事或趣闻。   结果,我部分感触,steve hoberman所提出的“笼统组件”的看法和面向东西安排中的的“安排形式”特殊一致。即数据库大师在屡次的数据建立模型后,将各个名目中的一致局部笼统化,索取出一定的建立模型模子片断,此后只需在新的名目中对那些模子片断细化派生,即可赶快建立出符合于该项手段数据库框架结构。然而,那些建立模型模子片断并没有一致,产生规范,暂时也没有出书这类的书本。自己正在连接归纳本人在这上面的体味,然而自知程度有限,不敢在高人眼前布鼓雷门,只蓄意本人遥远连接颁布的关系作品能起到抛转引玉的效率,篡夺由华夏的步调员率先一致出数据建立模型范围的“安排形式”。

热门阅览

最新排行

Copyright © 2019-2021 大雀软件园(www.daque.cn) All Rights Reserved.