爱八卦的谈姐又带来了独家热乎的挨踢圈儿内线消息:咱河南也要“挖湖”了!
真的,这个“湖”建好了,北龙湖、如意湖、龙子湖都要靠边站!
谈姐何以得知呢,因为今天,北京易华录信息技术股份有限公司董事长林拥军就来到了郑州龙子湖智慧岛,与河南信息产业投资运营主体河南信产投沟通“数据湖”项目事宜。
北京易华录信息技术股份有限公司董事长 林拥军(左三)
“数据湖”究竟是什么,缘何如此重要呢?且听谈姐慢慢道来。
后来,为了更有效率的记事和工作,数据库出现了。数据库核心是满足快速的增删改查,应对联机事务。
比如你用银卡消费了,后台数据库就要快速记下这笔交易,更新你的卡余额。
日子久了,人们发现,库里的数据越来越多了,不光要支持联机业务,还有分析的价值。
但是,传统数据库要满足频繁、快速的读写需求,并不适合这种以读取大量数据为特征的分析业务。
于是,人们在现有的数据库基础上,对数据进行加工。这个加工过程,被称为:“ETL” 图片? 抽取Extract、清洗转换Transform、加载Load
经过这三步,数据仓库就建好了。
这个“仓库”,主要是为了数据分析用途,比如用于BI、出报表、做经营分析等等。
简要总结下:数据库用于联机事务,通常为小数据量高频读写。
数据库等原始数据,经过ETL加工以后,就被装进了数据仓库。
数据仓库主要用于联机分析业务,通常为大数据量读取。
虽然应用场景不一样,但他们都是结构化数据。
在相当长的一段时间内,他们联合起来,共同满足企业的实时“交易”型业务和联机“分析性”的业务。
随着时代的发展,数据的类型越来越多,人们对数据的需求也越来越复杂。
企业越来越看重这些“大数据”的价值,希望把他们存好、用好。
这些数据,五花八门,又多又杂,怎么存呢?
索性挖个大坑吧!
这就是数据湖的原型。
说白了,数据湖就像一个“大水坑”,是一种把各类异构数据进行集中存储的架构。
你可能会问,为什么不是数据河Data River?
因为,数据要能存,而不是一江春水向东流。
你可能又要问,为什么不是数据池Data Pool?
因为,要足够大,大数据太大,一池存不下。
可能还有人会问,为什么不是数据海Data Sea?
因为,企业的数据要有边界,可以流通和交换,但更注重隐私和安全,“海到无边天作岸”,那可不行。
so,数据湖,Data Lake,刚刚好。
其实,牵手河南信产投建设数据湖,早就不是什么商业秘密,而是易华录一直以来毫不掩饰的“阳谋”。
为进一步开阔干部职工前瞻视野,全力以赴为鲲鹏产业生态链项目的顺利实施保驾护航。6月12日,在新乡市高新区举行知识大讲堂培训会。中原鲲鹏生态创新中心CTO、华为技术有限公司云与计算高级专家彭浩受邀进行宣讲。新乡市高新区管委会全体干部职工,关堤乡、振中街道办事处班子成员参加培训。会上,彭浩以《鲲鹏展翅,开启新乡计算新时代》为题,与新乡实际情况相结合,从鲲鹏创新中心简介、行业发展趋势、鲲鹏生态战略简介、
路灯可根据空气的能见度自动调节亮度,自动抓取汽车品牌、车牌号码和颜色等信息,并在5G支持下进行实时监控……这是2020华为开发者大会上,中原鲲鹏生态创新中心展示的基于鲲鹏计算平台的智慧城市解决方案。作为华为每年一度、规模最大的全球性交流会议,华为开发者大会备受瞩目。在最近举行的2020华为开发者大会上,中原鲲鹏生态创新中心作为全国创新中心的唯一代表亮相,分享成立半年多以来的建设成果和运营经验。