使用Kudu构建统一实时数据分析服务的方法
长期专注于Hadoop生态的分布式计算框架,Hadoop,Hive和Kudu等多个项目的贡献者,HaodoopNativetask项目发起者。华中科技大学硕士毕业,后在百度搭建数据分析平台以及Hadoop开发,目前在小米利用Impala和Kudu搭建实时数据分析服务。
议题:使用Kudu构建统一实时数据分析服务
Kudu是2015年Cloudera最新公布的开源项目,弥补了在线事务处理(OLTP)和在线分析(OLAP)之前的空白,本演讲将介绍Kudu的设计思想,已经如何利用Kudu简化实时数据分析的架构,提高查询性能。小米作为Kudu最早的用户,分享把kudu整合到现有的Hadoop平台的经验,以及云服务化的一些展望。
PPT下载:event.chinahadoop.com/download.php?r_id=1&t=ppt&f=19-pm-85-changbinglin.pdf
音频下载:event.chinahadoop.com/download.php?r_id=1&t=audio&f=19-pm-85-changbinglin.mp3
中国Hadoop大数据峰会2016上海站现已启动,议题征集中。
征集但不限于下列内容:
大数据生态系统 大数据安全;存储;YARN;HDFS命名空间等;
大数据与工业4.0 电力、电网、能源、炼钢等;
大数据与电子商务 国内互联网主流电商企业应用与架构分享
金融大数据 银行、证券、个人征信、企业征信、量化投资与大数据
智慧城市与大数据 交通、医疗、安防、税务工商、旅游等
计算引擎与实时计算 Spark、Tez、Impala、Flink、Google Mesa、Storm、Fafka等
大数据即服务 Azure、AWS、阿里云、Docker/Container、Mesos等
NewSQL/NoSQL HBase/Druid;MongoDB/CouchDB;VoltDB;SequaioDB;Hana等
数据挖掘与图计算 R语言、GraphLab、GraphX、OrientDB等
数据仓库与可视化 EBay Kylin、LinkedIn Cubert、QlikView、Tableaue等
大数据创业与融投资 分享大数据领域的创业团队和故事
1 条回复
[…] 使用Kudu构建统一实时数据分析服务 […]