来自eBay的分布式实时Hadoop数据安全引擎
蒋吉麟 eBaySoftware Engineer
个人简介:
蒋吉麟,Apache Eagle Committer 和PMC 成员。eBay 分析平台基础架构部门高级软件工程师,负责Hadoop相关前端开发工作。
赵晴雯 eBay Software engineer
个人简介:
赵晴雯,Apache Eagle Committer和PMC成员,eBay分析平台基础架构部门软件工程师,负责Eagle的后台软件开发。
演讲主题:来自eBay的分布式实时Hadoop数据安全引擎
Eagle面临的挑战:
大数据时代背景下,各种大型分布式系统例如Hadoop,Spark等层出不穷,企业监控这些系统的挑战也愈加严峻,同时对新一代的监控系统提出了更高的要求。
Eagle 解决的痛点:
监控如此大量的数据,因而要求Eagle能够拥有分布式并行计算能力
随着业务发展被监控集群不断扩容,同时监控策略也会越来越多,因而要求Eagle可动态可伸缩作为预警系统,因而要求Eagle做到高度实时,高稳定,同时易扩展和维护
Eagle的设计思路以及原理:
高实时:Eagle 如何基于Apache Kafka,Apache Storm等开源项目打造新一代大型实时监控系统
易用性:Eagle如何设计在支持强大分布式实时计算计算能力的同时提供非常类SQL接口的分布式策略引擎
高可用:Eagle如何做到容错机制,如何管理状态,如何保证消息AT-LEAST-ONCE的语义,如何保证fail-over后消息不丢失
可伸缩:Eagle如何在面临数据量增长的情况下保证易于伸缩,包括数据流,策略等,同时如何保证数据分流中的平衡
易扩展:作为监控易用性非常关键,Eagle目前专注于Hadoop监控,但我们始终相信Eagle的分布式实时监控框架能够适用于更多更加通用的监控场景
智能性:Eagle 默认支持基于预定义规则的预警引擎,但是也在不断探索如何集成机器学习的基于训练模型的动态规则来实现异常预警。
Eagle的使用场景:
大数据平台下的数据安全监控
针对复杂大型系统的高性能实时监控
基于分布式规则引擎的异常检测和预警
Eagle的开源:
Eagle 进入Apache的开源历程
Eagle的社区发展方向,希望更多拥有相同痛点同行一起加入打造新一代的监控平台。
PPT下载:event.chinahadoop.com/download.php?r_id=1&t=ppt&f=19-pm-84-jiangjilin-zhaoqinwen1.pdf
event.chinahadoop.com/download.php?r_id=1&t=ppt&f=19-pm-84-jiangjilin-zhaoqinwen2.pdf
音频下载:event.chinahadoop.com/download.php?r_id=1&t=audio&f=19-pm-84-jiangjilin-zhaoqinwen.mp3
中国Hadoop大数据峰会2016上海站现已启动,议题征集中。
征集但不限于下列内容:
大数据生态系统 大数据安全;存储;YARN;HDFS命名空间等;
大数据与工业4.0 电力、电网、能源、炼钢等;
大数据与电子商务 国内互联网主流电商企业应用与架构分享
金融大数据 银行、证券、个人征信、企业征信、量化投资与大数据
智慧城市与大数据 交通、医疗、安防、税务工商、旅游等
计算引擎与实时计算 Spark、Tez、Impala、Flink、Google Mesa、Storm、Fafka等
大数据即服务 Azure、AWS、阿里云、Docker/Container、Mesos等
NewSQL/NoSQL HBase/Druid;MongoDB/CouchDB;VoltDB;SequaioDB;Hana等
数据挖掘与图计算 R语言、GraphLab、GraphX、OrientDB等
数据仓库与可视化 EBay Kylin、LinkedIn Cubert、QlikView、Tableaue等
大数据创业与融投资 分享大数据领域的创业团队和故事