演讲嘉宾:许杨毅(新浪网研发中心系统架构师)
个人简介: 许杨毅,新浪网研发中心系统架构师,14年互联网系统平台工作经验,目前负责新浪研发中心的各类系统平台的架构优化和技术组织工作。
包括新浪微博敏捷运维体系的建立和平台架构优化,数据体系工程,视频整体系统架构的质量改进/优化工作。
演讲题目:借助HADOOP实现新浪微博的敏捷运维
演讲简介: Sina内部名为DIP的 数据分析平台是基于 Hadoop、Hive 等软件所构建的大数据分析平台,主要用于新浪各种产品的日志存储,质量、性能数据的分析,监控数据分析等用途。
依托DIP平台(HADOOP, HIVE, HBASE,KAFKA)我们进行了微博服务平台运维的优化工程。
在这个工程里面,我们主要进行了两个方面的工作.
第一:怎样有效的判断超大型业务系统的运行状 态。
微博服务平台有数万台各类设备,部署在全国多个IDC,是一个超大型的业务系统,在其上部署了非常复杂的各种业务逻辑架构。
我们通过DIP平台来准实时/离线的搜集各个业务监控平面的指标,通过业务指标的模式分析,建立业务运行的健康和监控标准(这一平台在新浪内部被称为SinaBench)。
再通过实时或者准实时对系统运行指标的多维提取 (异常值、告警区间,多维分析的漏斗模型 )来进行业务异常状态的 自动化发现。最后接入新浪的告警系统(SinaWatch)
第二:提升故障管理的效率。
自动发现各个监控平面和业务环节的异常后,利用 这些异常事件来快速定位和解决故障的问题随之而来。这一方面我们也用到了DIP的大数据处理能力(HADOOP+图计算框架)。
通过业务数据,我们能够进行业务整体的全拓扑分 析,自动建立故障事件的告警路径,再进行可视化回溯分析来快速定位。
|