{原Hadoop中国云计算大会 Originally Hadoop in China Conference}

演讲嘉宾

演讲嘉宾:李杰(Pinterest从事大数据工作)


个人简介:现在全球最大图片分享网站之一的Pinterest从事大数据工作, 负责集成Amazon Redshift以支持交互式数据分析和BI。 之前Hortonworks实习并参与Apache Pig的开发与优化。 在Duke攻读计算机硕士学位期间, 参与了Starfish项目以优化Hadoop性能。本科毕业于浙江大学。

演讲题目:从Hive到Redshift: 开启Pinterest的交互式数据分析

内容简介:作为全球最大的图片社交网站之一,Pinterest在AWS Cloud上搭建了Petabyte级别的Data Pipeline,用于分析用户行为,A/B试验,以及个性化推荐。作为Data Infra组的第二位成员,我将详细介绍我们如何通过Amazon最近推出的数据仓库Redshift来实现交互式的数据分析。目前我们搭建了一套稳定的ETL作业, 已将近百TB级的核心数据从Hive导入Redshift, 数据分析的性能超越Hive近50到100倍,具有很高的实时性。我将重点讨论我们在实践中遇到的一些关键问题,如大数据导入,性能优化,数据一致性,用户资源分配,以及我们的有效解决方案。在仅一名数据工程师每周少于5小时的管理下,Redshift已逐渐成为Pinterest数据分析的核心工具。

参会与报名


2013年11月1日前购票

个人票¥1200元起
团体票¥1100元起

购票热线:010-59418088

商务合作:010-57182020

媒体咨询:010-57182020

大会邮箱:info@chinahadoop.com


主办单位

承办单位

协办单位

战略合作媒体

特邀支持单位

学术支持机构

战略合作社区



创投支持单位

支持媒体