按月归档 十二月 2015

大数据预测 应用 0

大数据预测雾霾以及存在的商机

近段时间,全国范围内尤其是京津冀地区接连陷入雾霾之困,北京更是频频发布空气重污染红色预警,中小学连续停课,机动车单双号限行。雾霾的背后,重污染天气的预警预测工作显得尤为重要,不仅可以让公众提前合理安排...

java 应用 0

25个Java机器学习工具&库

本列表总结了25个Java机器学习工具&库: 1. Weka集成了数据挖掘工作的机器学习算法。这些算法可以直接应用于一个数据集上或者你可以自己编写代码来调用。Weka包括一系列的工具,如数据预...

Hadoop 技术 0

Hadoop中的Python框架的使用指南

最近,我加入了Cloudera,在这之前,我在计算生物学/基因组学上已经工作了差不多10年。我的分析工作主要是利用Python语言和它 很棒的科学计算栈 来进行的。但Apache Hadoop的生态系...

年终总结 行业 0

程序猿的年终总结,各种版本各种残

1 朱自清版   这几天心里颇不宁静了,眼看上线的日子越来越临近,而项目Bug之多,密密的交叉着,却无从改起,于是想法纠结乱麻了一片……???这样想着,猛一抬头,...

数据分析 行业 0

国内数据分析“七宗罪”

每一个做过调研的人,都会惊讶于中美两国在大数据分析理念和客户心态上的巨大差别。   “企业数据分析,中美在理念方面相差2-3年,而在实际执行层面或许有5年左右的差距。&rdquo...

正态分布 技术 0

正态分布的前世今生(上)

神说,要有正态分布,就有了正态分布。 神看正态分布是好的,就让随机误差服从了正态分布。 创世纪—数理统计 1. 正态分布,熟悉的陌生人 学过基础统计学的同学大都对正态分布非常熟悉。这个钟形...

垃圾短信 行业 0

垃圾短信相关用户细分方案

茹志强,数据分析与挖掘老兵,有6年的通讯行业数据分析工作经验。曾因为备考研究生,通过人大经济论坛接触到数据分析行业,从此入行。闲时喜欢阅读和运动。 垃圾短信是困扰很多用户的问题。其实通讯公司也曾通过一...

Unix 技术 0

一个涵盖 Unix 44 年进化史的版本仓库

摘要 Unix 操作系统的进化历史,可以从一个版本控制仓库中窥见,时间跨度从 1972 年的 5000 行内核代码开始,到 2015 年成为一个含有 26,000,000 行代码的被广泛使用的系统。该...