36大数据中国行9月10日相约杭州,西湖论数据。读者QQ群②:190771709,投稿请发dashuju36@qq.com

36大数据

我要投稿

大数据动向

分类算法之朴素贝叶斯(NaiveBayes)

数控小V   2016-08-26   算法

作者:程Sir 本文由 程SIR说 授权发布,版权所有归作者,转载请联系作者! 我个人认为,在数据挖掘领域,分类算法是最为重要。它根据以往的数据来对新的数据做预测。垃圾邮件判断,潜在用户...

阅读全文

机器学习应用实例|如何识别标题党?

数控小V   2016-08-26   机器学习

作者:沈浩老师  译者:李莹璇 相信你也遇到过这样的情况:怀着犹如探秘般万分期待的心情,点开一篇文章,结果却发现又一次中了“标题党”的诱饵,成功上钩。这种现象,在国际有一个形象的名...

阅读全文

YARN 设计理念与基本架构

数控小V   2016-08-26   Hadoop

作者:牛肉圆粉不加葱 本文由 简书 牛肉圆粉不加葱 授权发布,版权所有归作者,转载请联系作者! YARN 的基本组成结构 1. ResourceManager ResourceManager 是一个全局的资源管理器,负责整...

阅读全文

从内容/用户画像到如何做算法研发

雪姬   2016-08-25   评论

作者:祝威廉 本文由 简书 祝威廉 授权发布,版权所有归作者,转载请联系作者! 中午和一前同事一起用餐,发现还是有很多碰撞点的。交流了很多正在做的事情, 对方也提供了非常多的思想值得...

阅读全文

如何做Spark 版本兼容

雪姬   2016-08-25   Spark

作者:祝威廉 本文由 简书祝威廉 授权发布,版权所有归作者,转载请联系作者! 我们知道Spark2.0 ,Spark 1.6还有Spark 1.5 三者之间版本是不兼容的,尤其是一些内部API变化比较大。如果你...

阅读全文

未来大数据仍将在中国大行其道

数控小V   2016-08-25   大数据动向

日前,Gartner发布了“新兴科技技术成熟度曲线报告”,针对全球超过2000种最科技进行了汇总、分析,得出了未来新科技发展的三大特点分别是:透明沉浸式体验(transparently immersive experien...

阅读全文

SQL SERVER全面优化——-索引有多重要?

数控小V   2016-08-24   数据库

作者:KK 想了好久索引的重要性应该怎么写?讲原理结构?我估计大部分人不愿意看,也不愿意花那么多时间仔细研究。光写应用?感觉不明白原理一样不会用。举例说明?情况太多也写不全….到...

阅读全文

Spark 2.0 Structured Streaming 分析

雪姬   2016-08-24   Spark

作者:祝威廉 本文由 简书 祝威廉 授权发布,版权所有归作者,转载请联系作者! 前言 Spark 2.0 将流式计算也统一到DataFrame里去了,提出了Structured Streaming的概念,将数据源映射为一...

阅读全文

多途径提升AWS EBS性能

雪姬   2016-08-24   云计算

作者:Stephen J. Bigelow翻译:蒋红冰 我们的团队一起在认真筛选我们EBS卷,但我们的应用性能却一直直在下坡路上。企业要如何改进亚马逊ESB的性能? 选择亚马逊弹性块存储(ESB)卷的类型还不...

阅读全文

携程基于Storm的实时大数据平台实践

莫扎特   2016-08-23   干货教程

作者:张翼 本文讲解了携程在实时数据平台的一些实践,按照时间顺序来说明我们是怎么一步一步构建起这个实时数据平台的,目前有一些什么新的尝试,未来的方向是怎么样的,希望对需要构建实...

阅读全文

教你快速做出:文字云图

莫扎特   2016-08-23   干货教程

作者: 梅沙科技 兰军 今天凌晨五点半起来,赶去机场,飞三亚,开一个需求评审会,9点半赶到三亚合作伙伴的会议室,同行的同事说,原来可以这样打飞的上班。 其实出差也很忙,上午开会碰需...

阅读全文