读者QQ群②:190771709,投稿请发dashuju36@qq.com

36大数据

我要投稿

所有文章 第2页

你不能不知道的14个大数据专业词汇

数据有意思   2017-07-26   大数据百科

随着大数据技术的不断提高,大数据应用的不断普及,大数据与各行各业的关系越来越紧密。大数据行业充斥着大量的专业词汇,准确掌握和了解这些词汇的含义,有助于更好的理解大数据,更好地利...

阅读全文

机器学习特征工程技巧

蝙蝠侠   2017-07-26   机器学习

1. 数值变量标准化 不同数据的Scale不一样,所以需要标准化。比如身高和体重。 不做标准化,有些算法会死得很惨,比如SVM、神经网络、K-means之类。标准化的一种方法是均值方差法。 不是什...

阅读全文

用数据的方式来撕逼:LOL vs DOTA2

蝙蝠侠   2017-07-26   数据分析

文:何求知 我写这篇文章的时候克服了两个困难: LOL和DOTA2撕了这么多年,读者是身经百战见的多了,很容易产生审美疲劳。——好在本文大规模使用了数据分析武器,目的就是打造一个全新的战...

阅读全文

数据可视化专家的七个秘密

数据有意思   2017-07-26   数据可视化

作者:圆脸咪咪 数据可视化的道路上充满了不可见的陷阱和迷宫,最近ClearStory Data的两位数据可视化开发人员分享了他们总结出来的数据可视化开发的7个不宣之秘,普通开发者了解这些方法能...

阅读全文

一文看懂HIVE和HBASE的区别

大象会跳舞   2017-07-26   大数据技术

两者分别是什么? Apache Hive是一个构建在hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被转化为Map/Reduce. 虽然Hive...

阅读全文

Hadoop工具如何形成SAP Hana的大数据平台

蝙蝠侠   2017-07-26   Hadoop

自2008年以来,SAP Hana一直是领先的数据库管理系统之一。它比许多其他数据库管理解决方案能够更有效地处理数据,主要是因为它可以使用一些最先进的hadoop工具。没有Hadoop,大多数SAP Hana...

阅读全文

算法王国

雪姬   2017-07-25   算法

作者:侯韵楚 刘燕 今年年初,两件事吸引到那些正持续关注全球人工智能发展的人们。其一是微软的高管陆奇在 1 月表示,自行车事故之后,他将不再回到这家全球最大的软件公司任职,而将担任...

阅读全文

浅谈分布式事务

雪姬   2017-07-25   大数据技术

作者:张松然 现今互联网界,分布式系统和微服务架构盛行。一个简单操作,在服务端非常可能是由多个服务和数据库实例协同完成的。在一致性要求较高的场景下,多个独立操作之间的一致性问题...

阅读全文