读者QQ群③:168129342,投稿请发dashuju36@qq.com
我要投稿

标签:Hadoop

Hbase 技术细节笔记(上)

小数点   2017-09-30   大数据技术

前言 最近在跟进Hbase的相关工作,由于之前对Hbase并不怎么了解,因此系统地学习了下Hbase,为了加深对Hbase的理解,对相关知识点做了笔记,并在组内进行了Hbase相关技术的分享,由于Hbase...

阅读全文

10道Hadoop面试真题及解题思路

小数点   2017-09-28   Hadoop

(一)海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采...

阅读全文

关于 Hadoop 你需要知道的一些事项

小数点   2017-09-19   Hadoop

作者:Ian Barker 除非你过去几年一直隐居,远离这个计算机的世界,否则你不可能没有听过Hadoop。 全名Apache Hadoop,是一个在通用低成本的硬件上处理存储和大规模并行计算的一个开源框架。...

阅读全文

基于Hadoop大数据分析应用场景与实战

小数点   2017-09-18   Hadoop

作者:王雷 为了满足日益增长的业务变化,京东的京麦团队在京东大数据平台的基础上,采用了Hadoop等热门的开源大数据计算引擎,打造了一款为京东运营和产品提供决策性的数据类产品-北斗平台...

阅读全文

干货:c与大数据开发实践

小数点   2017-09-08   干货教程

作者:Glenn De Backer 大数据是使用工具和技术处理大量和复杂数据集合的术语。能够处理大量数据的技术称为MapReduce。 何时使用MapReduce MapReduce特别适合涉及大量数据的问题。它通过将...

阅读全文

有助于你掌握机器学习的十三个框架

小数点   2017-09-07   机器学习

作者:Serdar Yegulalp 在过去的一年里,机器学习炙手可热。机器学习的“突然”降临,并不单纯因为廉价的云环境和更强有力的GPU硬件。也因为开放源码框架的爆炸式增长,这些框架将机器学习中...

阅读全文

从头开始:用Python实现随机森林算法

小数点   2017-08-24   Python

拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱。bagging(bootstrap aggregating 的缩写)算法从训练数据的样本中建立复合模型,可以有效降低决策树的...

阅读全文

数据架构简史:转换中的范式

小数点   2017-08-23   大数据技术

据架构是一系列决定收集哪些数据,如何在数据库系统中使用、处理和存储数据的规则、策略以及模型。例如,数据集成是依赖于数据架构用于集成过程中的指令。如果没有从编程范式转换到数据架构...

阅读全文

一分钟让你知道Hadoop是什么

小数点   2017-08-22   Hadoop

作者:kkdelta hadoop是什么?Hadoop是一种分析和处理大数据的软件平台,是Appach的一个用Java语言所实现的开源软件的加框,在大量计算机组成的集群当中实现了对于海量的数据进行的分布式计...

阅读全文

再见Hadoop之父,大数据应用新认知

图表大师   2017-08-18   Hadoop

作者:宋家雨 前不久,有机会再次见到hadoop之父–Doug Cutting先生,与2014年见面稍有不同的是,这次Doug Cutting先生身份变为了Cloudera首席架构师。结合Hadoop、大数据和人工智能等...

阅读全文

最全的运营数据指标解读

图表大师   2017-08-14   大数据百科

作者:秦路 数据分析涉及不同的业务领域,很多时候,业务的了解比数据技巧更重要。很多新人常问Python、SQL,但鲜有问业务,可后者才决定分析的成败。 业务的洞悉决定了数据分析师发展的上...

阅读全文