读者QQ群②:190771709,投稿请发dashuju36@qq.com
我要投稿

大数据技术

kafka 数据可靠性深度解读

数据有意思   2017-06-23

作者:朱小厮 1 概述 Kakfa起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理...

阅读全文

剖析大数据平台的数据源

雪姬   2017-06-23

作者:张逸 我在一次社区活动中做过一次分享,演讲题目为《大数据平台架构技术选型与场景运用》。在演讲中,我主要分析了大数据平台架构的生态环境,并主要以数据源、数据采集、数据存储与...

阅读全文

漫谈数据质量监控

蝙蝠侠   2017-06-20

作者:dantezhao | 简书 | CSDN | GITHUB 文章推荐:http://dantezhao.com/readme 个人主页:http://dantezhao.com 0x00 前言 往往那些不起眼的功能,最能毁掉你的工作成果。 本篇分享一些...

阅读全文

数据仓库的多维数据模型

小狼   2017-06-20

作者:joeghwu 可能很多人理解的数据仓库就是基于多维数据模型构建,用于OLAP的数据平台,通过上一篇文章——数据仓库的基本架构,我们已经看到数据仓库的应用可能远不止这些。但不得不承认多...

阅读全文

为什么选择这样的大数据平台架构?

小数点   2017-06-19

作者:傅一平 当前BAT基本公开了其大数据平台架构,从网上也能查询到一些资料,关于大数据平台的各类技术介绍也不少,但在那个机制、那个环境、那个人才、那个薪酬体系下,对于传统企业,可...

阅读全文

自然语言处理第一番之文本分类器

雪姬   2017-06-19

前言 文本分类应该是自然语言处理中最普遍的一个应用,例如文章自动分类、邮件自动分类、垃圾邮件识别、用户情感分类等等,在生活中有很多例子,这篇文章主要从传统和深度学习两块来解释下...

阅读全文

Google Analytics 360 Suite到底是什么?

招聘办女秘书   2017-06-13

作者:欧阳辰 谷歌推出Google Analytics 360套件:为广告主而生的数据服务 2016年,3月15日,中国人打假的日子,谷歌却发布全新的数据服务Google Analytics 360 套件,为广告主和网站更优...

阅读全文

全栈必备 Log日志

招聘办女秘书   2017-06-12

Log日志,不论对开发者自身,还是对软件系统乃至产品服务都是非常重要的事情。每个开发者都接触过日志,以至于每个人对日志的了解都会有所不同。 什么是日志 日志是什么呢?老码农看来,日...

阅读全文

浅谈知识图谱的构建与应用

大象会跳舞   2017-06-09

作者:51AntiFraud 自从2012年Google推出自己第一版知识图谱以来,各大互联网企业也纷纷推出了自己的知识图谱产品。知识图谱是把所有不同种类的信息连接在一起而得到的一个关系网络,它提供...

阅读全文

小米云深度学习平台的架构设计与实现

小数点   2017-06-09

​ 作者:陈迪豪 深度学习服务介绍 机器学习与人工智能,相信大家已经耳熟能详,随着大规模标记数据的积累、神经网络算法的成熟以及高性能通用GPU的推广,深度学习逐渐成为计算机专家以及大数...

阅读全文

什么是实践中真正在用的数据科学系统?

小狼   2017-06-01

作者:Mikio Braun 在过去的几年间,数据科学这个概念已经被非常多的行业所接受。数据科学(源自于一个科学研究课题)最早是来自于一些试图去理解人类的智能并创造人工智能的科学家,但现在它...

阅读全文

为异构的大数据运行环境构建数据管道

蝙蝠侠   2017-05-27

作者:Dongyao Wu Liming Zhu 等 Pipeline61框架可以用于为异构的运行环境构建数据管道。它可以重用已经部署在各个环境里的作业代码,并提供了版本控制和依赖管理来解决典型的软件工程问题...

阅读全文

Apache Hive中如何进行分区

小数点   2017-05-22

译者:CY2 Hive 是用于大数据集查询的好工具 —— 特别是当数据集需要全表扫描时。但用户经常需要对某个列的值进行过滤,这时候分区就非常有效。分区是一个包含数据块的目录。当我们做分区的...

阅读全文

TensorFlow技术主管:团队如何管理开源项目

数据有意思   2017-05-19

作者:Pete Warden|TensorFlow Mobile 团队的技术主管 TensorFlow 技术主管在这篇文章中和我们分享了他们团队管理开源项目的经验。 开源不仅仅是把代码贡献出来然后希望有人来使用它。我也...

阅读全文

工作职位推荐系统的算法与架构

数据有意思   2017-05-18

作者:Preetha Appan Indeed.com 每个月有两亿不同的访客,有每天处理数亿次请求的推荐引擎。在这篇文章里,我们将描述我们的推荐引擎是如何演化的,如何从最初的基于Apache Mahout建立的最...

阅读全文