读者QQ群②:190771709,投稿请发dashuju36@qq.com
我要投稿

大数据技术

MySQL 向 GraphQL 迁移

小狼   2017-08-17

GraphQL 是一个开源的图形数据库(基于Node.js实现), 中文文档: https://graphql.js.cool/ sequelize-auto 将 MySQL 数据库转变成模型 [node] sequelize-auto -h <host> -d <databa...

阅读全文

如何提高数据质量?

大象会跳舞   2017-08-17

作者:KPMG大数据挖掘 摘要:大数据时代带来了海量、多样、非结构化的数据,我们得以进行更加广泛且深入的分析,但这必须建立在高质量的数据上才有意义。本期以企业级的视角,介绍数据质量...

阅读全文

dataWrangler简介及使用方法

小数点   2017-08-17

作者:陈寻 1. 工具简介 dataWrangler是一款由斯坦福大学开发的在线数据清洗、数据重组软件。主要用于去除无效数据,将数据整理成用户需要格式等。通过使用dataWrangler能节约用户花在数据...

阅读全文

Python垃圾回收机制 总结

小数点   2017-08-16

作者:banananana Python 垃圾回收机制 内存管理 Python中的内存管理机制的层次结构提供了4层,其中最底层则是C运行的malloc和free接口,往上的三层才是由Python实现并且维护的,第一层则...

阅读全文

一小时建立数据分析平台

小数点   2017-08-16

作者:运营大湿兄 摘要:优秀的数据分析平台,首先要满足数据查询、统计、多维分析、数据报表等功能。可惜很多分析师,工作的第一年,都是埋葬在SQL语句中,以SQL+Excel的形式完成工作,却...

阅读全文

API设计原则

雪姬   2017-08-14

作者:李鼎 译序 Qt的设计水准在业界很有口碑,一致、易于掌握和强大的API是Qt最著名的优点之一。此文既是Qt官网上的API设计指导准则,也是Qt在API设计上的实践总结。虽然Qt用的是C++,但其...

阅读全文

深藏不露,挖掘4种大脑网络中的管理工具

小数点   2017-08-11

作者:亚当·韦茨,莉亚·梅森 走过了百余年发展历程的管理理论与实践,自身体系正在不断深化与创新,其中一个重要领域是对脑神经科学成果的利用。 虽然柯洁以0:3败给了AlphaGo,虽然人工智能...

阅读全文

IT公司如何构建数据科学部门?答案在这里

数据有意思   2017-08-11

作者:问天鼓 很多牛逼的公司都宣称在建立数据科学部门,这个部门该如何组建,大家都在摸石头过河 O‘reilly Strata今年 六月份发布了报告 《Analyzing the Analyzers》,比较清晰的阐述了数...

阅读全文

0到1再到100 蘑菇街搜索与推荐架构的探索之路

大象会跳舞   2017-08-10

作者:丁小明 丁小明,花名小宝,蘑菇街搜索技术团队负责人。2011年底加入蘑菇街,2013年开始负责搜索团队,见证了蘑菇街一路蓬勃发展的历程,也和团队一起从零起步摸爬滚打,打造了蘑菇街...

阅读全文

Apache Kafka:大数据的实时处理时代

大象会跳舞   2017-08-09

作者|王国璋 在过去几年,对于 Apache Kafka 的使用范畴已经远不仅是分布式的消息系统:我们可以将每一次用户点击,每一个数据库更改,每一条日志的生成,都转化成实时的结构化数据流,更...

阅读全文

数据预处理——是脏活、累活,却也价值无限

数据有意思   2017-08-08

作者: 脑极体 当有大企业为数据进行争论时,我们再一次感慨数据的价值。自从大数据一词被提出之后,我们无时无刻不再提醒着自己,累积了越多的数据,就越能手握金矿。在机器学习、深度神经...

阅读全文

IP负载与DR负载的实现原理与简单示例

蝙蝠侠   2017-08-07

作者: 蓝胖子 概述 负载均衡作为目前服务器集群部署的一款常用设备,当一台机器性能无法满足业务的增长需求时,不是去找一款性能更好的机器,而是通过负载均衡,利用集群来满足客户增长的...

阅读全文

实现数据科学研究结果可复制的十条规则

大象会跳舞   2017-08-07

文 | 车品觉 近年来,有越来越多的迹象表明,科研结果的可复现性出现了危机。对心理学和癌症生物学论文的检查发现,分别只有40%和10%的结果是可复现的。 《自然》杂志在2016年对科研人员的...

阅读全文

伪数据科学家 VS 真数据科学家

小数点   2017-08-04

如今数据科学书籍、认证和文凭,如雨后春笋般层出不穷。但许多仅仅是镜花水月:许多人钻了这一新名词的空子,将旧酒(比如统计学和R编程)放在了“数据科学”这个新瓶里。本文选自《数据天才...

阅读全文