读者QQ群②:190771709,投稿请发dashuju36@qq.com
我要投稿

干货教程

干货 | 36个大数据文档PDF开放下载

小数点   2017-06-14

1.大数据背后的价值:饿了么数据仓库治理及数据应用——徐梦云 下载:大数据背后的价值:饿了么数据仓库治理及数据应用——徐梦云.pdf 2.大数据背后的价值:腾讯游戏大数据应用——邓大付 下载:...

阅读全文

资深程序员总结的成功十大黄金定律

小狼   2017-06-07

《天下无贼》中由葛优饰演的黎叔曾说过一句话:“21世界什么最贵?——人才最贵。”人才对成功来说至关重要,而且人才和天才还是不一样的,天才大部分是要有天赋的,而人才即使你没有天赋,遵照...

阅读全文

携程如何从海量数据中构建精准用户画像?

雪姬   2017-06-01

文 | 周源 用户画像作为“大数据”的核心组成部分,在众多互联网公司中一直有其独特的地位。 作为国内旅游OTA的领头羊,携程也有着完善的用户画像平台体系。目前用户画像广泛用于个性化推荐,...

阅读全文

干货:最全面的深度学习自学资源汇总

数据有意思   2017-05-31

深度学习作为机器学习的一个分支,是近年来最热门同时也是发展最快的人工智能技术之一,相关学习资源包括免费公开教程和工具都极大丰富,同时这也为学习 深度学习技术 的IT人才带来选择上的...

阅读全文

Python 操作 MySQL

小数点   2017-05-25

作者:Rust Fisher 配置 win_64 Ubuntu14.04 Python3.x pip安装pymysql模块 直接使用pip安装 pip install pymysql win64上直接在cmd中执行 连接本地数据库 使用模块 pymysql 连接数据库 ...

阅读全文

为什么说Python是伟大的入门语言

小数点   2017-05-24

作者:Elliott Hauser 翻译:黑色巧克力 本文作者列举了一些Python特性,并认为Python是最适合入门的编程语言,一起来看一下。 最近发表了三篇关于我的艺术史背景是如何影响我教学的文章。...

阅读全文

云数据库高可用解决方案技术解析

小数点   2017-05-23

高可用,英文翻译为”High Availability”. 从字面上理解就是要做到服务的full-time的持续可用,但老实说,要做到full-time是不现实的,因为能够影响系统服务可用性的因素实在是太多了,除了...

阅读全文

搭建ELK日志分析平台

数据有意思   2017-05-22

简介 ELK stack是实时日志处理领域开源的一套解决方案,最近这两年越来越火,大有一统江湖之势。ELK是一套解决方案而不是一款软件,三个字母分别是三个软件产品的缩写。 E代表Elasticsearch...

阅读全文

手把手教你做数据分析

数据有意思   2017-05-18

在互联网的下半场,不断精细化运营的背景下,产品经理不再是单纯的靠感觉来做产品,更需要培养数据的意识,能以数据为依归,来不断改善产品。 不同于公司专业的数据分析师,产品经理更多的...

阅读全文

学习数据科学并没有什么神秘之处

小狼   2017-05-18

作者:Jerry Overton 有些人可以想出用数据来提升企业业务的方法。这些人可以解释这些方法并使之变为现实,从而影响他们机构的变革。尽管他们的工作是编写和修改代码,但他们是可以(或至少...

阅读全文

我的Kaggle初体验 — Grupo Bimbo Inventory Demand

小数点   2017-05-16

作者:豆豆叶 这个暑假利用在西班牙交流的时间,我开始着手做自己的第一个Kaggle比赛,总得感觉还是收获特别多,所以也希望和小伙伴分享自己的经验(编程、计算、模型、体验)。这次最终排...

阅读全文

爬虫进阶:反爬策略的应对机制

小数点   2017-05-12

爬虫与反爬虫,这相爱相杀的一对,简直可以写出一部壮观的斗争史。而在大数据时代,数据就是金钱,很多企业都为自己的网站运用了反爬虫机制,防止网页上的数据被爬虫爬走。然而,如果反爬机...

阅读全文

【干货】Kaggle 数据挖掘比赛经验分享

雪姬   2017-05-12

文|陈成龙 简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台。笔者从 2013 年开始,陆续参加了多场 Kaggle上面举办的比赛,相继获...

阅读全文

所有计算机编程语言的一句话概括

大象会跳舞   2017-05-12

A+:阵列编程语言,由摩根·斯坦利公司在1980年代在APL的基础上开发起来的,现在使用GPL授权。 Ada:是一种表现能力很强的通用程序设计语言,它能大大改善软件系统的清晰性, 可靠性, 有效...

阅读全文

机器学习常见算法分类汇总

蝙蝠侠   2017-05-11

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机器学习的算法...

阅读全文