读者QQ群②:190771709,投稿请发dashuju36@qq.com
我要投稿

标签:大数据技术

2017年全球大数据技术支出或超570亿美元

小数点   2017-05-22   News

根据市场调研机构SNS Research最新报告显示,2017年全球大数据技术支出预计将超过570亿美元。 该报告指出,尽管有关隐私权问题和企业抵触的挑战依然存在,大数据投资在全球还持续保持了增...

阅读全文

聊聊 MongoDB 数据库的设计

小狼   2017-05-17   MongoDB

作者: 敖天羽 自从正式使用了 MongoDB 之后,不止一次吐槽过 MongoDB 的各种垃圾设定,包括但不仅限于: 没有事务 没有表连接(新版支持了,但估摸着性能堪忧) 也就是说,同样的操作,在...

阅读全文

实用 | Apache Kudu读写路径

招聘办女秘书   2017-05-15   大数据技术

作者:James Kinley 和 David Alves Kudu的体系架构已经具备了提供良好分析性能的能力,同时还能够接收插入和更新操作的连续流。为了使用户能够专注于其最关心的内容,Kudu提供了简单的API...

阅读全文

爬虫进阶:反爬策略的应对机制

小数点   2017-05-12   干货教程

爬虫与反爬虫,这相爱相杀的一对,简直可以写出一部壮观的斗争史。而在大数据时代,数据就是金钱,很多企业都为自己的网站运用了反爬虫机制,防止网页上的数据被爬虫爬走。然而,如果反爬机...

阅读全文

通俗理解数据库隔离机制

大象会跳舞   2017-05-09   数据库

作者:PerKins.Zhu 在理解数据库隔离机制的时候发现网上很多文章都是千篇一律,解释语言太过于标准书面化,描述的晦涩难懂,因果关系模糊。在这里将自己对隔离机制的理解描述一下,力争做到...

阅读全文

Python工程师进阶之道

小数点   2017-05-09   Python

作者:the5fire 这是the5fire总结出来的Python程序员或者程序员的进阶之道——零到入门,入门到初级,初级到中级,中级到高级。仅供参考 前言 上次在群里有同学又在问基础的问题,我不反感基...

阅读全文

Log:被BigData遗忘的奠基者

大象会跳舞   2017-05-08   大数据技术

作者:飞总 Log是关系数据库对计算机行业的伟大贡献。在大数据时代,Log更是基础技术之一。然而在大家热烈讨论GFS, NoSQL,乃至Paxos, LSM tree等词语的时候,Log这个基础技术以及它对大数...

阅读全文

入门级攻略:机器学习 VS. 深度学习

雪姬   2017-05-08   机器学习

作者:Faizan Shaikh 摘要: 本文以浅显易懂的语言介绍了机器学习和深度学习的定义及应用,以及在源数据要求,硬件支持,特征工程、问题解决方式、执行时间及可解释性等方面的区别,对于新...

阅读全文

浅析分布式系统

数据有意思   2017-05-05   大数据技术

作者:腾讯WeTest 导读 我们常常会听说,某个互联网应用的服务器端系统多么牛逼,比如QQ、微信、淘宝。那么,一个互联网应用的服务器端系统,到底牛逼在什么地方?为什么海量的用户访问,会...

阅读全文

机器学习中容易犯下的错

小数点   2017-05-05   机器学习

前言 在工程中,有多种方法来构建一个关键值存储,并且每个设计都对使用模式做了不同的假设。在统计建模,有各种算法来建立一个分类,每一个算法的对数据集有不同的假设。 在处理少量的数据...

阅读全文

在 R 中使用 Prophet

大象会跳舞   2017-05-05   R

译者:Vector Prophet 是 Facebook 推出的开源大规模预测工具,可以在 R 和 Python 中使用以预测时间序列数据。 下面将简单介绍 Prophet 在 R 中的使用。 一、基础介绍 下面实例中使用的是...

阅读全文

MongoDB干货篇之查询数据

诺蓝   2017-05-04   大数据技术

文|Chenjiabing 在开始之前我们应该先准备数据方便演示,这里我插入的了几条数据,数据如下: db.user.insertMany( [{ name:'jack', age:22, sex:'Man', tags:['python','c++','c']...

阅读全文