4、The Google File System (二): 如何应对网络瓶颈

你好,我是徐文浩。今天这一讲,我们接着来学习GFS论文中第二个重要的设计决策,也就是根据实际的硬件情况来进行系统设计。 大数据系统本就是为“性能”而生的,因为单台服务器已经满足不了我们的性能需要。所以我们需要通过搭建成百上千台服务器,组成一个大数据...

大数据经典论文解读

3、The Google File System (一): Master的三个身份

你好,我是徐文浩。从今天开始,我们就正式地来一起解读和学习大数据领域中,一些经典的论文。这节课,我们就从“The Google File System”这篇论文开始。 这篇论文发表在2003年,现在来看,它算是一篇“老”论文了。然而在我第一次看到这篇...

大数据经典论文解读

2、学习方法:建立你的大数据知识网络

你好,我是徐文浩。 在了解了大数据论文之间的脉络后,接下来,我们就要进入精读论文的学习当中了。不过,在具体解读一篇篇的论文之前,我想先带你来一起看一看,这些大数据论文到底涵盖了哪些知识点,这些知识点又是来自于大数据系统中的哪一个组件。通过梳理这些组件...

大数据经典论文解读

1、什么是大数据:从GFS到Dataflow,12年大数据生态演化图

你好,我是徐文浩。 在正式开始解读一篇篇论文之前,我想先让你来回答一个问题,那就是**“大数据”技术到底是什么呢?**处理100GB数据算是大数据技术吗?如果不算的话,那么处理1TB数据算是大数据吗? “大数据”这个名字流行起来到现在,差不多已经有十...

大数据经典论文解读

开篇词、读论文是成为优秀工程师的成年礼

你好,我是徐文浩,一个还在创业的工程师。目前专注于帮助新兴市场的电商进行数字化转型和数字化管理。 其实在两年前,我就在极客时间上做了第一门课程《深入浅出计算机组成原理》。写那个课程的时候,我是希望能够帮助更多的工程师弄清楚计算机的底层原理,让大家在自...

大数据经典论文解读

43、结束语:未来的你,有无限可能

你好,我是李智慧。我的专栏《从0开始学大数据》到今天就全部结束了,42期专栏,我们一起走过3个月的时间,系统学习了Hadoop大数据系统的原理与架构;Hive、Spark、HBase等大数据生态下主要产品的原理和应用;学习了自己开发一个大数据SQL引...

从0开始学大数据

42、模块答疑:软件工程师如何进入人工智能领域

你好,我是李智慧。在大数据算法模块,我们一起学习了几种最常用的大数据算法,包括KNN分类算法、贝叶斯分类算法、PageRank网页排名算法、关联分析Apriori算法、聚类分析K-means算法、神经网络算法以及几种常见的推荐算法,算是对大数据算法有...

从0开始学大数据

41、从感知机到神经网络算法

从机器学习模型角度看,目前最简单的机器学习模型大概就是感知机了,而最火热的机器学习模型则是神经网络。人工智能领域几乎所有炫酷的东西都是神经网络的成果,有下赢人类最顶尖围棋棋手的AlphaGo、自动驾驶技术、聊天机器人、语音识别与自动翻译等。事实上,神...

从0开始学大数据

40、机器学习的数学原理是什么

最近几年,人工智能(AI)的风头俨然已经盖过大数据,成为各大互联网公司争相追捧的新“风口”。但当我们谈论人工智能时我们到底在谈什么?人工智能跟机器学习有什么关系?跟大数据又有什么关系?“高大上”的机器学习背后的数学原理是什么? 所谓的人工智能,在技术...

从0开始学大数据

39、如何预测用户的喜好

在用户对自己需求相对明确的时候,可以用搜索引擎通过关键字搜索很方便地找到自己需要的信息。但有些时候,搜索引擎并不能完全满足用户对信息发现的需求。一方面,用户有时候其实对自己的需求并不明确,期望系统能主动推荐一些自己感兴趣的内容或商品;另一方面,企业也...

从0开始学大数据
11516171819268