3、The Google File System (一): Master的三个身份

你好,我是徐文浩。从今天开始,我们就正式地来一起解读和学习大数据领域中,一些经典的论文。这节课,我们就从“The Google File System”这篇论文开始。 这篇论文发表在2003年,现在来看,它算是一篇“老”论文了。然而在我第一次看到这篇...

大数据经典论文解读

2、学习方法:建立你的大数据知识网络

你好,我是徐文浩。 在了解了大数据论文之间的脉络后,接下来,我们就要进入精读论文的学习当中了。不过,在具体解读一篇篇的论文之前,我想先带你来一起看一看,这些大数据论文到底涵盖了哪些知识点,这些知识点又是来自于大数据系统中的哪一个组件。通过梳理这些组件...

大数据经典论文解读

1、什么是大数据:从GFS到Dataflow,12年大数据生态演化图

你好,我是徐文浩。 在正式开始解读一篇篇论文之前,我想先让你来回答一个问题,那就是**“大数据”技术到底是什么呢?**处理100GB数据算是大数据技术吗?如果不算的话,那么处理1TB数据算是大数据吗? “大数据”这个名字流行起来到现在,差不多已经有十...

大数据经典论文解读

开篇词、读论文是成为优秀工程师的成年礼

你好,我是徐文浩,一个还在创业的工程师。目前专注于帮助新兴市场的电商进行数字化转型和数字化管理。 其实在两年前,我就在极客时间上做了第一门课程《深入浅出计算机组成原理》。写那个课程的时候,我是希望能够帮助更多的工程师弄清楚计算机的底层原理,让大家在自...

大数据经典论文解读

43、结束语:未来的你,有无限可能

你好,我是李智慧。我的专栏《从0开始学大数据》到今天就全部结束了,42期专栏,我们一起走过3个月的时间,系统学习了Hadoop大数据系统的原理与架构;Hive、Spark、HBase等大数据生态下主要产品的原理和应用;学习了自己开发一个大数据SQL引...

从0开始学大数据

42、模块答疑:软件工程师如何进入人工智能领域

你好,我是李智慧。在大数据算法模块,我们一起学习了几种最常用的大数据算法,包括KNN分类算法、贝叶斯分类算法、PageRank网页排名算法、关联分析Apriori算法、聚类分析K-means算法、神经网络算法以及几种常见的推荐算法,算是对大数据算法有...

从0开始学大数据