只接受发布货源信息,不可发布违法信息,一旦发现永久封号,欢迎向我们举报!
免费发布信息
16货源网 > 餐饮行业新闻资讯 > 网站建设 >  做数据分析不得不看的书有哪些?


  • 【莆田鞋厂家分类】
  • 【奢侈大牌包包厂家分类】
  • 【潮牌奢侈服饰鞋子厂家分类】
  • 【名表厂家分类】

厂家货源分类区域

做数据分析不得不看的书有哪些?

发布时间:2019-09-01 19:57:30  来源:网友自行发布(如侵权请联系本站立刻删除)  浏览:   【】【】【
说实话,干互联网那么久,没有看过网站分析方面特别好的中文书,给楼主一些链接吧,里面有一些清单: http://www.chinawebanalytics.cn/how-to-learn-web-an
做数据分析不得不看的书有哪些?说实话,干互联网那么久,没有看过网站分析方面特别好的中文书,给楼主一些链接吧,里面有一些清单:
http://www.chinawebanalytics.cn/how-to-learn-web-analytics-for-newbies-ii-2/

中文的补充一本

《精通Web Analytics 2.0——用户中心科学与在线统计艺术》
以网站分析为主,作者是Avinash Kaushik,译者是郑海平,邓天卓,两位作者是国内网站分析领域比较有经验的牛人,翻译是比较专业的。

附录:网站分析可以读的几本书(但是千万不要扎进去爬不出来了!)
  全部是英文的
1. Sybex – Advanced Web Metrics with Google Analytics. Mar 2008。虽然是2008年的书,但是里面有一些关于网站分析的基本实现方法和网站分析工具的基本原理,值得一读。如果你觉得学习了GCU还不过瘾,那么你也可以通读这本书。
2. Google Analytics by Justin Cutroni (O'Reilly shortcuts)。这本书不错,内容精练,可以全部读完。
3. Wiley-Web Analytics For Dummies (2007)。 闲得无聊可以翻翻。
4. Avinas的两本,读英文版的。不过,不建议初学者读。
5. Sybex – Landing Page Optimization – The Definitive Guide to Testing and Tuning for Conversions – Jan 2008。值得读,随便翻阅,会有收获。
6. Don’t make me think,跟网站分析不直接相关,但值得读。

纯数据分析和数据挖掘方面的,下面2本偏理论的,属于“道”这个层面,适合有几年工作经验以后再看
数据仓库(原书第4版)
数据挖掘概念与技术(原书第2版)

偏工具使用的,SAS和SPSS的书,市面上很多,说实话,都是把帮助文件翻译成中文,加一些实验示例,只能让你会使用工具,让你入门,至于说提高,主要靠工作经验的积累。 一直在自学和用数据挖掘的东西。因为不是本专业,所以随便讨论一下,仅作参考。
补充一下我了解的数据挖掘经典教材,
1《数据挖掘概念与技术》,作者:[加]Jiawei Han/Micheline Kamber 译: 范明/孟小峰 等
2《数据挖掘导论》,作者: [美]Pang-Ning Tan,Michael Steinbach,Vipin Kumar 著
3《数据挖掘技术——市场营销、销售与客户关系管理领域应用》作者: (美)贝瑞(Berry.M.J.A.),(美)莱诺夫(Linoff.G.S.) 著,别荣芳,尹静,邓六爱 译
三本都有中文版,前两本范明教授的翻译看起来不流畅,可能的话还是去看英文原版。

相关的数学知识模型,主要应该是多元统计方面的。有的学校只用自己的影印版书做教材。可参考英文书很多,就不一一列举。中文的可以看清华的《实用多元统计分析》

的确,数据挖掘不只是电商的数据分析,也不只是数据仓库,学术型的讨论更多在各种模型,如:分类、回归预测、相关性分析等。
如果要做模型做得实用可行,一是用更高级更复杂的模型,本科教材级别的估计不够;二是更巧妙地定义问题、简化问题。不过无论怎样,只要能解决问题,就是好方法。 update 一本:
《Introduction to Machine Learning, Second Edition》
主頁:Introduction to Machine Learning
附:電子版下載。

推荐一本不错的理论书:
《The elements of statistical learning: data mining, inference, and prediction》
主頁:Elements of Statistical Learning: data mining, inference, and prediction. 2nd Edition.
附:電子版下載。

再有就是 @段曼妮 提到的那本《Pattern recognition and Machine Learning》。本想讃,原來三年前就讃過了呢。那就來補充下鏈接好了。
主頁:Christopher M. Bishop
附:電子版下載。

這三本均為學術經典值得擁有。

也不知道為什麼最近「大數據」各種火熱,那就另外再 update 一本,吧:
《Mining of Massive Datasets》
(相比大啊小的什麼,還是更喜歡這個叫法呢。哈哈。)
主頁:Mining of Massive Datasets
附:電子版下載。数据分析的基础是统计学,复杂点的理论是数据挖掘,这两个是基础,是分析过程中使用的工具而已,个人能力的提升并不能体现在这两个方面的知识有精通,更重要的是个人思维以及与别人沟通展示自己的想法。这两个基础可以推荐两本书,《爱上统计学》,《数据挖掘概念与技术》,需要了解出现什么问题,用什么方法能解决即可。
思维方面的书推荐:《批判性思维》,《黑天鹅》,《数据会撒谎》,《博弈论》,《麦肯锡方法》《思考的技术》等等
数据展示方面:《用图表说话》,《excel演绎之道》,《演示之禅》,《餐巾纸的背面》,《视觉化思维》
数据分析与产品运营是离不开的,为此多学习产品、营销方面的知识是有利无弊的。

热诚推荐看过的几本经典。



-----------2017年1月更新,增加一本豆瓣上没找到的,但是初学者必看的2016版新书--------------




一、数据分析入门:

  • 《Head First Data Analysis》链接:深入浅出数据分析 (豆瓣)

电子工业出版社的经典书目系列,从数据分析基本步骤开始、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧一一讲到。图比较多,适合入门。

  • 《Head First Statistics》链接:深入浅出统计学 (豆瓣)

推荐理由同上,适合入门者的经典教材。

  • 《R in Action-Data Analysis and Graphics with R》链接:R语言实战 (豆瓣)

R是属于GNU系统的一个自由、免费、源代码开放的软件,用于统计计算和统计制图。这本书从实用的统计研究角度逐例分析R在数据处理、模型构建、以及图形操作上的由浅入深的结合,堪称经典。

  • 《数据之魅-基于开源工具的数据分析》链接:数据之魅 (豆瓣)

作者是华盛顿大学理论物理学博士。这本书是数据分析的经典之一,包含大量的R语言模拟过程及结果展示,例举了很多数据分析实例和代码。

  • 《数据挖掘-市场营销、销售与客户关系管理领域应用》链接:数据挖掘技术 (豆瓣)

作者是Data Miners的创办人,有二十多年的营销和客户关系管理结合数据挖掘的经验。详细介绍了作为一个数据挖掘团队需要的知识体系,包括数据库、SAS使用、统计学、机器学习、数据可视化、如何访问用户收集需求、如何写论文与沟通等等。有条件的建议看英文原版。


  • 《Data Analytics for Beginners: Basic Guide to Master Data Analytics》

入门五星推荐。里面很多图表实例,手把手教你如何EXCEL画图,对各种知识点(平均值,模式,中值,方差,标准偏差)的讲解相当的到位,比起大学里的各种课本靠谱。



先把这些花时间啃啃,数据分析的理论部分就基本入门了,根据实际情况还需要结合你的业务需求来进行系统的学习。



二、数据分析进阶:

  • 《Doing Data Scienc

作者Cathy O’Neil是哈佛大学的博士,MIT的数据博士后,曾今作为一名Quant在对冲基金D.E. Shaw 工作,目前是一家纽约初创公司的Data scientist 。这本书需要有一定的编程和理论基础,作为入门教材来说有点难,虽然只有400来页,但是涉及的知识点很全面。每一章节的核心内容都附有编程案例,R/Python/Shell三种语言任君挑选。


  • 《Python for Data Analysis

Python数据分析必看,适合入行不久的数据分析师。作者有多年的Python数据分析工作经验,对各种Pyhon包iPython,NumPy,pandas,matpotlib等有着很深的理解。看完这本,敲完代码,Python数据分析就算入行了。


  • 《Data Science for Business

很多牛人为之作序,数据科学如何与商业结合,相信这本书会给你一些启发。


  • 《Python Data Science Handbook

2016年6月出版的,500页保质保量,作者(Jake VanderPlas)是华盛顿大学电子科学研究所的高级数据科学研究员,研究领域包括天文统计学、机器学习和可扩展计算。书的前半部分介绍了用于数据分析和一般的科学计算的基本Python库,后面从实际应用的角度使用Python库scikit-learn开始机器学习实践。适合有一定Python基础人(或者R基础),并且想学习如何使用Python进行数据分析的人。


  • 《Storytelling with Data

作者Cole NussbaumerKnaflic,私募分析师,前Google人力分析团队总监。本书展示了如何高效率展示量化资讯,如何用丰富的资料讲故事。Google内部的数据可视化课程讲师,之前也在Maryland Institute College of Art兼职讲师。如果你想知道如何以图叙事,这边好书不容错过。



OK,这几本够看一阵了,有时间再更新。


专业在专栏:预见未来

我觉得数据分析是个杂家,什么要懂一些,我概括起来包括4个方面的。
1)数据处理能力,就是能数据库中的数据组织成你想要的形式。
这里面最基本的就是EXCEL能力(你别小看EXCEL,EXCEL用活了也很牛逼的),再高级一点的数据库操作技巧(比如:编写T-SQL代码的技巧,再或者用第三方软件处理,比如SAS等),再牛一些就是能用编写一些脚本语言处理数据,比如python等。
另外就是数据库语言SQL也是分析师的最基本能力。

2)建立模型的能力,这个不光是能在一些软件是摆弄一些组件或方法,最关键的是要知道一些模型的适用原则和结果解释。
在我们用的比较常见有比如logist回归,K-mean等,以及其他一些线性模型。这些模型的算法一般都不需要你写了,通过SAS等软件能自动实现,但是对很多并不了解的这些模型的基本原理,稀里糊涂做了。这里我建议你读一些数据挖掘技术和统计方法的书。此外,我要强调的是数据分析是为了解决问题,不要为了分析而分析。看过不少人,做了不少模型,但那些模型一定用处都没有,或者不需要模型就能解决问题。当然,如果你能自己写一些算法最好了,比如一些推荐算法等。

3)数据分析是杂家,需要你去了解很多管理和经济学方面的知识。
有了这些知识对你了解事物,结构问题很有帮助,比如你了解了营销理论后你对用户细分、用户行为以及渠道分析就很有感觉了。数据分析最重要就是思路,而思路往往来自于这些管理和经济方面的知识,数据分析的模型只是让你将这些思路简化和处理的手段而已。这就说明为什么很多做数据分析咨询方面的很多人来自MBA的原因。这个需要慢慢积累。

4)对行业的认识,这个最容易入手,但也最难深入。如果一个人对行业一点了解,这个人不可能做好数据分析,他解决问题找不到关键点。此外,对于增强行业的认识我觉得没有什么太好办法,能做的就是时间对上去,慢慢了解这个产业链。这里我觉得有一些波士顿和波特的书就蛮好的其实前面有回答提到过统计学习三大巨匠Trevor Hastie, Robert Tibshirani和Friedman《the elements of statistical learning》了,也提到了Trevor Hastie, Robert Tibshirani的13年的新书《An Introduction to Statistical Learning: with Application in R》,我觉得可以简单补充一些信息,希望可以帮到大家:-)

对于看英文书觉得有理解困难的同学来说,《the elements of statistical learning》写得其实内容非常广泛,很多东西都是融合了作者深厚的统计学习理论功底,一般很难啃透,研究生阶段的其实能完全理解这本的不多,我会认为这本是博士阶段的人会受益更多,但是这本书在机器学习或者说数据挖掘这个领域,具有无可替代的地位,大概就是这个领域的定海神针一样的地位吧;书偏统计,不太适合计算机的同学;

中文版是清华大学出版社的《统计学习基础》,这个嘛,不推荐,翻译得不好,很多术语和表述都不够"统计",但是我认为能翻译巨作的,都是有贡献的。

《An Introduction to Statistical Learning: with Application in R》这本呢,其实跟《the elements of statistical learning》的大部分内容是相同的,但是这本书的特点是起点更低,弱化了数学推导的细节,更加注重方法的应用,更加适合研究生阶段的、学计算机的和从业者;属于翻完就能上手的那种;

《An Introduction to Statistical Learning: with Application in R》的中文版是机械工业出版社的《统计学习导论:基于R的应用》,15年6月份出来的新书,译者和原书作者都是在同一个领域搞研究的,可以说是同宗同源啦,水平也是相当高的;以前找我推荐书的,都被安利了这本;甚至还有书还没上市就被我安利的人...

也有回答提到了吴喜之老师的《从数据到结论》,其实我会更加推荐吴喜之老师的另外一本《统计学:从概念到数据分析》,这本书搜索成本比《从数据到结论》要稍微高一点,吴老师一惯的风格,书特别薄,三言两语点透方法的精髓;而且也都有R代码;
作者:张浩彬
链接:在数据分析、挖掘方面,有哪些好书值得推荐? - 张浩彬的回答
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

我也来分享一个自己的书单:

#关于这份学习清单#

我会按照基础到入门给出详细推荐,并且附上个人点评。同时尽量做到各个资料在内容上并不重复(即使内容上有重复,也会在难度上做出区分),希望可以以最直接的方式告诉大家应该怎么选择。

Ps:这是第一版学习指南,由于最近时间比较紧张,预计在第二版中会加入业务材料的推荐和更多的学习索引,欢迎关注。



1先验知识

由于统计学概率论甚至到机器学习会对数学基础有一定要求,所以这里给出一些先验知识的内容推荐,主要是矩阵方面。

1.1 课程

可汗学院公开课:线性代数课程

可汗学院公开课:线性代数

因为网易公开课有翻译,这里是中文字幕课程链接,这里真要给网易100个赞,字幕做得很好。

“可汗学院(Khan Academy),是由孟加拉裔美国人萨尔曼·可汗创立的一家教育性非营利组织,主旨在于利用网络影片进行免费授课,现有关于数学、历史、金融、物理、化学、生物、天文学等科目的内容,教学影片超过2000段,机构的使命是加快各年龄学生的学习速度。”

1.2 参考书籍

(1)线性代数 豆瓣评分7.3

清华居余马老师的线性代数教材,比较经典的教材了,里面的知识足够支撑我们后续统计分析和机器学习需要。

(2)高等代数 豆瓣评分8.1


相比于线性代数,高等代数更加深入,一般线性代数为非数学专业所用,数学类专业一般学习高等代数。不过一般情况下,线性代数也足够使用了。

当然,在后续学习中有些算法也会用到微积分的知识,但是都比较基础,因此遇到不懂的时候直接查资料即可,就没有特定推荐材料了。




2统计分析学习资料

2.1 统计学/概率课程

同样推荐可汗学院的统计学和概率课程,而且刚好这两门课程也被网易公开课进行了翻译:

(1) 可汗学院公开课:统计学

可汗学院公开课:统计学

(2) 可汗学院公开课:概率

可汗学院公开课:概率


这两本课程总体不算太难,适合入门。个人觉得讲授还是蛮有特点的,粗暴直接,另外举的例子也是蛮有趣的。


2.2统计学/概率参考书

(1)统计学 豆瓣评分8.8
作者William Mendenhall / Terry Sincich

“《统计学(原书第5版)》内容丰富,很少涉及统计学理论的严格数学证明,绝大部分是与实际应用紧密联系的例子和练习,适合作为理工科各专业本科生、研究生的统计学教材,也可作为相关领域研究人员的参考读物。”

非常注重实用的统计学课程,偏应用,少数学证明,可读性比较强

(2)统计学 豆瓣评分7.3
作者:贾俊平,何晓群,金勇进

统计比较通用的入门教材了,不知不觉竟然到了第六版,个人认为也算是兼顾数学证明和应用,可读性没有上面强,但是也非常的通俗易懂,有很多统计学专业的起始教材也会选择这本。

(3)统计推断 豆瓣评分8.8,/英本原本9.2
作者:William Mendenhall / Terry Sincich
非常经典经典的统计学教材,借用介绍“从概率论的基础开始,通过例子与习题的旁征博引,引进了大量近代统计处理的新技术和一些国内同类教材中不常见而又广为使用的分布。其内容既包括工科概率入门、经典统计和现代统计的基础,又加进了不少近代统计中数据处理的实用方法和思想”
可以作为研究生所用教材,有深度,但是作者循序渐进,解释得非常漂亮



3机器学习资料

3.1机器学习课程

强烈推荐Andrew NG吴恩达的斯坦福机器学习课程,英文授课,但是已有完善的中文字幕,内容非常丰富且充实(20节),并且讲解得非常的好,如果你想学习机器学习,一定不能错过!

Coursera地址:

Coursera - Free Online Courses From Top Universities

网易公开课地址:

斯坦福大学公开课 :机器学习课程


同时该课程配有课件讲义,同样建议大家在学习视频课程之余多看讲义和习题,虽然是英文,但是阅读上基本没有什么问题,就讲义本身也是非常的棒。

如果大家学习完Andrew NG的机器学习,还想通过其他课程触类旁通,相互借鉴的话,可以上Coursera上门搜索还有其他选择,例如台大的机器学习基础等等,但毫无疑问首推Andrew NG的课程;

另外现在国内也有越来越多的培训网站推出相关课程,大家有兴趣的可以自己搜搜,这里就不做推荐了;


3.2机器学习教材

(1)数据挖掘导论 豆瓣评分8.4,/英本原本8.8

作者: Pang-Ning Tan、Michael Steinbach、Vipin Kumar

介绍得非常全面的一本书,但可能因为需要涵盖的内容太多,所以难免有些算法只能简单介绍。尽管这样,个人认为也是非常难得一见的入门教材,有一定难度。这本书从简单的数据开始,到各种分类算法,聚类算法,关联规则都有相对完整的指引,我认为对于我们构建自身的统计挖掘体系是有很大的帮助。中文版本翻译还是挺好的,但是英文原版那是极好的。


(2)统计学习方法 豆瓣评分:8.9

作者:李航

个人认为中文教材里面少见的精品,虽然精简,但逻辑非常的清晰,非常详细地为我们剖析了算法原理,可能不太适合入门者,但是还是非常值得推荐阅读学习,建议将《数据挖掘导论》以及《统计学习方法》相互借鉴学习


(3)The Elements of Statistical Learning(统计学习基础)

豆瓣英本原版评分9.4 中文评分7.4

作者:Trevor Hastie

这本书被广大人民喜称为ESL,虽然书名是统计学习基础,但是此书一点都不基础,一点都不~另外此书还有一本专门的入门版本ISL(后面会介绍)

这本书涵盖了非常多的内容,讲解深入,有人评价说,“有了这本书就不需要其他机器学习教材”,虽然有点夸张,但是此书实际是机器学习的经典巨作,如果你真的希望好好研究机器学习,此书非常值得仔细研读,另外此书要求不低的统计理论和数学基础。

此外,这本书还有一个牛逼的地方在于,作者把书放在网上免费下载:

Elements of Statistical Learning: data mining, inference, and prediction. 2nd Edition.





前面都是一些理论知识,但是数据科学里面实践应用又是另外一个重中之重,接下来谈一下借助工具进行实践应用的问题,由于Python还在整理当中,本次主要介绍SPSS与R语言



4SPSS学习资料

考虑到SPSS分为统计模块Statistics以及数据挖掘模块Modeler , 因此也分为两大块介绍


4.1SPSS统计分析资料

SPSS Statistics 市面上的书籍比较多,从我个人的角度,认为张文彤老师的系列足以让大家加深对统计体系的理解,同时也能很好掌握在实际的应用当中如何使用统计分析帮助我们完成任务,我认为掌握统计分析原理实战和SPSS操作,以下两本书足矣。

(1) SPSS统计分析基础教程 豆瓣评分8.4

提供了包括医疗、经济、市场研究等方面的案例贯穿了全书,能够很好从实际应用角度把统计分析原理和SPSS操作结合起来,也提供了很好的结果解读,不失为一本极好的工具指南


(2)高等学校教材(SPSS统计分析高级教程)豆瓣评分7.7

相比于基础教材,高级教程介绍了更多的统计算法模型,同时也提供了一些统计新方法和新观点的讲解。整体来说直观易懂,能够很好提升实战能力

另外张文彤老师也有对应视频课程 《张文彤SPSS初中级教程》以及《张文彤SPSS高级教程》



4.2 SPSS机器学习教程

(1)Modeler官方的帮助文档和Sample文件

Modeler提供完备Sample数据和数据建模文件,并且配套中文说明,可以帮助入门者一步一步搭建数据建模流并理解实际应用场景。Modeler提供的帮助文档包括有算法说明,节点说明,Crisp-dm方法论,应用文档等,其中比较重要一本如:《IBM SPSS Modler 应用程序指南》


(2) IBM SPSS数据分析与挖掘实战案例精粹 豆瓣评分9.3

作者:张文彤,钟云飞

非常详尽工具手册,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,尤其是书本最后几章实践案例,从商业问题界定到商业应用,给出了非常详尽的建模指南,个人认为目前市面上Modeler最好的工具手册;另外即使不是使用SPSS,而是用其他工具,该书后面的例子也值得大家研读。



5R语言学习资料

(1)R语言实战 豆瓣评分8.8

作者:Robert I.Kabacoff

首先这本书绝对可以担当日常工具手册,从基本操作,数据处理,数据建模,图形展示都给出了非常详尽的介绍;其次虽然是工具手册,但是能够结合基本统计知识于简单案例,具有很强实践性,强烈建议各位把书中的代码都实现,相信能够大大提升R的功力。最后说一句,此书翻译得不错。


(2)AnIntroduction to Statistical Learning(统计学习导论) 英本版豆瓣评分9.5,中文版7.6

作者:Trevor Hastie,Robert Tibshirani ,Jerome Friedman


此书被广大人民群众称为ISL,没错,就是上面ESL的入门版本。无论作为统计教材推荐还是R语言教材推荐都称得上5星的读物。ISL虽然是入门版本,但是绝对不是因为内容简单。深入浅出,内容详细,常常读完有种恍然大悟的感觉,同时能够结合R语言介绍,大大的加分。




最后厚颜无耻地介绍我个人的公众号,wetalkdata,定期更新数据分析,数据挖掘方法,Statistics以及Modeler操作指南(比帮助手册更详细),而且还有送书活动!

http://weixin.qq.com/r/KEhPVwXE2VimrUE09x06 (二维码自动识别)

有youtube常青藤名教授的免费上课视频,为何不先睹为快???当然了,翻墙是楼主suppose你们需要拥有的基本生存技能。
先放链接再阐述我对数据科学进击之路的理解。(注:以下视频是楼主自己在学习的,因此多为graduate course,仅作演示目的)
1,Machine Learning by Prof. Nando de Freitas, 此视频是其在UBC时13年所录,后来跳槽去牛津计算机系了。
https://www.youtube.com/playlist?list=PLE6Wd9FR--EdyJ5lbFl8UuGjecvVw66F6

2,Deep learning at Oxford 2015 by Prof. Nando de Freitas, 跳槽到牛津所录。
https://www.youtube.com/playlist?list=PLE6Wd9FR--EfW8dtjAuPoTuPcqmOV53Fu

3,Probabilistic Graphical Models by Daphne Koller, 斯坦福大学计算机系教授
https://www.youtube.com/playlist?list=PL50E6E80E8525B59C


简单的说,原理和基础都在数学这边。
线性代数(矩阵表示和运算)是基础中的基础,微积分(求导,极限);
数据处理当然需要编程了,因此C/C++/Python任选一门,数据结构可以学学,只是让你编程更顺手,但是编程不是数据处理的核心。
Mid-level的课程,概率论+统计(很多数据分析基于统计模型),线性规划+凸优化(统计到最后也还是求解一个优化问题,当然也有纯优化模型不用统计模型的)
再高阶的课程,就是些研究生的课程了,就比较specific了,可以看你做的项目再选择选修,比如:Probabilistic Graphical Models, Nolinear Programming, Integer Programming, Machine Learning(其实机器学习,学的都是一些统计和优化),图像处理,deep learning, 神经网络,等等等等。

学到Mid-level,然后做几个实际项目,就能上手咯。要读Phd搞科研,才上高阶的。
至于书,没有特别推荐的,但是建议看英文原版。或者,直接翻墙Youtube看视频课程,很多国际知名教授都很无私地把自己上课的视频放在youtube上免费学习。

比如,海德堡HCI 的Fred,图像处理课程:
https://www.youtube.com/playlist?list=PLuRaSnb3n4kSgSV35vTPDRBH81YgnF3Dd

然后,就可以着手做项目了,最经典的regression,clustering, outlier detection,看几篇paper学习几种不同的模型和算法,对一个现实问题,从拿到问题,分析问题,数学建模,编程实现,可视化,一套做下来,对项目整个流程有所了解。

完了你就有项目经验了,恭喜可以找工作了。有名校毕业证会是很好的敲门砖,没有的话,多积累项目经验。

更详细回答,参见:
想学数据分析需要学哪些课程? - Ruobing Shen 的回答

关于我对最优化理论在咨询行业的应用,参见

Data Science/Analytics 出身,可以在咨询行业做些什么? - Ruobing Shen 的回答

最好按照惯例广告一波:

欧洲、北美、全球留学及数据科学深度私人定制咨询,从此DIY - Ruobing Shen的文章 - 知乎专栏

作者:呢喃
链接:https://zhuanlan.zhihu.com/p/22786565
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

问过我这个问题的人太多了,所以统一写篇文章回复下,所写的是看了很多遍的,看书的顺序建议可以按着我给的来。


一、 数据产品经理番外篇:

在看这些书之前,我已经做过一年的产品助理,学习过用户体验、产品设计等知识,并且自己推动过几个版本上线。所以如果你是想要做数据产品经理的人,可以在看下面的数据书之前,先把产品经理的入门书看完。我当年看的是《ued火花集》、《结网》、《人人都是产品经理》,但是那是2010年,所以请酌情参考。

二、 入门篇

1. 入门技术篇:

对于初级员工,需要做的是掌握技术、思路、方法论,并且学习公司的业务知识,可以做出很漂亮、很商务的报告。

  • 谁说菜鸟不会数据分析:

a) 比较经典的入门书,覆盖了一到两年的数据分析人员的大部分工作,包括excel技巧、可视化入门、数据分析方法、数据分析方法论、数据处理入门等,前两遍看的时候,会认真的学习里面的概念和技巧。

b) 每隔一段时间都会翻一遍,会有更深的理解。

这本书基于excel,在工作中,excel是数据人员必须掌握的,所以我还买了两本excel的工具书。

  • Excel的工具书:

a) 这个我当年看的已经很老了,现在要买直接去亚马逊搜评分比较高的就行,都差不多。

  • 深入浅出数据分析、商务统计学(第5版)

a) 这两本书都是讲统计学的,前者比较容易、有趣、浅,都是工作中的例子。

b) 后者比较专业,枯燥,只是比起专业教材来容易。

c) 各看过一遍,后来因为我的工作中用的少,就没看过了。

2. 入门业务篇:

  • 各数据产品论坛(强烈推荐)

a) 我认为学习和成长最快的方式之一,是去看各个数据软件的帮助和产品论坛,因为这些都是写给他们的客户的,所以通俗易懂,又有案例,又有分析思路,虽然不乏吹牛逼的,但是整体来说,比看书的效果要好。

b) 生意参谋的论坛:

  • 我当时看的是量子恒道的卖家帮助,这是当时的淘宝的流量分析软件,有一个入门课程系列,完整的学完。
  • 后来看的是数据魔方,这是行业分析和竞品分析的产品。
  • 再后来淘宝把量子恒道和数据魔方的内容迁移到生意参谋,并开发了非常多新功能,所以要学习可以到生意参谋的论坛学习。
  • 还有一个好处是我们都是淘宝买家,所以当看到站在淘宝卖家的思维做分析的案例时,我们会比较容易理解。

c) 移动分析这块我个人认为淘宝做的是很不好的,所以可以看看友盟等,最新出的数据分析产品公司包括神策、growingio,官网上的文章也都很系统,写的很不错,集合了最近几年最新的行业智慧,非常推荐。

  • 网站分析实战:如何以数据驱动决策,提升网站价值

a) 这本书也比较推荐,对了解用户在网站上的行为,并如何做分析,都有一定的作用。

b) 不好的有两点:1、比较偏pc,而现在大部分公司的重点都转向了移动。2、有一些内容即使我看的时候,都觉得有点过时(2013年),因为国内当时的互联网已经表现出了很大的先进性,包括商业模式的创新等,但是这本书太过于经典的数据分析,即学习了GA的那套,对于国内的商业模式有点落后。

c) 不过经典就是经典,还是要看的。


  • 精益数据分析:

a) 在上本书的基础上进阶,讲了不同的公司怎么样用数据搭建分析框架。我觉得这本书比较好的是,它能够讲不同的指标运用到现实时,会碰到什么困难,以及如何解决。

b) 可惜我2016年9月才读这本书,思维深度已经超过它了,所以觉得收获不大。但是对于工作一两年的人,感觉是非常有用的。

三、 高级篇:

1. 概述:

当你进入高级的时候,这个时候看书已经很之前有了很大的变化:

1、 并不是看单本书,而是学会快速的看书,因为每本书中可能只有几个模型或者几个点对你有借鉴,那么只精读那几处,速读其他部分。

2、 要有自己的理论框架,也就是学会业务建模;

3、 要看业务书,并且能够把业务书的知识,固化成可以量化、可以监控的数据模型,和流程模型;这个是高级别很重要的一点,因为要能够快速的切入一个领域,并且能够用数据找到可以优化的办法。

4、 每个人看的都不一样。所以我看的书纯粹是个人建议。

2. 用户和整体框架:

  • 增长黑客:创业公司的用户与收入增长秘籍。

  • 写的非常好,是我最近用于培训、演讲的基本思路。 虽然增长黑客本身这个职位不一定必要,但是顺着这个思路,去分析每个阶段的用户,并进行运营,是每个互联网团队都需要掌握的技能。
  • 之前比较好的用户框架,有华院数云主推的、主要用于淘宝大卖家的crm模型,有《网站分析》那本书推的数据分析模型,但是这本书的框架比这些都要好,更落地。

  • 数据化管理:洞悉零售及电子商务运营:
    • 强推荐之一,每隔一段时间必看。
    • 对于一个公司来说,能够把数据化管理推行下去,就能把公司的整个管理水平提升一大截,也是数据部门对公司的贡献之一。

3. 商品管理的书:

  • 品类管理:教你如何进行商品梳理:
    • 这本书非常好,集合了很多传统零售业的经验,从里面学到很多模型,三年来每次给卖家培训必然收到好评。(微笑脸)
    • 一个商家,最大的问题是库存多,或者库存不够,这并不是单纯的通过算法预测就可以解决的,而良好的商品规划管理,推动供应链管理,就是商家的内功所在。
  • 品类管理:教你如何进行有效促销。(这本书不推荐,比较传统)
  • 定位、重新定位:必看。

4. 大数据:

  • 决战大数据(升级版):大数据的关键思考
    • 写的非常好。每隔一段时间都看一遍,有新的收获。
    • 车品觉带了淘宝很多团队,每个团队都有不同的情况。会抽空专门写一篇文章来写自己的收获。
  • 为数据而生:大数据创新实践:写的比较好,我还专门写了好几天的读书笔记。

5. 供应链:

  • 供应链管理:高成本、高库存、重资产的解决方案,刘宝红
    • 刘宝红的书可以多看几本,每本都是一边看一边抹眼泪,满满的都是踩过的坑。
  • 库存控制与管理(原书第2版)
    • 都是模型,推荐。当然整个库存控制是一个非常复杂的过程,单独通过计划来控制并不能做到。然而这本专业上的书还是需要看的。
    • 缺点:比较枯燥。我看到第三遍时,才硬着头皮看完,前面两遍都放弃了。
  • 供应链金融:
    • 我买了好几本书看,都觉得不是很好,写的比较枯燥、专业术语多,很传统,更主要是看了两天没看明白。
    • 后来我上知乎把相关帖子看了一遍,看明白了。所以相关问题还是看知乎比较参与感、爆品战略:这两本书中大部分都是小米的案例。讲的挺好的,看一本就可以了。

6. 专业书:

这些比较专业,是每个产品的入门书,但是也仅限于入门。实际中的情况太复杂,就不是这篇文章能覆盖的。

  • 这就是搜索引擎:核心技术详解
  • 计算广告 互联网商业变现的市场与技术
  • 走进搜索引擎(第2版):潘雪峰
  • 推荐系统实践:

学习这种实践性很强的技术,只看书其实是一件信噪比非常低的事情。在 DataCastle 的另一个回答中,详细给出了一个快速入门数据分析师的学习路径,如果你有兴趣,可以看看:如何快速成为数据分析师

当然,读书也有读书的学习方法,推荐的书不多,但保证每一本都值得看,更重要的是,给你一条合理的学习路径,并配合一些另外的学习资源,你能对核心的知识、实践的技巧有更好的理解。(以下推荐的书并非都是必读,也并非适合每一个人,你处于什么阶段,未来发展的方向是什么,需要自己来决定,对每本书详细说明是希望能购帮助你更好地取舍。)


一、数据分析入门


  1. 深入浅出数据分析 (豆瓣)

把这本书放在第一顺序,是因为它真的很简单,但是能够让你对数据分析的一些基本概念有大致的了解。即便是你毫无数据分析经验,一两天也足够读完整本书了。这本书的实操性并不强,所以也不建议你去跟着去实践,了解作者传达出来的数据分析基本思想和原则就ok了,这对你建立宏观的视野,和接下来的学习很有帮助。

另外,书中提到的一些案例,比如提升化妆品销量、分析星巴克销量、生产线最优解、网站AB test、竞品分析、薪资预测等等,看起来很简单,但其实都是工作最常见的一些分析场景。这对数据思维的养成,非常有帮助。

个人觉得书中最有用的一些点:

  • 统计学概念在数据分析中的作用:比如方差、标准差、相关系数、均方根误差等;
  • 集中数据分析的基本方法:假设检验、回归分析、误差分析等;
  • 统计图形分析:散点图、直方图等来探索数据中隐藏的规律;
  • 数据库以及数据整理。

这本书很难让你掌握数据分析技术,过一遍即可。但它会大大降低你之后学习的一些阻力,因为接下来推荐的这本,真的很厉害,但也有一定难度。



2. 利用Python进行数据分析 (豆瓣)

《利用Python进行数据分析》应该是最经典的数据分析书之一了,作者是 pandas 库的作者 Wes McKinney。所以这本书对于 pandas 的理解,应该是非常深刻的,而利用梳理介绍的 pandas、numpy、matplotlib 等库,应对一般的数据分析,完全足够了。

书中应该重点掌握的一些点:

  • IPython Notebook 的使用:最适合小白的代码编写环境,非常容易上手;
  • 科学计算库 Numpy:数组和矢量计算、学会利用数组进行数据处理;
  • 数据处理及分析工具 pandas:数据查询,缺失值、重复值、异常值的处理,数据的合并与规整化,基本的描述性分析及可视化;
  • 可视化工具 matplotlib:用这个库,基本的数据可视化问题皆可以解决了。

看上去是不是很简单,这本书就是教会你如何开始使用 Python 进行数据分析,当然首推的就是 pandas,不仅可以做数据的预处理,还能够做基本的数据分析和可视化。这个库一定是你开始入门的时候需要重点学习的,其次用 Numpy 进行数组的计算、利用 matplotlib 进行可视化的描述性分析,也是同步需要掌握的东西。

但是,这个部分光看书是远远不够的,你可以尽量去找一些可以练手的数据集,来实际操作和调用这些库的功能,确保熟练数据分析中最常用的函数和模块。如果纠结去哪找练手的数据,推荐UCI经典数据集。

关于 pandas、Numpy、matplotlib 网上应该可以搜索到很多有用的资料、教程,可以看一看别人的使用技巧、应用场景,并通过联系转化成自己的经验。

因为 Python 库的更新迭代非常快,这本书里的一些内容其实已经“过时”了,这里也非常建议你去查看一些官方的文档,基本上你需要的都能查到。

pandas 官方教程文档

Numpy 官方教程文档

matplotlib 官方推荐教程文档

另外,在进行一些数据处理、数据分析的时候,你可能需要去了解一些更细节的 Python 的用法,这里就不推荐书了,因为你没必要去系统地学,按照这个菜鸟教程看看或者查询相关的用法就OK了。

Python3 教程 | 菜鸟教程



3. 深入浅出统计学 (豆瓣)

非常非常基础的统计书,适合任何一个没有基础的小白,文科生也能看懂。有人说这本书简直太简单了,但是对于数据分析来说,需要用到的恰好是这些最简单的东西。比如基本的统计量,基本上每个分析项目中都会用到。比如基本的概率分布,总体与样本的概念、置信区间、假设检验、回归分析,我去,都是为数据分析定制的统计学知识。

所以强烈推荐这本,其他的比较深度的书,并不建议在入门的阶段去啃,一方面是很多难以理解,二是即便你花大力气学习了,入门的阶段你也不怎么能在实践中使用。当然多学一些是没有坏处的,但你需要知道在什么时候学习哪些东西性价比最高。或者你自我感觉良好,誓要学最难的,从入门到放弃,得不偿失。

总结起来,需要重点了解的统计学知识如下:

  • 基本的统计量:均值、中位数、众数、方差、标准差、百分位数等;
  • 概率分布:几何分布、二项分布、泊松分布、正态分布等;
  • 总体和样本:了解基本概念,抽样的概念;
  • 置信区间与假设检验:如何进行验证分析;
  • 相关性与回归分析:一般数据分析的基本模型。

这本书非常的简单,但是基本的数据分析的一些方法都有了,你需要做的,是利用之前学过的 Python 的一些库(pandas、Numpy、matplotlib)来实现这些数据分析的方法、实现基本的可视化来进行图形化的分析。



4. 商务与经济统计学 (豆瓣)

当然,如果在后续的数据分析中,你觉得统计学的知识掌握得不是扎实,或者你非常重视分析结果中蕴含的统计学规律和原理,那么你可以更深入地了解概率统计的知识,推荐这本《商务与经济统计学》,当然吴喜之的《统计学》也非常好,选择一本即可,不必纠结。

相比《深入浅出统计学》强调易于理解,本书更加强调统计学的思想养成,所以适合有一些经验之后进行提高。很多知识你前期学习可能并不好理解其本质,而当你实际做一些数据分析项目之后,再来看这些本质的思想和原理,会得到更多的启发:哦,原来如此!

不说重点了,整本书都是重点。如果你想跟其他的分析师拉开差距,那么你就需要在有基础之后或者遇到瓶颈的时候再来看看这些经典的思想,没准能给你不少的启发。



5. MySQL必知必会 (豆瓣)

这本书把SQL写的非常简单,没办法,SQL确实也很简单。其实 pandas 就已可以实现很多数据管理的工作,而了解 SQL 的意义在于融入到实际的数据使用的场景。比如企业的数据,多是以数据库的形式存储起来的,那么如果你需要去调用你需要的那部分数据,那么 SQL 就是必须的技能。如果你在最开始就想用公司的数据来练习,那么你可以把这本书的阅读放到最前面。(当然,如果你不会遇到数据提取的问题,SQL这部分也可以暂时不管,对具体的数据分析没有影响,等到你真正需要用到SQL的时候再学习。)

MySQL 本身比较简单,对于数据分析师来说,只需要掌握基本的语句和技巧,能够进行基本的数据提取和处理就能够应对一般的数据分析需求了。

书中重点掌握以下几个点:

  • SELECT语句:让你能够去提取你需要的那部分数据;
  • DELETE和UPDATE:知道怎么实现数据的增、删、改;
  • 数据过滤:where、and、or、通配符等过滤方式;
  • 数据的汇总和分组、数据库连接:应对更加复杂的数据和相关联的数据;
  • 子查询:查询中的查询。

当然还是希望你去公司的数据库找一些数据来进行练习,如果不方便的话,也可以直接用上述 UCI数据集中的数据来进行实践。

如果遇到问题,可以去菜鸟教程查询相关操作。

MySQL 教程 | 菜鸟教程


好了,恭喜,你已经基本入门了。到此,你就完全可以去进行一个完整的数据分析项目了,如果你没有头绪,可以去找一些行业的分析报告来看看,找一找分析的思路。能够独立完成一些项目,通过数据分析能够得出一些深刻的结论,能够给人以可视化的形式将结果描述出来,能够基于历史数据对未来的一些情况进行预测,那么一般的数据分析岗位,完全可以胜任了。



6. 数据科学实战 (豆瓣)

这本书应该是数据分析和数据挖掘(机器学习)之间的桥梁。从探索性的数据分析开始,通过数据分析的思维,引出了机器学习的基本算法:回归分析、k近邻、k均值。接着通过不同的应场景分别介绍了最常见的机器学习算法,以及在真实场景中的应用。

对于做了一段时间数据分析工作的人,这无疑是进阶更高维度的好书,很难有一本书,能够让你从简单的数据分析平滑地过渡到机器学习和数据挖掘,这本书我认为是这方面做的最好的一本。

所以如果你在做一些探索性的分析遇到瓶颈之后,自然而然会进入数据挖掘和机器学习算法的坑,因为只有更高级的算法和模型,才能够支撑大规模的数据的预测。

下面列出一些书中有意思也比较有用的点:

  • 了解探索性数据分析,为更高级的需求打好基础;
  • 了解机器学习的基本算法,k近邻、k均值等;
  • 用朴素贝叶斯方法做垃圾邮件的过滤;
  • 线性回归和逻辑回归的分析方法;
  • 如何从数据中获取结论,从数据挖掘竞赛开始;
  • 构建自己的推荐系统;
  • 数据泄漏与模型评价,如何筛选模型。



二、R语言数据分析

有同学是准备用R来做数据分析,也推荐两本非常不错的书,用 Python 的同学可忽略。


  1. R语言实战 (豆瓣)

如果你是要用R语言来做数据分析,那么读完《深入浅出数据分析》之后,就可以开始读这本书了,深入浅出,可操作性极强。从工具的安装,到具体分析方法在R语言中的实现,可以说是非常的详细,是一本非常值得读的书。

知识点就不罗列了,这是一本学习路径设计非常合理的书,按照作者的思路跟着全部实现一遍,那么基本的数据分析,也就没问题了。在学会R分析的技巧之后,再看看统计学的相关知识,简直起飞。



2. ggplot2:数据分析与图形艺术 (豆瓣)

ggplot2 是 R 中一个非常强大的可视化包,书中有大量的例子,也可以下载源代码。这本书将 ggplot2 的基本原理和操作讲解的非常清楚和系统,可以说 ggplot2 是目前最优秀的数据分析作图工具之一了。其作者Hadley Wickham是学医出身,但在R数据分析及可视化领域的影响力,也非同小可。

因为本书是 ggplot2 作者(同时也是R语言很多好用的包的作者)Hadley大神自己写的,主要讲的是ggplot2绘图的整体语法思想,思路清晰,墙裂推荐。本书的英文版已经出版到第二版了,方法也从原来第一版的qplot更新为ggplot,建议如果英文过了四六级的同学可以直接学习英文版的教材。

所以对于学习R语言数据分析的同学来说,ggplot2 一定是一个不能错过的工具。



三、细分领域业务分析

这个部分其实是针对具体的业务场景了,有一些细分领域的书籍,可以给你在具体方向的一些分析的技巧和经验,因为关注的指标、数据不同,所以分析的方法也不尽相同。


  1. 社交网站的数据挖掘与分析 (豆瓣)

书中介绍了很多社交网站的数据分析方法,如果你在参与社交产品的研发、运营,或者对社交网络的数据感兴趣,那么你可以看看。

书中涉及到 Twitter 等网站的分析会有一定的启发,但其中一些东西因为网站的更新可能不适用了,但是分析方法可以借鉴,你也可以尝试去分析国内的微博之类的社交网络。


2. 精益数据分析 (豆瓣)

书中主要讲到各种产品中用到的指标和模型,这是一本写给产品经理的书,其中并没有讲到具体的数据分析技术,涉及到的更多是数据驱动型产品的一些思路。

比如怎么将数据驱动的产品落地,怎么喂产品设计数据指标。哪些指标对于产品迭代优化更有效,如何依靠数据分析来驱动用户增长等等。


3. 数据挖掘与数据化运营实战 (豆瓣)

这是一本数据化运营的书,但相比上面一本,涉及到的技术层面的东西要多很多。比一般的数据分析更高级一些数据挖掘算法都有涉及,比如决策树、神经网络、支持向量机、关联规则挖掘等等。

觉得这本书更好的一点是,它介绍了一些数据分析和运营密切相关的一些模型,比如交易模型、风险模型、推荐模型,这些其实跟电商、风控、推荐系统的自动化运营密切相关。

另外还讨论数据挖掘项目的落地、协作、有效性评价等实战,这就上升到产品的大规模数据挖掘了。前期看这本书会觉得特别的枯燥,当你在遇到大规模的真实数据分析、挖掘工作的时候,来看看这本书,或许就能得到一些启发。


4. Python金融大数据分析 (豆瓣)

在互联网金融行业,或者向往这个方面发展的,可以看看这本,在金融分析方面,时间序列会用的比较多,也建议重点了解这一块。

同时需要去了解一些常见的金融数据分析模型,比如常见的估值框架、衍生品分析库等。


最后这几本书,不推荐在前期看,并不是没有帮助,而是在相应的领域你有一定的数据分析经验之后,再去看这些书,才能得到更大的收获。



如果你觉得看书实操性不强,而且效率比较低的话,正好DC学院也推出了一门数据分析的体系课。提取了目前数据分析类书中最有效的那部分信息,学习路径更加平滑,老师实时答疑。有兴趣可以看看:数据分析师(入门)-DC学院

关注公众号(datacastle2016),获取更多数据分析干货。

强推《精益数据分析》,作为内部教材学习过一遍,感觉最大的收获就是,学习到了非常精细的方法论,以及通过很多真实的企业数据分析故事深入理解精益创业、数据分析基础,和数据驱动的思维模式。

书中提到了众多方法,都很有借鉴意义,如第一关键指标法、企业五个阶段关注指标、虚荣指标等等,都是现在众多数据分析公司真正帮助企业实践过的,讲的也非常细致,这里汇总了一下企业不同发展阶段需要关注的重要指标知识点,希望题主窥一斑而见全豹,能够有兴趣哈。

创业公司需要经历多个阶段的磨炼,磨炼过程从发现问题开始、历经解决方案的创造及其有效性的核查,并以口碑营销及资金的筹集结束。移情、黏性、病毒性、营收和规模性是精益创业的五大阶段。

精益数据分析理念如何应用在精益创业中?


移情阶段

创业者想法不断,真正有价值的想法很少,有一个想法并可以走出去验证如何基于它去构建数据分析指标非常难,能够做到移情用户,产品的方向便不会偏差。

主动聆听用户的声音,找到背后的真相或规律。通过定性指标检测我们可以发现问题是否值得付诸行动。数据分析是必备的衡量工具。

开始人们为了发现未知的机遇,展开探索开放式的定性讨论;

后来,为了找到问题的正确解决方案,将话题量化与聚合;

最后使用工具批量获取用户答案,找到共性,确定产品方向,捕捉用户群。


黏性阶段

进入了 MVP(最小可行性产品)阶段后,最主要的问题是,开发出来的产品需要有粘性,以保证用户获取工作不是无用功;

创业者的目标是吸引用户成为回头客;

本阶段的关键是用户参与度,以用户的产品交互时长和回访率作为衡量标准;

MVP 产品也需要以感染客户、员工及投资人为目标,此外还需要验证从现在到未来愿景的转变;

在证明人们会如你所愿使用产品前,不要加快开发速度;

优化产品粘性的同时,利用群分析来衡量每一次产品改动带来的影响。


病毒性阶段

大部分公司依靠渐进式增长无法存活,增长需要压倒性的竞争优势,数据驱动下的病毒式增长帮助企业迅速打开市场。

产品要具有从现有“已感染”用户到新用户的传播能力;

口碑传播对客户增长有益,并降低总体获客成本;

数据驱动下的病毒性增长要从“原生病毒性”、“人工病毒性”和“口碑病毒性”三个角度划分,区别对待;

病毒性阶段需要寻找未来增长的先行性指标,即在用户生命周期按早期可预测(控制)未来的可衡量指标。


营收阶段

营收阶段旨在将工作重心从证明产品的价值转移到证明证明产品可以自给自足进行获利。第一关键指标将会转移,如关注平均每位客户营收,并关注相关指标如转化率、订阅量、广告营收、客户终身价值等,使用这些指标和获取速度大于流失速度的新用户获取成本作比较;

营收阶段的核心公式是用客户收益回报减去客户获取成本;

找到新的关注重点,如客户每单更高的消费、更多的客户、更高的效率和更高的频率等。


规模化阶段

规模化是创业的最后一个阶段,不仅意味着客户群增多,还意味着新市场的开辟、一定的可预测性和可持续性以及新伙伴的合作。营收模式证明的是商业模式的成功,规模化阶段证明的是市场大小。

公司的市场越大,就会知道市场非常拥挤,每个人都在吸引用户的注意力,注意力的成本会随着信息的泛滥而水涨船高。比较不同渠道、地域和营销活动内的高阶指标成为重点;

关心薪酬、API 流量、渠道关系、竞争者等时机成熟;

规模化兼顾效率和差异化十分困难,追求效率需要节约成本,追求差异化需要扩大利润率;

随着公司的发展,需要在同一时间关注不止一个指标,为不同指标建立层级关系,以使策略、战术和执行与公司的长期目标一致。


开卷有益,共同学习~最后加个小小的彩蛋

《精益数据分析》的作者阿里斯泰尔·克罗尔近期将会到中国参加2017数据驱动大会,分享大数据的前瞻内容,欢迎关注哦~

《精益数据分析》,我司入门必读书目。网易创始人 & CEO 丁磊重磅推荐:《精益数据分析》破除了创业教条”。Clarity CEO 评价《精益数据分析》弥补了精益创业的缺憾。目前已被翻译成8国语言销售,内忧100 多位创始人、投资人和创新者的成功创业经验。

我在个人知乎专栏中写过关于此书的读书笔记,《精益数据分析》读书笔记(上) | 你孜孜追求的“增长” 可能只是自嗨等。部分内容如下:

对于创业公司来说,不同发展阶段都有一个高于一切、需要你集中全部注意力的数字,即 OMTM(One metric That Matters),即第一关键指标。精益数据分析的核心思想之一是,确定商业模式和创业阶段后,即可跟踪并优化当前的创业第一关键指标。

按照精益数据分析理论,企业的发展经历移情阶段、黏性阶段、病毒阶段、营收阶段、规模化阶段,每次进阶都有需要破解的“关隘”,这些指标代表你可以进入下一阶段的关键指标。

你的企业处于哪一阶段?如何进入下一阶段?

图1 精益数据分析阶段及进入下一阶段的关隘

精益数据分析下的三大商业模式——电商、SaaS、媒体

企业指标的关注因商业模式而异,因企业发展阶段而异——企业具有多种商业模式,不同商业模式在企业发展的不同阶段所关注的指标不尽相同。下面列举电子商务、SaaS 企业、媒体三种常见的企业类型,其增长的关键是什么?不同发展阶段所关注的指标有哪些?

第一,电子商务企业。

电子商务企业,移情阶段真正重要的问题是:他们会从你这里买走等价商品吗?

电商企业增长的关键:他们会找到你的产品,并向他人推荐吗?

收入的主要来源:交易量。

图2 电子商务企业不同发展阶段应该关注的指标

第二,SaaS 企业。

移情阶段真正重要的问题是:用户会为解决问题付钱吗?

增长的关键:他们会注册、逗留,并告知他人吗?

收入的主要来源:活跃用户。

图 3 SaaS 企业不同发展阶段应该关注的指标

第三,媒体企业。

移情阶段真正重要的问题是:他们会反复参与产品内容吗?

增长的关键:你能将流量提升至可以盈利的状态吗?

收入的主要来源:广告营收。

图4 媒体企业不同发展阶段应该关注的指标

综上,模式+阶段决定了企业应该关注与跟踪的指标。这帮助企业克服许多公司或项目在早期都会面临的风险,让企业产品满足客户真实需求,在明确方案等坚定的基础上发展。


神策数据创始人&CEO 桑文锋所著《数据驱动:从方法到实践》京东预售正式开启。

购买地址:《数据驱动:从方法到实践》- 京东图书

本书由《精益数据分析》作者Alistair Croll、网站分析和互联网营销分析教父级专家宋星、互联网数据官创始人车品觉等亲笔作序。由红杉资本、线性资本、百度、今日头条、百联、纷享销客、饿了么、杏树林、造数科技十位高管力荐。

数极客数据分析师老衲之前写过一篇学习数据分析推荐书单的文章《荐书|盘点学习数据分析必看书单》正好对应此问题,推荐给想学习数据分析的同学借鉴参考。


老衲将数据分析分为三个阶段进行进阶,从小白入门级别到进阶,到高级数据分析每个层次需要的能力不同,关注的数据指标和思维也不同,因此在学习内容和层级上要进行区分,由简入难,循序渐进,掌握好定位和学习进度,才能更快更好的学号数据分析这门技能。


下面是文章正文:

对于Hal Varian说的这段话,非常赞。

每一个行业的技能,都需要由浅入深,小编盘点了众多数据分析大牛推荐的学习数据分析的书籍,并按照入门,进阶,高级三个等级进行了分类,还亲自准备了经典书籍的pdf电子书数据包赠送给需要学习数据分析的小伙伴。



还记得那句扎心的话吗:“这个世界正在惩罚那些不读书的人”。当你在抱怨薪水低,生活压力大的时候,别人已经读完了下面一大半的书籍,做了比你多不止两倍的数据分析案例,总结了十几篇的数据心得,请教了不止一两个的行业资深专家。

每一个行业的技能,都需要由浅入深,小编盘点了众多数据分析大牛推荐的学习数据分析的书籍,并按照入门,进阶,高级三个等级进行了分类,还亲自准备了经典书籍的pdf电子书数据包赠送给需要学习数据分析的小伙伴。先深刻评估一下自己的知识储备,如果还不够,那就从初级入门的书单中挑选一些恶补一下。如果你已经达到了高级运营或者产品经理的程度,那就从进阶或者高级进阶开始加深专业度。你也可以和那些大牛一样,找到适合你的业务需要方向,拿起一本书,每天专注研读半小时,利用十分钟做一个思维导图,几个月过去,你就是一个精通数据分析的小专家了。


数据分析入门书籍对数据分析没有整体概念的人,应届毕业生,经验尚浅的转行者等。

1《谁说菜鸟不会数据分析》


这本书通俗易懂,全书8章分别讲解数据分析必知必会的知识、数据处理技巧、数据展现的技术、通过专业化的视角来提升图表之美、数据分析报告的撰写技能以及持续的修炼。讲解的很详细,适合数据分析小白入门。

2《赤裸裸的统计学》


作者是(美)查尔斯·惠伦(Charles Wheelan)

学习数据分析,了解统计学是必须的。这本书用生活有趣的案例、直观的图表揭开了统计学、大数据和数字的“神秘面纱”,让你知道权威期刊、媒体新闻、民意调研中公布的数字从何而来,轻松掌握判断这些统计数字“是否在撒谎”的秘籍。

3《深入浅出统计学》

Headfirst 类书籍,同上,可以帮助你快速了解统计方面的知识。

4《深入浅出数据分析》


电子工业出版社的经典书目系列,从数据分析基本步骤开始、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧一一讲到。图比较多,适合入门。

5《R语言实战》


R是属于GNU系统的一个自由、免费、源代码开放的软件,用于统计计算和统计制图。这本书从实用的统计研究角度逐例分析R在数据处理、模型构建、以及图形操作上的由浅入深的结合,堪称经典。


看完这些,数据分析的理论就基本入门了,然后再根据你的业务需要做系统的学习,然后进入进阶阶段。


数据分析进阶书籍具有一定的业务需求,具备了一定的分析常识,比较适合网站分析师,商业分析师以及数据产品经理。

1《Python for Data Analysis

Python数据分析必看,作者有多年的Python数据分析工作经验,对各种Pyhon包iPython,NumPy,pandas,matpotlib等有着很深的理解。看完这本,敲完代码,Python数据分析就算入行了。

2《Data Science for Business

很多牛人为之作序,数据科学如何与商业结合,相信这本书会给你一些启发。

3《Python Data Science Handbook

作者(Jake VanderPlas)是华盛顿大学电子科学研究所的高级数据科学研究员,研究领域包括天文统计学、机器学习和可扩展计算。书的前半部分介绍了用于数据分析和一般的科学计算的基本Python库,后面从实际应用的角度使用Python库scikit-learn开始机器学习实践。适合有一定Python基础人(或者R基础),并且想学习如何使用Python进行数据分析的人。

4《Storytelling with Data

作者Cole NussbaumerKnaflic,私募分析师,前Google人力分析团队总监。本书展示了如何高效率展示量化资讯,如何用丰富的资料讲故事。Google内部的数据可视化课程讲师,之前也在Maryland Institute College of Art兼职讲师。

5《数据挖掘概念与技术》


这本书很全面地讲述数据挖掘领域的重要知识和技术创新。在第1版内容相当全面的基础上,第2版展示了该领域的最新研究成果,例如挖掘流、时序和序列数据以及挖掘时间空间、多媒体、文本和Web数据。

6《数据挖掘导论》

这本书介绍了数据挖掘,很全面,涵盖了五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章:前一章涵盖基本概念、代表性算法和评估技术,而后一章讨论高级概念和算法。与许多其他同类图书不同,本书将重点放在如何用数据挖掘知识解决各种实际问题。

这本是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,由于独具特色,正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。

7《数据挖掘技术——市场营销、销售与客户关系管理领域应用》

这是一本优秀的数据挖掘教材,全面而系统地介绍了数据挖掘酌商业环境、数据挖掘技术及其在商业环境中的应用。

内容涵盖核心的数据挖掘技术,包括:决策树、神经网络、协同过滤、关联规则、链接分析、聚类和生存分析等。此外,还提供了数据挖掘最佳实践的概观、数据挖掘的最新进展和一些极具挑战性的研究课题,极具技术深度与广度。

8《精通web analytics 2.0》

以网站分析为主,作者是Avinash Kaushik,译者是郑海平,邓天卓,两位作者是国内网站分析领域比较有经验的牛人,翻译是比较专业的。此书虽老,但其中很多思想和流量分析的案例仍然很有借鉴意义,现在纸质书只能上淘宝买旧书了。与此类似的有《网站分析实战》,是国内一本讲网站分析的书,没有上面经典,但胜在新出,很多案例和理念都有及时的更新。

9《数据化管理》

黄成明著,讲解在企业中应用数据的例子,读完受益匪浅,里面举的很多例子都很接地气。虽说偏向于零售业管理,但大道归一,可适用于很多行业,当时依据里面的理念规划了美团外卖面向 BD 的数据产品

10《SQL从入门到精通》

学习 SQL 的入门书,SQL是个性价比很高的技能,简单而强大。任何想进一步提高自己数据分析技能的产品/运营/分析师 同学,都建议点亮这个技能点。


数据分析高级进阶高级进阶就需要数据分析知识和分析模型功底更加深厚了,如涉及到企业内部数据治理,数据结合的业务分析,数据可视化等。

1《决战大数据》

阿里巴巴前数据副总裁车品觉老师所著,讲解了阿里巴巴在企业内部治理数据过程中的心得,所讲“存-通-用”数据管理三板斧和“从数据化运营到运营数据”。

2《精益数据分析》

此书优势在于将企业分成了几个大的行业类别,并分门别类的讲解了每个行业的商业模式特点及分析技巧,对使用者的分析能力要求较高,且必须具备相应的业务知识。

3《The Wall Street Journal Guide to Information Graphics》

华尔街日报负责商业分析的人做的可视化指南,精华且实用。


4《网站分析实战》


这本书适合网站运营人员、网络营销人员(SEO、SEM、EDM)、网站产品经理和个人站长阅读,本书也适合计算机专业或者市场营销专业的自学。


公众号分析派(ifenxipai 数据分析干货平台)后台回复“书籍”,获取经典书籍电子书。

书不在多,而在于精。下面从数据分析招聘要求的必须技能:统计学,Excel,SQL,业务知识,Python这5个部分来详细聊聊每一步如何去学习

  • 第1步:统计学

1)统计学有什么用呢?请给我一个学习的理由

如果你打开招聘的职位要求,都会要求具有统计学的知识,这是因为统计学是数据分析、机器学习的基础知识,是必须要学习的。

然而很多人因为不明白学习统计学的意义是什么,统计学在生活中有什么用,而最终学的没有目的。下面的书会让你知道学习的意义是什么。

推荐理由:很多人感到统计学无聊,是因为从一开始就没有明白学习这门课的意义是什么,所以学下去的动力不足。《赤裸裸的统计学》可以让你了解学习统计学的意义什么?在日常生活中统计学有什么用?你也可以把它当作一本科普书来读。


2)如何深入学习统计学?

前面的书让你知道了学习的意义是什么,具备了统计学思维。接下来,就可以进一步学习统计学在数据分析中是如何使用的。

推荐理由:如果你是零基础,《深入浅出统计学》可以让你轻松愉快的学会,书里面有通俗易懂的案例,图文并茂,学习统计学不会那么枯燥。

推荐理由:适合有基础的人看。如果你之前学过些统计学,但是又还给了老师,那么,有一定基础的你,《商务与经济统计》可以深入了解统计学。但是,注意了,如果你是零基础,看这本书会有些困难。


  • 第2步:Excel数据分析

这部分可以看我之前讲过的这个live可以快速掌握:怎样用 Excel 做数据分析?

  • 第3步:如何使用SQL进行数据分析

推荐理由:零基础入门,只推荐一本书那就是《SQL基础教程》。这本书写的也是通俗易懂,里面的案例也很贴合实际应用。

有人会推荐《SQL必知必会》,其实这本书零基础的人看不懂,有基础的倒是可以把这本书当做一本字典来使用,遇到问题了,可以查找对应的内容。

对应的入门课程:

从零学会SQL:入门
  • 第4步:业务知识

数据分析是一个行业特征很明显的职业。如果你说自己想进入“互联网行业',那就说明你还没想清楚到底要干什么。

因为互联网的存在是为了解决某个行业的问题(互联网+行业),比如滴滴、高德地图解决的是出行交通行业的问题(互联网+交通出行),小学英语在线平台vipkid解决的是教育行业的问题(互联网+教育),蚂蚁金服解决的是金融行业的问题(互联网+金融),饿了么解决的是餐饮行业的问题(互联网+餐饮)。

而这些行业都需要数据分析师,每个行业域的业务知识也不一样。你以后找的也是成为XXX行业的数据分析师。只有确定了行业,才能研究这个行业是什么,对症下药,这样成功转型的概率最大。

下面推荐几个行业的书,可以帮助你掌握该行业的业务知识,在面试中可以回答业务知识相关的面试题。学会面对一堆数据,正确分析的思路是什么。选择自己将要从事的数据分析所在行业的学习即可。


电商行业:《数据化管理:洞悉零售及电子商务运营》

游戏行业:《游戏数据分析实战》

网站:《网站分析实战》

HR行业 《人力资源与大数据分析》

金融行业:《消费金融真经:个人贷款业务全流程指南》

其他行业:国外作者肖恩的《增长黑客》

推荐理由:里面案例细节很多,可执行性很强,有理论有实践。其中的AARRR漏斗分析是经典的数据分析方法:一文看懂产品运营的分析方法


  • 第5步:如何使用Python进行数据分析

Python毋庸置疑是人工智能时代排名第一的编程语言。学习Python分为两部分:

1)掌握Python基础语法

2)学会如何使用Python进行数据分析

推荐理由:如果之前没有学过编程,那么看其他编程的书会让你无聊,最后导致放弃。而《与孩子一起学编程》图文并茂,对于入门学习Python基础语法比较适合。

这本书的英文名是《Hello World! Computer Programming for Kids and Other Beginners》,比起中文名《与孩子一起学编程》来,区别在于这本书不仅仅适合于训练孩子对编程的兴趣,对于任何对编程有兴趣的人,都是不可多得的一本编程入门书。


推荐理由:前面的《与孩子一起学编程》可以帮助你学会Python基础语法。学会以后,就可以看《利用Python进行数据分析》学习如何使用Python进行数据分析了。

在知识的海洋里,一次小小的偶遇,可能就是你苦候良久的邂逅。


机器学习入门要看的书有哪些?


猴子聊数据分析

如果你找一个熟悉的朋友给你推荐书单,他会倾向于越短越好,因为他想把他知道的最好的推荐给你,让你少花时间在不重要的事情上

但如果你在网上看到一个书单,往往会发现都很长长长长长,长到你觉得别人都能日读40万字而自己是个天天刷朋友圈的懒癌患者。别担心,告诉你个小秘密, 列书单的人很可能自己也没读完书单里的书哦

所以我想做的是像你的朋友一样,推荐一份数据分析入门的极简书单给你,并且帮你深度评测,告诉你什么是最值得读的、不得不读的。

你不是吃个火锅都要看评测吗?吃火锅也就花个两小时吧,但是读一本书,很可能要花上一个月时间呀,这么大的时间成本,总应该更慎重的做出决定吧。

以下评测会从数据分析岗位必备的三个技能出发:

  • SQL
  • 统计学
  • Python 数据分析

最终获得的结果是相应的3本最推荐的入门书。

SQL 入门

一提到 SQL 入门,呼声最高的是这3本书:

《MySQL必知必会》- Ben Forta - 豆瓣

《SQL必知必会》- Ben Forta - 豆瓣

《SQL基础教程》- Mick - 豆瓣

▍《MySQL必知必会》还是《SQL必知必会》傻傻分不清楚?

首先要搞清楚的一件事,《MySQL必知必会》和《SQL必知必会》是同一个作者 Ben Forta ,《SQL必知必会》的前20章所有内容在《MySQL必知必会》里都有,并且多了10章针对 MySQL 的内容。

这是作者在前言中的解释:

考虑到在中国 MySQL 还是占主流,评测时选择了后出版的、内容更丰富的《MySQL必知必会》。

(出版社喜欢把这两本捆绑在一起卖,真的没必要都买,80%内容都雷同的)


▍知识结构 PK

先放上两张我悉心整理的全书思维导图,一眼就可以看出《MySQL必知必会》和《SQL基础教程》的不同:

《MySQL必知必会》思维导图

高清大图链接:https://video.mugglecode.com/MySQLcrash.png

《SQL基础教程》思维导图

高清大图链接:https://video.mugglecode.com/SQLmick.png


《MySQL必知必会》这本书讲解的非常的全面,光是最常用的 SELECT语句就花了12章来细细讲解。并且整本读下来会感觉到逻辑是非常清晰的,时刻知道自己学的是知识体系上的哪一个分支。

而《SQL基础教程》的讲述结构并不是按照知识的逻辑,而是按照使用的逻辑。所以你会看到在思维导图上会出现同一章的不同节被拆开放到了不同分支的情况,第三章第一节还在讲聚合函数,到了第二节就去讲 SELECT 语句的 GROUP BY 子句了,因为在作者看来这两节都是用来解决「聚合与排序」这个使用场景的问题,所以就被归纳到了一起。

和《MySQL必知必会》相比其实是少了很多知识点的,《MySQL必知必会》用了4章去讲解的 WHERE 子句,在《SQL基础教程》中就只有1小节带过。


▍讲述方式 PK

这里对比一下最基本的 SELECT 语句这个知识点的讲述方式:

《MySQL必知必会》的讲述方式几乎没什么废话直接上案例,需要输入什么代码,会输出什么结果,都用很清晰的方式呈现出来。对于一些细枝末节的细节提示和说明,都采用灰框的方式附在案例后面逐一列出。

《SQL基础教程》使用了双色印刷,配了表格图片去帮助读者理解。在案例代码之前,还会多给一个基本语法的示例,讲解同一个知识点的篇幅会更长,甚至会有点啰嗦。

对比来看,《MySQL必知必会》的简明的讲述方式更适合喜欢简单直接的理工直男,《SQL基础教程》更适合喜欢详尽说明的文科生

对学习过程的考虑 PK

《MySQL必知必会》在每章的开始会有一个一句话简介,每章的末尾会有一小段的小结,和整体的行文风格一样,都是非常简明扼要的,也方便查阅

《SQL基础教程》在每章和每节开始之前会有一个详尽的说明和学习重点清单,在每章结束时会有几道练习题

▍SQL 入门推荐书:《MySQL必知必会》

如果你需要在工作中用到 SQL,还是更推荐《MySQL必知必会》,这本书的知识点覆盖是更全面的,简明扼要的风格也方便随时查阅。

如果你缺乏理工科背景、抽象思维比较弱、注意力已经被碎片化阅读摧毁,可以先阅读《SQL基础教程》,更便于你理解。能上手了之后,再去读《MySQL必知必会》补全知识体系。


统计学入门

作为统计学的入门,我们以这两本书来进行深入对比。

《深入浅出统计学》- Dawn Griffiths - 豆瓣

《商务与经济统计学》-詹姆斯·麦克拉夫 -豆瓣

统计学的教材可以说是非常多了,并且相似度很高,在这里选取人大出版的这本经典之作《商务与经济统计学》。有些 900 多页的教材属于进阶学习,不算是入门书了。

另外一些社科鸡汤类的书也没有放进来,在我看来,人是无法以绕开知识本身的方式学到知识的。

▍知识结构 PK

还是先放两张全书思维导图

《深入浅出统计学》思维导图

高清大图链接:https://video.mugglecode.com/HeadFirstStatistics.png

《商务与经济统计学》思维导图

高清大图链接:https://video.mugglecode.com/StatisticsForBE.png

《深入浅出统计学》涵盖了基本的统计学概念,默认读者是零基础,甚至连平均数、中位数这种小学六年级教材中的基础知识都会细细讲解。一般来说,一本书越是照顾零基础,书的知识点深度就会越低,这本也不例外。包括比较重点的描述统计、假设验证都停留在简单例子的步骤上。当然,这种方式的好处是激发读者兴趣,如果一本书是用漫画或者小说去讲解统计学,那知识点深度就更低了。

《商务与经济统计学》的结构就是按照知识的逻辑来进行讲述的,知识难度会循序渐进的去递进,先让你理解最简单的情景,再逐渐去增加情景的复杂度,比如从单样本到多样本,从简单线性回归到多元线性回归。并且所有案例都是基于真实的数据去展开的,这也让知识点的覆盖更加全面。


▍讲述方式 PK

这里用统计学里一个经典的知识点「正态分布」来对比两本书讲述方式的不同:

《深入浅出统计学》用生活中的小事作为案例,一个女生找高个男朋友的例子去引出正态分布的概念,用了很多的插图去辅助读者理解,并且每个概念后面会有一个「世上没有傻问题」的栏目去整理出所有的常见问题和回答,解答初学者心中的疑问。

我还没见过看不懂《深入浅出》的人呢,这个难度高一学生也能看懂的。有些地方甚至会感觉太简单而读不下去。

《商务与经济统计学》不像一般的教材会写大段的概念和定义,而是用了大量的例子帮助读者真正理解,讲正态分布这一个概念就用了 9 个例子。并且这些例子都是用的真实的数据和贴近实际工作的场景。

▍对学习过程的考虑 PK

《深入浅出统计学》的「动动脑」栏目通过问题促使读者思考。「动动笔」栏目通过几道练习题,让你动手练习,在下一页有「动动笔解答」。「要点」栏目概括了这一小节的重点内容。

《商务与经济统计学》每章有一个章末小结,包括这几点:

  • 关键术语
  • 关键符号
  • 关键知识点
  • 关键公式

所有总结要点都以要点或表格的方式简练概括。另外还有本章相应的练习题。

▍统计学入门推荐书:《商务与经济统计学》

如果你是理工科背景、或者在本科学习过高等数学,可以选择《商务与经济统计学》,其中大量的实际案例能让你更容易补全知识体系、上手实际应用。

如果你的数学基础较弱,可以选择《深入浅出统计学》,跟着练一遍,这是人人都能看懂的。


Python 数据分析入门

数据分析入门的经典书籍,我们以这两本口碑最好的来进行对比:

《利用Python进行数据分析第一版》- Wes McKinney -豆瓣

《利用Python进行数据分析第二版》- Wes McKinney -豆瓣

《Python数据科学手册》- Jake VanderPlas -豆瓣

▍利用 Python 进行数据分析第一版还是第二版?

这个问题下几乎所有高票回答都放的是第一版的封面图,在这里旗帜鲜明的反对!

第一版和第二版隔了整整 6 年时间;第一版用的是 Python2.7,第二版用的是 Python3.6;第一版用的是 pandas 0.1.0 版本,第二版用的是 pandas 0.22.0 版本。技术变化这么快,当然要选第二版。

而且两个版本很好区分的,第二版的耗子头是朝左的,而不是像第一版那样朝右的。读者朋友们,请认清朝左的耗子头啊!

▍知识结构 PK

还是先放两张全书思维导图

《利用Python进行数据分析 第二版》思维导图

高清大图链接:https://video.mugglecode.com/PythonForDA2nd.png

《Python数据科学手册》思维导图

高清大图链接:https://video.mugglecode.com/PDS.png

《利用Python进行数据分析》这本书的层级结构设计的非常漂亮,我特地用了不同的颜色去体现了他的层次。大家都知道,这本书的作者 Wes McKinney 就是 pandas 库的主要作者,但这本书的结构并不是围绕着 pandas 库而展开的——不然就直接去看 pandas 文档好了。这本书的结构超越了某个库或者某个语言,最核心的部分是以数据分析的工作流展开的,从数据载入、数据清洗、数据规整到数据可视化、数据建模。这种结构对于不熟悉数据分析工作流的读者是非常有帮助的。


《Python数据科学手册》这本书的结构非常扁平,就 5 章。第 1 章着重介绍了作者偏爱的 IPython 的各种用法,然后 NumPy, pandas, matplotlib 各一章,第 5 章是机器学习。整体是以知识逻辑去组织的。

▍讲述方式 PK

这里选取数据清洗工作中的一个关键知识点「过滤缺失值」来进行两本书的对比。

《利用Python进行数据分析》在讲解「过滤缺失值」时会选取最好用的一种方法进行细致讲解,然后说明了如何剔除含有缺失值的行、列。以及个性化的配置。

《Python数据科学手册》在讲解「过滤缺失值」时也使用了 dropna() 方法,代码部分几乎和《利用Python进行数据分析》一致,文字叙述上对使用场景的叙述会略多一些。

▍对学习过程的考虑 PK

《利用Python进行数据分析》有比较简略的每章前言和每章小节,比较有特色的是篇幅中会穿插 3 类提示,分别是:提示或建议、一般性说明、警告。另外会有大量表格整理有用的方法。没有练习题。

《Python数据科学手册》把上章小结和本章前言合并在一起讲。另外每章末尾有一个参考资料合集。也没有练习题。

数据分析入门推荐书:《利用Python进行数据分析 第二版》

《利用Python进行数据分析 第二版》的知识结构更胜一筹。

这本书的作者 Wes McKinney 就是 pandas 库的主要作者。全书最核心的部分是以数据分析的工作流展开的,从数据载入、数据清洗、数据规整到数据可视化、数据建模。这种结构对于不熟悉数据分析工作流的读者是非常有帮助的。

下次,如果你有朋友问你,学数据分析应该看哪本书?就直接把这篇测评发给他就可以啦。


关注微信公众号「麻瓜编程」,回复「小白书」获得20万读者喜爱的 《编程小白的第一本Python入门书》

数据分析在不远的将来可能是除了办公软件以外,另一个职场人士都需要掌握的计算机基础技能吧。

微信读书App应该是我见过的体验最好的阅读软件,以前大多数读书App正版好书比较少,而通过微信读书你却可以找到非常多值得一看的计算机专业书籍,更为重要的是只需购买一张无限卡,所有的好书你都可以饕餮一番。

我们都知道计算机专业书籍通常比较贵,对很多人来说,即使有很多人向你推荐一些他们认为不错的书单,由于囊中羞涩,可能你都很难买来加以学习与鉴别。

有了微信读书,书单对你而言,才有了真正的意义。而下面为大家推荐的书单价值近千,绝对值得你购买的微信阅读无限卡。

在大数据时代,数据思维已开始深刻变革各行各业,从我们的电商消费信息、运动轨迹、社交数据、产品使用习惯...,到企业的调研、设计、产品、运营、营销...,再到交通、金融、生产制造、公共服务。

而由于Python在数据获取、数据处理、数据分析、数据挖掘、数据可视化、机器学习、人工智能等方面有着非常多成熟的库以及活跃的社区,构成数据科学领域最为完整且完善的生态。用Python来处理数据也就大行其道了。

下面我们就从微信读书里精心挑选一些Python、数据分析方面的书,大家可以尽情畅读。

数据分析入门

下面推荐的书都是数据分析的应用,你不需要有任何技术基础就可以看。非从业者、想转行者可以拿下面这些书当成数据分析的入门科普读物;会Python数据分析的程序员则可以来了解数据分析是如何与设计、产品、运营、营销等结合的;设计人员、产品经理、营销人员、运营人员、创业者等等,则可以训练一下数据思维。

一、产品增长力

一句话点评:数据科学有非常多的职业发展方向,这本书主要是数据分析在互联网产品、运营等方面的应用,非常适合从事互联网工作以及想了解数据分析是如何与互联网业务结合的朋友。

豆瓣简介:本书由京东资深数据产品经理撰写,重新定义了数据与产品、业务的关系,从数据分析方法、数据价值挖掘、数据结果倒逼业务优化3个层次,以及设计、运营和优化3个维度,为产品增长提供了科学的依据和方法论,得到了PMCaff创始人阿德、GrowingIO创始人&CEO张溪梦、增长官研究院创始人范冰、腾讯高级产品经理刘涵宇等专家的高度评价。

二、大数据时代

一句话点评:大家可以把这本书看成是一本大数据的科普读物,了解大数据带来的思维变革、商业变革、管理变革。


豆瓣简介:《大数据时代》是国外大数据研究的先河之作,本书作者维克托?迈尔?舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。

三、精益数据分析

一句话点评:这本书虽然属于精益创业丛书,但是由埃里克·莱斯创造的精益思想,以及敏捷开发早已在渗透到企业的方方面面,而这本书有助于你如何根据数据来采取行动。对管理者来说,这是一本高星必读好书,对小职员来说,这也是一本不错的普及读物。

豆瓣简介:阿利斯泰尔,企业家、作家、演讲家,用户体验管理先锋公司Coradiant联合创始人。曾花大量时间研究各种规模的组织如何使用数据做出优良决策、加速创业过程。他职业生涯的大部分时间都是技术公司的产品经理,是O'Reilly Strata、TechWeb Cloud Connect、Interop企业云计算峰会、International Startup Festival(国际创业节)等5个国际知名技术大会的主要发起人。

四、增长黑客

一句话点评:这本书也多多少少与创业有关,其实这里的创业应该看成是精益、轻装前进的代名词,而快速增长是产品也好、企业也好都在追求的目标。因此增长黑客有点近似于数据分析在产品运营领域的应用。

豆瓣简介:“增长黑客”这一概念近年来兴起于美国互联网创业圈,最早是由互联网创业者Sean Ellis提出。增长黑客是介于技术和市场之间的新型团队角色,主要依靠技术和数据的力量来达成各种营销目标,而非传统意义上靠砸钱来获取用户的市场推广角色。他们能从单线思维者时常忽略的角度和难以企及的高度通盘考虑影响产品发展的因素,提出基于产品本身的改造和开发策略,以切实的依据、低廉的成本、可控的风险来达成用户增长、活跃度上升、收入额增加等商业目的。简单来说,就是低成本甚至零成本地用“技术”来让产品获得有效增长。

五、增长黑客

一句话点评:增长黑客的鼻祖,两名作者都是业内资深的运营、营销专家,可不只是纸上谈兵的那一种。这本书应该已经是互联网运营教科书般的存在了吧?

豆瓣简介:首屈一指的增长黑客网络社区http://GrowthHackers.com的联合创始人兼CEO。网站拥有180万全球用户。肖恩于2010年提出了“增长黑客”一词,也是增长黑客大会的发起人。创业公司和财富100强企业的商业智库。《纽约时报》《华尔街日报》《连线》《快公司》、http://Inc.com和TechCrunch等诸多媒体都对他进行过报道。

六、数据驱动设计

一句话点评:对于经常从事AB测试的产品经理来说,这本书写得比较浅显,不过对于设计师、用户研究员、市场营销人员、传统的业务经理、产品经理来说,这本书可以让大家了解AB测试如何提升用户体验。还有这是O’REILLY出的动物书,你懂的。

豆瓣简介:本书重点关注定量实验与A/B测试,因为我们发现,数据分析与设计实践在此鲜有交集,但相对的潜在价值与机会缺大。本书提供了一些关于在组织中开展数据实践的观点。通过阅读这本书,你将转变你的团队的工作方式,从数据中获得大收益。后希望你可以在衡量指标的选择、佳展示方式与展示时机、测试以及设计意图增强方面,自信地表达自己的思路。

七、统计学七支柱

一句话点评:作者是统计学领域的专家,有个非常厉害的老爸,不过这本书主要是写给非统计学专业人士看的科普读书,让你了解统计学七大思想,毕竟很多想从事数据分析的职业人士数学都忘得差不多了,直接看统计学怕顶不住。

豆瓣简介:Stephen M.Stigler,著名统计学家、统计学史研究家,芝加哥大学教授。其父是诺贝尔经济学奖得主George J. Stigler。除本书外,还著有《统计探源》等统计学著作。本书介绍了统计学的七个基本思想——聚合、信息、似然、相互比较、回归、设计、残差,从其由来到引入,从基本概念到对“统计”这门学科的深远影响,并由此深入阐述统计学的科学本质。

数据分析技术

想真正的进行数据分析实战,还是得掌握一套数据分析的工具,Excel、SPSS、R、Tableau、SAS这些就不推荐了,有了Python数据科学生态,这些都是可以在一定程度上被取代的。

一、SQL必知必会(第四版)

一句话点评:要学数据分析,先得学习数据的源头数据库的操作语言SQL,掌握了SQL你就可以彻底和Excel说byebye了,如果你还是在小公司或者技术比较落后的公司做数据分析,哦,当我没说,“儿子也可以打老子”。

豆瓣简介:本书是麻省理工学院、伊利诺伊大学等众多大学的参考教材,是深受世界各地读者欢迎的SQL经典畅销书,内容丰富,文字简洁明快,针对Oracle、SQL Server、MySQL、DB2、PostgreSQL、SQLite等各种主流数据库提供了大量简明的实例。与其他同类图书不同,它没有过多阐述数据库基础理论,而是专门针对一线软件开发人员,直接从SQL SELECT开始,讲述实际工作环境中最常用和最必需的SQL知识,实用性极强。通过本书,读者能够从没有多少SQL经验的新手,迅速编写出世界级的SQL!

二、SQL入门经典

一句话点评:一本书都出到了第五版,这本书不是经典也是经典,虽然上面已经推荐了一本类似的书,专注研究其中一本就可以了,不过经典不推荐一下实在可惜。

豆瓣简介:《SQL入门经典(第5版)》的作者都是数据库教学与应用的专家,有着丰富的经验。《SQL入门经典(第5版)》详细介绍了SQL语言的基本语法、基本概念,说明了各种SQL实现与ANSI标准之间的差别。书中包含了大量的范例,直观地说明了如何使用SQL对数据进行处理。每章后面还有针对性很强的测验与练习,能够帮助读者更好地理解和掌握学习的内容。在最后的附录里还有关于安装MySQL的详细介绍、书中用到的关键SQL语句、测验和练习的答案。

三、MySQL必知必会

一句话点评:结合MySQL来学习SQL是最为推荐的方法,这三本书一起看,在电脑上操作一遍。

豆瓣简介:Ben Forta是世界知名的技术作家,也是Adobe技术界最为知名的专家之一,目前担任Adobe公司的高级技术推广专家。他具有计算机行业20多年工作经验,多年来撰写了十几本技术图书,其中不少是世界畅销书,已被翻译为十几种文字。

四、Python学习手册(第4版)

一句话点评:学就学Python 3,这本书讲的就是Python3,动物书经典没话说,算是最好的学习资料之一吧。

豆瓣简介:作为全球Python培训界的领军人物,《Python学习手册:第4版》作者Mark Lutz是Python最畅销书籍的作者,也是Python社区的先驱。

五、Python编程:从入门到实战

一句话点评:这本书比上本简单一点,还有一些实战案例,做数据分析不需要太深的Python编程知识,这两本书基本就足够了。


豆瓣简介:本书是一本针对所有层次的Python 读者而作的Python 入门书。全书分两部分:第一部分介绍用Python 编程所必须了解的基本概念,包括matplotlib、NumPy 和Pygal 等强大的Python 库和工具介绍,以及列表、字典、if 语句、类、文件与异常、代码测试等内容;第二部分将理论付诸实践,讲解如何开发三个项目,包括简单的Python 2D 游戏开发如何利用数据生成交互式的信息图,以及创建和定制简单的Web 应用,并帮读者解决常见编程问题和困惑。

七、利用Python进行数据分析(第2版)

一句话点评:经典,掌握了这本书里面的知识才算得上是Python数据分析入门了吧,如果你有Python基础,懒得看什么数据思维的普及书,直接想来点技术活,那就啃这本书,不多bibi。




豆瓣简介:本书由Python pandas项目创始人Wes McKinney亲笔撰写,详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。第2版针对Python 3.6进行全面修订和更新,涵盖新版的pandas、NumPy、IPython和Jupyter,并增加大量实际案例,可以帮助你高效解决一系列数据分析问题。

八、Python数据分析(第2版)

一句话点评:这本书和上本有部分重叠,不过这本书涉及的内容更多,更贴近数据分析的实战,也是一本非常值得一看的书,不过名气没有上本书大。


豆瓣简介:Python拥有许多强大的程序库,已经成为进行各种数据分析和预测建模任务的流行平台。Python的应用范围很广,拓展性很大。本书介绍了众多的Python模块,例如Matplotlib、statsmodels、scikit-learn和NLTK。同时,本书还介绍了Python如何与外部环境(例如R、Fortran、C/C++和Boost库)进行交互。

九、Python数据分析实战

一句话点评:这本书有点难,等你学到这份上的时候,你都已经是一个高手了,意思就是初学者先别碰吧(也可以不看)。如果你之前是做技术的,而且数学功底不错,想了解机器学习与大数据,那可以看这本书。



豆瓣简介:Python 简单易学,拥有丰富的库,并且具有极强的包容性。本书展示了如何利用Python 语言的强大功能,以最小的编程代价进行数据的提取、处理和分析,主要内容包括:数据分析和Python 的基本介绍,NumPy 库,pandas 库,如何使用pandas 读写和提取数据,用matplotlib 库和scikit-learn 库分别实现数据可视化和机器学习,以实例演示如何从原始数据获得信息、D3 库嵌入和手写体数字的识别。

数据分析技术的应用

学了Python数据分析之后,可以再来看看Python数据分析在实际业务之中是如何开展的。

一、Python数据分析与数据化运营

一句话点评:数据分析的领域、方向比较多,这本主要介绍的是互联网非常重要的会员、商品、流量、内容方面的数据化运营。




豆瓣简介:这是一部从实战角度讲解如何利用Python进行数据分析、挖掘和数据化运营的著作,不仅对数据分析的关键技术和技巧进行了总结,更重要的是对会员、商品、流量、内容4个主题的数据化运营进行了系统讲解。

作者是国内一线数据分析师和大数据专家,在数据分析和数据化运营领域有近10年的经验,在业内颇具知名度和影响力。本书不仅得到了宋星、黄成明、宫鑫等14位资深专家的好评和推荐,还得到了天善智能、中国统计网等多个数据科学相关机构的支持和高度认可。

二数据挖掘与数据化运营实战

一句话点评:看数据化实战方面的书,基本就要看国内大厂是怎么做的,作者是阿里巴巴商业智能部数据分析专家,从事数据库营销和数据化运营分析多年。

豆瓣简介:《数据挖掘与数据化运营实战:思路、方法、技巧与应用》是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。

作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用,全方位整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。

三、社交网站的数据挖掘与分析(第2版)

一句话点评:数据分析、数据挖掘、数据抓取等在社交网络方面的应用。

豆瓣简介:Matthew A. Russell Digital Reasoning Systems公司首席技术官(CTO)、Zaffra公司负责人。作为一名计算机科学家,他热衷于数据挖掘、开源软件开发和创造技术以扩展人类智能。

当然微信读书里面关于数据分析、数据挖掘、数据可视化、Python数据分析等等的好书远不止以上这些,可以说,微信读书里的书已经满足Python数据分析学习进阶的每个阶段了,如果习惯使用微信读书的朋友,可以省不少纸质书的钱了。

书这么多,我们应该如何快速的阅读这些书并掌握里面的知识呢?参加我们的

Python 数据分析技术训练营

,一起来掌握这一个实用的技术技能吧~

我从零基础入门数据分析,整个入门的过程大致看了下面这些书籍,这些书基本都不需要你有任何基础,只要你能识字,数学是高中水平就能看。下面几本书都是挺经典的,我就不做一一介绍了。

《谁说菜鸟不会数据分析》、《精益数据分析》、《深入浅出数据分析》、《啤酒与尿布》、《数据之魅》、《Storytelling with Data》、《增长黑客》、《网站分析实战》、《深入浅出统计学》

我比较反感把技术性很强的书籍作为入门书籍的,这种书籍基本上翻个两三页就看不下去了,我记得之前有个朋友给我推荐了一本教材书叫做什么数据挖掘导论,我当时要是认真看了那本书,我估计这会儿我已经离开数据分析了。

多看看讲数据分析案例的书籍,让自己的在案例中认识到数据分析这件事情的价值以及有趣的地方。

因为我个人走的是业务数据分析的路线,所以纯技术向的书籍我不太了解。技术方面的嘉慧的回答应该写得挺全的。

业务向的数据分析其实入门之后就不需要局限于书了,只要是讲解真实的分析案例的书籍或者文章或者课程都可以看,都是学习的途径。

只推荐5本,涵盖入门技能、思维培养、工具使用、理论知识、数据逻辑等~


1、金字塔原理——从思维的技巧到思维的习惯

作者:芭芭拉?明托——麦肯锡公司第一位女性咨询顾问

豆瓣评分:8.1

适用人群:逻辑思维欠缺的人群



本书在1973年首次出版,当即引起轰动,畅销欧美市场30年不衰,书中传授的方式与技巧,被公认为即便对于最有经验的管理者来说也是十分关键的。不过这是老外写的书,思维不一样,有的朋友看起来可能会比较吃力,那么可以看下一本书。


2、谁说菜鸟不会数据分析(Python篇)

? 入门篇+工具篇

豆瓣评分:7.5分

适用人群:只适用于刚刚入职场的小白


按照数据分析工作的完整流程来讲解。全书共8章,分别讲解数据分析必知必会的知识、数据处理技巧、数据展现的技术、通过专业化的视角来提升图表之美、数据分析报告的撰写技能以及持续的修炼。


3、数据化管理

作者:黄成明——拥有15年的销售及数据分析经验

豆瓣评分:8.3

适用人群:做数据分析的入门读物



不谈大数据,只讲小数据,不仅分析数据,更懂商业逻辑,用最常用的EXCEL,建立商业运营模型~讲述了两个年轻人在大公司销售、商品、电商、数据等部门工作的故事,通过大量案例深入浅出地讲解了数据意识和零售思维。


4、精益数据分析

作者:阿利斯泰尔

豆瓣评分:8.3

适用人群:产品经理入门读物


本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,值得每位创业家和企业家一读。


5、深入浅出数据分析

作者:阿利斯泰尔

豆瓣评分:7.5

适用人群:

《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文以后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现《深入浅出数据分析》目标知识以外,为读者搭建了走向下一步深入研究的桥梁。


相信你也需要这些:

作为大数据时代最热门的专业,商业分析(BA)是国内读研好还是国外读研好?BA(商业分析)专业有哪些学校值得推荐?

关于我

专注留学申请,也喜欢分享知识,如果你需要,就【关注我】吧!


任何留学申请问题可以添加微信 wordsunny001,每周WordSunny一站式互联网留学平台都会邀请美国常春藤,英国G5、香港、澳洲八大的学霸来举办线上讲座,为大家免费分享留学申请干货,还会有文书简历模板等福利不定期发放。


我们的初心是帮助更多的同学申请到 Dream School !

作为在这个行业呆了有阵子的大(lao)表(you)哥(tiao),依我的经验来看,书本与实践结合才是硬道理,如何自学数据分析?这个回答中有详细讲述初学者入门数据分析领域需要掌握的思维和方法论。

话不多说,先分享自己私藏多年的书单吧。

书单里有我的启蒙书,有读了N遍的经典,还有最近正在膜拜的好书,也有朋友推荐的我的To read list。

以下书籍浅入深,适合不同程度水平的知友参考。

1、入门/科普:

初入门,需要先理解数据分析的思维,并在分析问题时逐渐转变,然后慢慢掌握数据分析的思路、方法和流程。

a.《谁说菜鸟不会数据分析》

经典入门书,涵盖了一到两年的数据分析人员的大部分工作,包括excel技巧、可视化入门、数据分析方法、数据分析方法论、数据处理入门等。隔段时间翻一翻,温故而知新,理解会更深刻。

b.《左手数据,右手图表》

这本书主要是excel的进阶技巧,主要围绕业务,学习制作动态图表,对excel技能提升有很大帮助。书中大篇幅都是案例,会涉及可视化的知识,如何选用图表,模精品着做一遍会有很大提升。

这两本书看一本就行。主要掌握数据分析的思维,会用Excel做简单的分析。

c.《深入浅出》数据系列

《深入浅出数据分析》

入门级别,比较简单,但基本的内容涉及全面,讲解的比较清晰。到这个层面一般要看SQL、数理统计类的专业知识,还有以下两本是同一系列。

《深入浅出统计学》《深入浅出SQL》

d.《Python数据科学手册》

每章介绍一到两个Python数据科学中的重点工具包。适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。对于需要处理大量数据的人而言,这是一本非常有价值的工作书,可以有效率地处理每天面对的问题,像是操作、转换,以及清理数据、可视化不同形式的数据,建立统计学或机器学习的模型等等。

e.《R语言实战》

全面而细致的R指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。


2、进阶类:

以上偏向技能类。数据分析和挖掘除了对数据分析有一定系统性的认知,更重要的事业务的理解,你需要积累一些实践经验,然后根据业务疏通这些知识/经验,做出严谨有价值的分析报告。

a.《精益数据分析》

主要讲了不同的公司怎么样用数据搭建分析框架,能够将不同的指标运用到现实,对于道德问题提供解决方案。

d.《用数据讲故事》

通过大量案例研究介绍数据可视化的基础知识,以及如何利用数据创造出吸引人的、信息量大的、有说服力的故事,进而达到有效沟通的目的。如何充分理解上下文,如何选择合适的图表,如何消除杂乱,如何聚焦受众的视线,如何像设计师一样思考,以及如何用数据讲故事。

f.《数据分析,企业的贤内助》

类似“洗脑式”的书籍(无贬义),以场景和案例入手,站在企业角度、业务角度来叙述数据分析的重要性,挺有道理的,能让你更加坚定数据分析这条路。详细描述了数据分析的整个流程,从方案确定、数据采集、处理、分析、呈现有全面展示。

e.《机器学习实战》

用简单的语言把复杂难懂的机器学习算法解释清楚了,它将机器学习的基础理论与日常数据分析的实际工具相结合。使用灵活的Python编程语言来构建实现数据分类、预测、建议以及汇总和简化等更高级功能的算法的程序。

c.《数据挖掘技术:应用于市场营销、销售与客户关系管理

如何利用最新的数据挖掘方法和技术来解决常见的业务问题。比如提高营销活动的响应率,识别新的客户群并估算信用风险。此外,它涵盖更多高级主题,如准备分析数据以及为公司数据挖掘创建必要的基础架构。


3、高级篇:

当进入高级的时候,这个时候看书已经比之前有了很大的变化了,个人建议如下:并不是看单本书,而是学会快速的看书,因为每本书中可能只有几个模型或者几个点对你有借鉴,那么只精读那几处,速读其他部分;要有自己的理论框架,也就是学会业务建模;要看业务书,并且能够把业务书的知识,固化成可以量化、可以监控的数据模型,和流程模型(这个是高级别很重要的一点,因为要能够快速的切入一个领域,并且能够用数据找到可以优化的办法)。

下面按主题来推荐一些书籍:

a. 用户和整体框架:

《增长黑客》:创业公司的用户与收入增长秘籍。

这本书偏互联网行业,但是顺着同样的思路,去分析每个阶段的用户,并进行运营。

b.数据化运营

《数据化管理》:洞悉零售及电子商务运营。

如果你的数据分析站到了一定高度,尤其是管理,强烈推荐看。能够把数据化管理推行下去,能够帮助提升公司整个的管理水平,也是数据部门对公司的贡献之一。

c.商品管理的书

《品类管理》:教你如何进行商品梳理。

零售业是数据分析应用的大行业,这本书集合了很多传统零售业的经验,从里面学到很多分析模型。

d.供应链

《供应链管理》:高成本、高库存、重资产的解决方案,刘宝红。

他的书可以多看几便,可以加深对企业供应链的认识。


4.大数据

大数据书不算是严格的数据分析实操类书籍,但在当今社会,“大数据”一定是一种趋势,且仍算在数据范畴中。个人认为,这些书籍能帮助我们扩宽视野和思路。

(1)《决战大数据》:大数据的关键思考

作者是淘宝大数据专家-车品觉,他的访谈博客也建议大家看一下,淘宝大数据不是盖的。

(2)阿里巴巴数据技术及产品部的《大数据之路:阿里巴巴大数据实践》

它山之石,可以攻玉,大公司实践的书可以多读,笔者专门为这本书写过两篇读书心得,里面有很多的干货,可以起到开阔视野的作用,对实际工作有借鉴意义,值得精读。

(3)杨旭的《机器学习在线:解析阿里云机器学习平台》

读这本书是因为《大数据之路:阿里巴巴大数据实践》,里面对于阿里的机器学习平台一笔带过,正好看到阿里新出版了这本书就顺便看了,其实这本书可以叫作平台使用说明书,虽然没有介绍具体的算法,但图文并茂的介绍了如何基于阿里机器学习平台进行挖掘,里面的流程设计和体验感觉不错,企业内要推广机器学习的确需要类似的利器,能较大的降低门槛,笔者会专门写篇文章来介绍,里面还是能看出很多的门道。

(4)Kimball的《数据仓库工具箱(第3版):维度建模权威指南》

读这本书还是因为《大数据之路:阿里巴巴大数据实践》,因为阿里介绍他们主要使用维度建模,因此还是想系统的理解一下,以前实践做的多,理论的少,现在回过头来还是有更多的感悟,它的维度建模的方法的确不错,但感觉部分翻译有些问题,有些没图示的长段表达有问题。

(5)钟华的《企业IT架构转型之道(阿里巴巴中台战略思想与架构实战)》

公司同事贴出了这本书,正好看到就去读了,虽然里面大数据中台基本没讲,但其中台的思想的确到处都适用,前面几个关于中台价值和意义的章节写得特别好,说出了我想说但说不出来的感觉,比如很多人质疑建模的价值,你看了会有信心的。

(7)周鸿祎的《我的互联网方法论》

大佬的书读一读总会有启示,本书来回表达了一个核心观点,杀毒软件免费模式改变整个杀毒行业生态,最终赢得客户,是一种破坏性创新。


更多有关数据分析的干货,可以关注我的公众号@数据分析不是个事儿

[十周入门数据分析]系列最近正在更新:

https://mp.weixin.qq.com/s/2iL7E3NphDHu7k7qY4sSZA

责任编辑:
热门阅读排行

实力商家展示

  • 任县飞泰机械厂
  • 山东胜天半子科技有限公司
  • 盛通四方数字商品市场股份有限
  • 中添区块链技术(深圳)有限公
  • 北京胜天半子网络科技有有限公
  • © 16货源网