? 统计学与数据挖掘书籍推荐
1.1《 The Elements of Statistical Learning》,神书,不解释
1.2《实用多元统计分析》,从线性代数的角度详细讲解算法,例子简单,国外课程教材
1.3《统计学习方法》,李航著,统计学习算法必备书籍
1.4《从零进阶!数据分析的统计基础》 CDA数据分析师系列丛书
1.5《统计学:从数据到结论》
1.6《数据挖掘:概念与技术》
数据分析软件篇
? SQL书籍推荐
《MySQL必知必会》
? SPSS推荐书籍
《SPSS统计分析基础教程》
《SPSS统计分析高级教程》
《IBM SPSS数据分析与挖掘实战案例精粹》
张文彤著
? SAS推荐书籍
1.综合入门:
1.1 《The Little SAS® Book: A Primer, Fifth Edition》
经典入门级SAS官方推荐书籍,其中第4版有中文版,但不是官方翻译也有部分章节未完成,可以中英文参考来看。
1.2 《Applied Statistics and the SAS Programming Language》
SAS大神Ronald Cody的作品,已出到第五版,有中文版译名:SAS应用统计分析。扫描版论坛有链接
1.3 《小白学sas》
原生中文版,语言诙谐,问答形式。便于入门,但没有上面2本知识系统……
1.4《Learning SAS by Example:A Programmer’s Guide》
还是大神Ronald Cody的作品,by example,非常便于自学。
2.由浅入深循序渐进:
2.1首推SAS官方初级程序员培训教材,2本Course Notes:
《SAS Programming I Essentials》
《SAS Programming III Data Manipulation Techniques》
绝对面向0基础,图文并茂,讲解详细,强烈推荐(可惜是英文版……)
如果没有时间精力细读(2本将近1400页)可以看SAS Certification Prep Guide: Base Programming for SAS9,综合了前2本的知识要点,复习梳理用的。
如果有精力想研究细节,推荐直接看官方Language Reference Concepts,概念介绍十分详细。也绝对权威。
2.2.统计方面:
首推《SAS/STAT 14.1 User's Guide》
官方说明文档,绝对详细权威。不过要1W多页,PDF版500多M,实体书可以防身健体……
《SAS Statistics by Example by Ron Cody》
其他可继续看大神的书籍
3.分项学习和技巧提高:
3.1 SAS函数
《SAS® Functions by Example, Second Edition》
《SAS Functions Pocket Reference》,SAS函数手册
3.2 SQL
《SAS 9.4 SQL Procedure User's Guide》 官方手册并有相应的文件,免费且全面
《PROC SQL by Example》
《Proc SQL Beyond the Basics Using SAS》
3.3数据清洗
《Cody's Data Cleaning Techniques using SAS Software by Ron Cody》
继续推荐大神的作品
3.4 宏(算是SAS编程的高级部分,也是以后工作中经常会使用到的)
《SAS® 9.4 Macro Language: Reference, Fifth Edition》
详细介绍了MACRO的原理及运行机制。官方文档,首推。
4.另外,两本 MACRO的书,可以作为进阶的学习数据:
《SAS Macro Programming Made Easy, Third Edition》
这本书主要以基础的知识为主,每一点都很详细
《Carpenter's Complete Guide to the SAS Macro Language, Third Edition》
SAS界另一位寂寞大神,Carpenter,他的书都比较深入难懂,但是都进阶学习,受益匪浅的好书。
? Python书籍推荐
Python入门的书籍:《Learn Python The Hard Way》
Python算法相关:《集体智慧编程》
? R书籍推荐
CDA数据分析师认证Level2指定教材,涵盖面广,实战性强
1.3《ggplot2:数据分析与图形艺术》,R语言中作图详解
1.4《统计学习导论 基于R的应用》,统计神书 ESL的通俗版,弱化了数学推导环节
1.5《R语言应用:数据分析R语言实战》,思路清晰,算法介绍简单,R实现过程明确,数据分析相关
1.7《R语言预测实战》,代码实现算法详尽,函数解释详尽,不错的参考书
? 大数据分析软件篇
1.1《Hive编程指南》,大数据仓库指南,适合做工具书使用
1.2《Hadoop权威指南》,Hadoop平台官网纸质版,最全面的Hadoop专业书籍,也是适合作为工具书
1.3《Spark机器学习》,以案例介绍为主的机器学习应用,没有枯燥的数据公式,较轻松的spark算法学习书籍。
1.4《Spark快速数据处理》,从实用角度系统讲解Spark的数据处理工具及使用方法