
这是18年的第一篇blog,因为boss对于我的工作上的一些期望,需要着手做一些数据分析的工作,所以开始撰写这个系列的blog。分类的内的主要内容基本都是楼主鉴于阅读《利用python进行数据分析》一书所写的基本要点。
首先大环境就不需要多说了,为什么要用python做这些事,为什么要选择numpy跟pandas来进行数据处理分析?如果真的是小巨白,那就耐心开完所有内容吧,到时候就会发现,哇哦,很多用代码都很难写的东西,为什么这些模块处理起来贼简单。楼主反正是惊讶地合不拢嘴的状态研究这本书的。另外此分类的blog需要python基础,如果没有的话,简易先看完python基础分类章节。
希望世界和平,希望我跟某天看见这篇blog的所有的读者都可以通过自己的努力,实现一个个小目标,走向成功。大家加油。
环境问题
首先解决一个我花了2天一直百度都没有找到准确解答方案的问题。业务需求是这样的,楼主所在公司是用的sql server,一切的数据分析的基础都是基于数据,而楼主刚好遇到一个很不巧的问题,就是windows直接装pymssql模块报错的问题,具体我也说不清为什么用
就是安装不了,总是报错。就像下图,报错说少sqlfront.h文件。

去百度搜索freetds-dev;

楼主电脑是window * 64位,python版本是3.6;(可以这样查询python版本,有基础的,这个不知道,就真的是瓜皮了)

所以选择X86_64_vs2015,并下载。

下载好,解压,在里面include文件夹下会找到那个报错文件sqlfront.h文件,一共需要好几个文件。不介意的话可以把全部文件copy到python根目录的include文件夹里面;追求完美的可以先copy这个文件过去,继续pip 看缺少什么文件,一个个拖拽过去。

就这样。。。。
就不一一试了。再一次pip install pymssql 会发现下面的报错。

?????WHF????
楼主就是卡在这个点,一直解决不了。最后在整整2天后,试出来一个有效的方法。
百度一下pymssql-2.1.3.tar.gz这个文件。
这里又不知道是什么版本了????
其实这个我也不会,都是百度到的,所以说百度真的是很好的老师。别跟我说,为什么直接输入python没出来下面的图。。去添加环境变量去,pip也加一下

执行上面截图的语句,就可以查询出需要安装的wheel的版本了。
下载匹配的版本。
cmd到下载目录,解压好文件并用pip安装

这时候去到python根目录的site-packages就可以找到wheel文件装好的文件夹了。

这时候再下载一份之前网页里面最后一个pymssql主文件。解压

解压好文件,把文件夹改名为

然后copy到python根目录的site-package文件夹。别问为什么,我也不知道。看一下里面的文件名大概能猜到。(只可意会,不可言传)

这时候就好了,真的。。。。我反正就是这么试出来的,如果还是不可以,那就对不起,打扰了。、。。。

安装模块
直接pip安装numpy,matplotlib,pandas,ipython模块.
查了下,很说,anaconda用来做数据分析比较好,可是楼主习惯了用pycharm,因为之前一直用,而且pycharm做django项目很强大,所以就继续用pycharm了,只需要安装一个jupyter note book 就好了。
另外一些常用习惯,语法:
后面会一直延用这样的语法习惯,撰写内容。
另外不建议直接导入类似numpy这种大型库。(from numpy inport *)
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-58904-1.html
如此作为
越南悲情不已
除了垃圾米的垃圾脑残粉