国内最专业的IT技术学习网

UI设计

当前位置:主页 > UI设计 >

一文看懂怎么用Python做数据分析

发布时间:2019/06/26标签:   数据    点击量:

原标题:一文看懂怎么用Python做数据分析
常碰到两类友人。一类是会爬虫但不晓得怎样进一步做数据剖析的,一类是平凡用 Excel 做剖析但不太会用 Python 剖析的。假如和你很像,那上面这篇体系长文会很合适你,倡议先珍藏。Excel 是数据剖析中最罕用的东西,本文经过 Python 与 excel 的功效对照先容怎样应用 Python 经过函数式编程实现 excel 中的数据处置及剖析任务。从 1787 页的 pandas 官网文档中总结出最罕用的 36 个函数,经过这些函数先容怎样经过 Python 实现数据天生和导入、数据荡涤、预处置、数据分类、数据挑选、分类 汇总、透视等最罕见的操纵。文章内容共分为 9 个局部名目以下:

一文看懂怎么用 Python 做数据分析
01 天生数据表第一局部是天生数据表,罕见的天生方式有两种,第一种是导入内部数据,第二种是间接写入数据。 Excel 中的文件菜单中供给了猎取内部数据的功效,支撑数据库和文本文件和页面的多种数据源导入。
一文看懂怎么用 Python 做数据分析
python 支撑从多品种型的数据导入。在开端应用 python 停止数据导入前须要先导入 pandas 库,为了便利起见,咱们也同时导入 numpy 库。importnumpyasnpimportpandasaspd导入数据表上面分辨是从 excel 和 csv 格局文件导入数据并创立数据表的方式。代码是最简形式,外面有许多可选参数设置,比方列称号,索引列,数据格局等等。感兴致的友人能够参考 pandas 的民间文档。df=pd.DataFrame(pd.read_csv('name.csv',header=1))df=pd.DataFrame(pd.read_excel('name.xlsx'))创立数据表另一种方式是经过间接写入数据来天生数据表,excel 中间接在单位格中输出数据便可以,python 中经过上面的代码来完成。天生数据表的函数是 pandas 库中的 DateFrame 函数,数据表一共有 6 行数据,每行有 6 个字段。在数据中咱们特地设置了一些 NA 值和有成绩的字段,比方包括空格等。前面将在数据荡涤步调停止处置。前面咱们将同一以 DataFrame 的简称 df 来定名数据表。df=pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006],"date":pd.date_range('20130102',periods=6),"city":['Beijing','SH','guangzhou','Shenzhen','shanghai','BEIJING'],"age":[23,44,54,32,34,32],"category":['100-A','100-B','110-A','110-C','210-A','130-F'],"price":[1200,np.nan,2133,5433,np.nan,4432]},columns=['id','date','city','category','age','price'])这是方才创立的数据表,咱们没有设置索引列,price 字段中包括有 NA 值,city 字段中还包括了一些脏数据。

上一篇:没有了

下一篇:没有了

返回
版权信息Copyright ? IT技术教程 版权所有??? ICP备案编号:鲁ICP备09013610号