列表

详情


88. 使用pandas(Python)读取csv和excel文件内容

回答思路

Pandas读取excel文件:

(1)首先创建一个excel文件,命名为test.xls

(2)安装pandas库(pandas是基本numpy的软件库)

pip install pandas

为了读取excel电子表格中的数据,我们还需要使用xlrd库:

pip install xlrd

(3)读取excel文件

Plain Text:

import pandas as pd file = “test.xls” data = pd.read_excel(file) print(data)首先引入pandas模块,初始化一个变量file用于存储excel文件名,示例中并没有给出确切的文件路径,那么将文件放置于项目代码文件同级目录即可。

调用pandas的read_excel方法,将“text.xls”中的内容读取到变量data,最后在终端将data变量的内容打印出来。

(4)写入excel文件

这里需要用到xlwt:pip install xlwt

Plain Text:

import pandas as pd file = “text.xls” data = pd.read_excel(file) data.to_excel(“new.xls”, sheet_name = “Student”)

Pandas读取csv文件

(1)在读取的时候,默认会将第一行记录当成列名,如果没有列名,可以指定header = None

Plain Text:

import pandas as pd df = pd.read_csv(“test.csv”) #csv文件与py文件在同一级目录下print(df.head(3)) #读取前三行

(2)在读取后自定义标题

Plain Text:

import pandas as pd df=pd.read_csv('test.csv') #hotelreviews50_1.csv文件与.py文件在同一级目录下#在读数之后自定义标题columns_name=['mysql_id','A','B','C','D','E','F','G','H'] df.columns=columns_name print(df.head(3)) #读取前3行

(3)使用pandas读取csv文件的指定列

Plain Text:

import pandas as pd df=pd.read_csv('test.csv',header=None,usecols=[0,1,2,3]) columns_name=['mysql_id','A','B','C'] df.columns=columns_name

上一题