回答思路
Pandas读取excel文件:
(1)首先创建一个excel文件,命名为test.xls
(2)安装pandas库(pandas是基本numpy的软件库)
pip install pandas
为了读取excel电子表格中的数据,我们还需要使用xlrd库:
pip install xlrd
(3)读取excel文件
Plain Text:
import pandas as pd file = “test.xls” data = pd.read_excel(file) print(data)首先引入pandas模块,初始化一个变量file用于存储excel文件名,示例中并没有给出确切的文件路径,那么将文件放置于项目代码文件同级目录即可。
调用pandas的read_excel方法,将“text.xls”中的内容读取到变量data,最后在终端将data变量的内容打印出来。
(4)写入excel文件
这里需要用到xlwt:pip install xlwt
Plain Text:
import pandas as pd file = “text.xls” data = pd.read_excel(file) data.to_excel(“new.xls”, sheet_name = “Student”)
Pandas读取csv文件
(1)在读取的时候,默认会将第一行记录当成列名,如果没有列名,可以指定header = None
Plain Text:
import pandas as pd df = pd.read_csv(“test.csv”) #csv文件与py文件在同一级目录下print(df.head(3)) #读取前三行
(2)在读取后自定义标题
Plain Text:
import pandas as pd df=pd.read_csv('test.csv') #hotelreviews50_1.csv文件与.py文件在同一级目录下#在读数之后自定义标题columns_name=['mysql_id','A','B','C','D','E','F','G','H'] df.columns=columns_name print(df.head(3)) #读取前3行
(3)使用pandas读取csv文件的指定列
Plain Text:
import pandas as pd df=pd.read_csv('test.csv',header=None,usecols=[0,1,2,3]) columns_name=['mysql_id','A','B','C'] df.columns=columns_name