问题描述:
我有一位同学在写毕业论文的时候,遇到一个问题,获取的研究数据(.csv)文件里面包含的数据量特别大,高达上百万行,wps或者office根本无法打开或者完全显示这些数据,因此需要有个高效的办法,根据数据的年份去拆分成多份数据。
高效应对:
可以利用Python提取数据,那么问题来了,python不精通呀!但是,我有chatgpt嘿嘿嘿。直接和chatgpt提需求,需求描述地越详细chatgpt产出的代码就越接近自己的预期!
# 先下载包哟~
# pip install pandas
import pandas as pd
# 读取csv文件
input_file = 'input.csv'
output_file = 'output.csv'
# 读取csv文件到DataFrame
df = pd.read_csv(input_file)
# 过滤DataFrame,只保留Year列为'2016'的行
filtered_df = df[df['Year'] == 2016]
# 将过滤后的DataFrame导出到新的csv文件
filtered_df.to_csv(output_file, index=False)
print(f'处理完成,结果已保存到 {output_file}')
结果展示:
非常完美!能流畅打开且数据可以显示全了。根据这个流程就可以快速把数据整理出来咯~
发布评论