pandas高效批量读取
处理大量CSV文件时,逐个读取效率低下。 为了加速数据加载,我们可以使用Pandas的pd.concat()函数同时读取所有文件。
以下代码展示了如何实现:
import glob import pandas as pd import os # 获取指定目录下所有CSV文件路径 filenames = glob.glob(os.path.join(inputdir, "*.csv")) # 使用列表推导式批量读取CSV文件 frames = [pd.read_csv(filename) for filename in filenames] # 合并所有DataFrame dftable = pd.concat(frames)
登录后复制
这种方法显著提高了读取速度,尤其适用于包含大量数据的文件集。
以上就是如何利用Pandas加速大量CSV文件的读取?的详细内容,更多请关注php中文网其它相关文章!