如何用Python读写CSV文件？

lvjbypge 于 2023-01-15 发布在 Python

关注(0)|答案(7)|浏览(134)

如何读取下面的CSV文件？

1,"A towel,",1.0
42," it says, ",2.0
1337,is about the most ,-1
0,massively useful thing ,123
-2,an interstellar hitchhiker can have.,3

如何将下面的data写入CSV文件？

data = [
    (1, "A towel,", 1.0),
    (42, " it says, ", 2.0),
    (1337, "is about the most ", -1),
    (0, "massively useful thing ", 123),
    (-2, "an interstellar hitchhiker can have.", 3),
]

csv

来源：https://stackoverflow.com/questions/41585078/how-do-i-read-and-write-csv-files-with-python

7条答案

按热度按时间

vfwfrxfs1#

下面是一些简单完整的例子，介绍如何用Python读取CSV文件和编写CSV文件。

纯Python语言：

import csv

# Define data
data = [
    (1, "A towel,", 1.0),
    (42, " it says, ", 2.0),
    (1337, "is about the most ", -1),
    (0, "massively useful thing ", 123),
    (-2, "an interstellar hitchhiker can have.", 3),
]

# Write CSV file
with open("test.csv", "wt") as fp:
    writer = csv.writer(fp, delimiter=",")
    # writer.writerow(["your", "header", "foo"])  # write header
    writer.writerows(data)

# Read CSV file
with open("test.csv") as fp:
    reader = csv.reader(fp, delimiter=",", quotechar='"')
    # next(reader, None)  # skip the headers
    data_read = [row for row in reader]

print(data_read)

之后，data_read的内容为

[['1', 'A towel,', '1.0'],
 ['42', ' it says, ', '2.0'],
 ['1337', 'is about the most ', '-1'],
 ['0', 'massively useful thing ', '123'],
 ['-2', 'an interstellar hitchhiker can have.', '3']]

请注意CSV只读取字符串。您需要手动转换为列类型。
之前有一个Python 2 + 3版本（link），但现在是Python 2 support is dropped，去掉Python 2的东西大大简化了这个答案。

微处理器

看看我的实用程序包mpu，它是一个非常简单和容易记住的程序包：

import mpu.io
data = mpu.io.read('example.csv', delimiter=',', quotechar='"', skiprows=None)
mpu.io.write('example.csv', data)

Pandas

import pandas as pd

# Read the CSV into a pandas data frame (df)
#   With a df you can do many things
#   most important: visualize data with Seaborn
df = pd.read_csv('myfile.csv', sep=',')
print(df)

# Or export it in many ways, e.g. a list of tuples
tuples = [tuple(x) for x in df.values]

# or export it as a list of dicts
dicts = df.to_dict().values()

更多信息请参见read_csv docs。请注意panda会自动推断是否有标题行，但您也可以手动设置。
如果您还没有听说过Seaborn，我建议您看一看它。

其他

许多其他库都支持读取CSV文件，例如：

dask.dataframe.read_csv
spark.read.csv

创建CSV文件

1,"A towel,",1.0
42," it says, ",2.0
1337,is about the most ,-1
0,massively useful thing ,123
-2,an interstellar hitchhiker can have.,3

常见文件结尾

.csv

处理数据

在将CSV文件读取到元组/字典列表或Pandas Dataframe 后，它只是简单地处理这类数据。

替代品

JSON：非常适合编写人类可读的数据;非常常用（read & write）
CSV：超简单格式（read & write）
YAML：很好读，类似于JSON（read & write）
pickle：Python序列化格式（read & write）
MessagePack（Python package）：更紧凑的表示（read & write）
HDF5（Python package）：适合矩阵（read & write）
XML：存在太多 * 叹息 *（read & write）

对于您的应用程序，以下内容可能很重要：

其他编程语言的支持
读/写性能
紧凑性（文件大小）

另请参阅：Comparison of data serialization formats
如果您正在寻找一种创建配置文件的方法，您可能需要阅读我的短文Configuration files in Python

赞(0）回复(0）举报 2023-01-15

vyu0f0g12#

如果需要-不使用csv模块读取csv文件：

rows = []
with open('test.csv') as f:
    for line in f:
        # strip whitespace
        line = line.strip()
        # separate the columns
        line = line.split(',')
        # save the line for use later
        rows.append(line)

赞(0）回复(0）举报 2023-01-15

pbpqsu0x3#

如果你正在处理CSV数据，并且想要一个比pandas占用空间更小的解决方案，你可以试试我的包littletable。可以通过管道安装，或者只是作为一个包含你自己代码的. py文件放入，所以非常便携，适合无服务器应用程序。
读取CSV数据就像调用csv_import一样简单：

data = """\
1,"A towel,",1.0
42," it says, ",2.0
1337,is about the most ,-1
0,massively useful thing ,123
-2,an interstellar hitchhiker can have.,3"""

import littletable as lt
tbl = lt.Table().csv_import(data, fieldnames="number1,words,number2".split(','))
tbl.present()

图纸：

Number1   Words                                  Number2  
 ────────────────────────────────────────────────────────── 
  1         A towel,                               1.0      
  42         it says,                              2.0      
  1337      is about the most                      -1       
  0         massively useful thing                 123      
  -2        an interstellar hitchhiker can have.   3

（littletable使用rich模块显示表格。）
littletable不会自动尝试转换数值数据，因此需要为数值列使用数值转换函数。

def get_numeric(s):
    try:
        return int(s)
    except ValueError:
        try:
            return float(s)
        except ValueError:
            return s

tbl = lt.Table().csv_import(
    data,
    fieldnames="number1,words,number2".split(','),
    transforms={}.fromkeys("number1 number2".split(), get_numeric)
)
tbl.present()

这给出：

Number1   Words                                  Number2  
 ────────────────────────────────────────────────────────── 
        1   A towel,                                   1.0  
       42    it says,                                  2.0  
     1337   is about the most                           -1  
        0   massively useful thing                     123  
       -2   an interstellar hitchhiker can have.         3

数值列右对齐而不是左对齐。
littletable还具有其他类似于ORM的特性，如索引、联接、透视和全文搜索。

tbl.stats("number1 number2".split()).present()

  Name       Mean   Min    Max   Variance              Std_Dev   Count   Missing  
 ──────────────────────────────────────────────────────────────────────────────── 
  number1   275.6    -2   1337   352390.3    593.6247130974249       5         0  
  number2    25.6    -1    123     2966.8   54.468339427597755       5         0

或转置：

tbl.stats("number1 number2".split(), by_field=False).present()

  Stat                 Number1              Number2 
 ─────────────────────────────────────────────────── 
  mean                   275.6                 25.6
  min                       -2                   -1
  max                     1337                  123
  variance            352390.3               2966.8
  std_dev    593.6247130974249   54.468339427597755
  count                      5                    5
  missing                    0                    0

也可以输出其他格式，例如Markdown：

print(tbl.stats("number1 number2".split(), by_field=False).as_markdown())

| stat | number1 | number2 |
|---|---:|---:|
| mean | 275.6 | 25.6 |
| min | -2 | -1 |
| max | 1337 | 123 |
| variance | 352390.3 | 2966.8 |
| std_dev | 593.6247130974249 | 54.468339427597755 |
| count | 5 | 5 |
| missing | 0 | 0 |

它将从Markdown呈现为
| 状态|1号|二号|
| - ------|- ------|- ------|
| 均值|二百七十五点六|二十五点六|
| 最小值|-2个|-1人|
| 最大值|1337|一百二十三|
| 方差|小行星352390.3|小行星2966.8|
| 标准偏差|小行星593.6247|54.468339427597755美元|
| 计数|五个|五个|
| 缺失|无|无|
最后，下面是一个文本搜索，可以搜索包含单词"hitchhiker"的任何条目：

tbl.create_search_index("words")
for match, score in tbl.search.words("hitchhiker"):
    print(match)

图纸：
命名空间（数字1 = -2，words ='星际搭便车者可以拥有.'，数字2 = 3）

赞(0）回复(0）举报 2023-01-15

zphenhs44#

写入CSV文件

首先，您需要导入csv
例如：

import csv

with open('eggs.csv', 'wb') as csvfile:
    spamwriter = csv.writer(csvfile, delimiter=' ',
                        quotechar='|', quoting=csv.QUOTE_MINIMAL)
    spamwriter.writerow(['Spam'] * 5 + ['Baked Beans'])
    spamwriter.writerow(['Spam', 'Lovely Spam', 'Wonderful Spam'])

赞(0）回复(0）举报 2023-01-15

bis0qfac5#

import csv
with open(fileLocation+'example.csv',newline='') as File: #the csv file is stored in a File object

    reader=csv.reader(File)       #csv.reader is used to read a file
    for row in reader:
        print(row)

赞(0）回复(0）举报 2023-01-15

d5vmydt96#

使用Pandas读取csv文件

use pd.read_csv("D:\\sample.csv")

using only python :

fopen=open("D:\\sample.csv","r") 

print(fopen.read())

创建并写入csv文件

下面的例子演示创建和写入一个csv文件。要使一个动态文件写入器，我们需要导入一个包导入csv，然后需要创建一个示例的文件与文件引用Ex：

with open("D:\sample.csv","w",newline="") as file_writer

这里，如果文件不存在于提到的文件目录中，那么python将在指定的目录中创建一个相同的文件，w代表write，如果你想读取一个文件，那么用r替换w，或者添加到现有的文件中，那么用a。
newline=""指定每次创建行时删除一个额外的空行，因此为了消除空行，我们使用newline=""，使用列表创建一些字段名（列名），如下所示：

fields=["Names","Age","Class"]

然后应用于编写器示例，如下所示：

writer=csv.DictWriter(file_writer,fieldnames=fields)

这里使用字典编写器并分配列名，要将列名写入csv，我们使用writer.writeheader()，要写入值，我们使用writer.writerow({"Names":"John","Age":20,"Class":"12A"})，而写入文件值必须使用字典方法传递，这里的键是列名，值是您各自的键值。
导入csv：

with open("D:\sample.csv","w",newline="") as file_writer:

fields=["Names","Age","Class"]

writer=csv.DictWriter(file_writer,fieldnames=fields)

writer.writeheader()

writer.writerow({"Names":"John","Age":21,"Class":"12A"})

赞(0）回复(0）举报 2023-01-15

n9vozmp47#

我写了一个问题，问类似的问题。所以，为了把所有的东西都放在一个地方，这里是我的2美分，一个非常快速和肮脏的解决方案。
这段代码的目的是从一个CSV文件读取并写入另一个CSV文件。输出行的格式是固定的，我可以使用带有正确分隔符的csv.write，但在这种情况下，我必须做额外的工作来指定空格。但它很好地显示了如何使用良好的旧print（）函数输出文本：

#! /usr/bin/env python3

def main():
    parser = argparse.ArgumentParser(
        description='',
        usage="""myparser [-h] print this help and exit
        """,
        formatter_class=argparse.ArgumentDefaultsHelpFormatter
    )
    parser.add_argument('-f', '--file',help='CSV input file', required=True)
  
    args = parser.parse_args()

    with open("output.file", "w") as outfile:

        with open(args.file) as csvfile:
       
            csv_reader = csv.reader(csvfile, delimiter=',')
            line_count = 0
            for row in csv_reader:
                if line_count == 0:
                    line_count += 1
               elif args.archive:
                    print(f'no:{row[0]}:{row[1]}::0:0:0:/bin/bash:0:0:{row[2]}:{row[3]}:{row[4]}:archive', file=outfile)
                    line_count += 1 

return sys.exit(EXIT_SUCCESS)

if __name__ == '__main__':
    main()

不好意思弄凹了。
这段代码打开一个CSV文件进行阅读，并使用print（）函数写入一个格式化字符串，如下所示：

no:Xoero:ToelAs:xtoelas:0:0:0:/bin/bash:0:0:y.r.j.pols@tue.nl:00311234567890:nl:archive

赞(0）回复(0）举报 2023-01-15

我来回答

如何用Python读写CSV文件？

7条答案

纯Python语言：

相关

微处理器

Pandas

其他

创建CSV文件

常见文件结尾

处理数据

替代品

写入CSV文件

相关问题

热门标签

最新问答