pandas read_csv 列 dtype 设置为十进制但转换为字符串

pandas read_csv column dtype is set to decimal but converts to string(pandas read_csv 列 dtype 设置为十进制但转换为字符串)
本文介绍了pandas read_csv 列 dtype 设置为十进制但转换为字符串的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着跟版网的小编来一起学习吧!

问题描述

我正在使用 pandas (v0.18.1) 从名为test.csv"的文件中导入以下数据:

I am using pandas (v0.18.1) to import the following data from a file called 'test.csv':

a,b,c,d
1,1,1,1.0

我已将列 'c' 和 'd' 的 dtype 设置为 'decimal.Decimal' 但它们返回为类型 'str'.

I have set the dtype to 'decimal.Decimal' for columns 'c' and 'd' but instead they return as type 'str'.

import pandas as pd
import decimal as D

df = pd.read_csv('test.csv', dtype={'a': int, 'b': float, 'c': D.Decimal, 'd': D.Decimal})

for i, v in df.iterrows():
    print(type(v.a), type(v.b), type(v.c), type(v.d))

结果:

`<class 'int'> <class 'float'> <class 'str'> <class 'str'>`

我还尝试在导入后显式转换为十进制,但没有成功(转换为浮点有效但不是十进制).

I have also tried converting to decimal explicitly after import with no luck (converting to float works but not decimal).

df.c = df.c.astype(float)
df.d = df.d.astype(D.Decimal)
for i, v in df.iterrows():
    print(type(v.a), type(v.b), type(v.c), type(v.d))

结果:

`<class 'int'> <class 'float'> <class 'float'> <class 'str'>`

以下代码将str"转换为decimal.Decimal",所以我不明白为什么 pandas 的行为方式不同.

The following code converts a 'str' to 'decimal.Decimal' so I don't understand why pandas doesn't behave the same way.

x = D.Decimal('1.0')
print(type(x))

结果:

`<class 'decimal.Decimal'>`

推荐答案

我觉得你需要转换器:

import pandas as pd
import io
import decimal as D

temp = u"""a,b,c,d
           1,1,1,1.0"""

# after testing replace io.StringIO(temp) to filename
df = pd.read_csv(io.StringIO(temp), 
                 dtype={'a': int, 'b': float}, 
                 converters={'c': D.Decimal, 'd': D.Decimal})

print (df)
       a    b  c    d
    0  1  1.0  1  1.0

for i, v in df.iterrows():
    print(type(v.a), type(v.b), type(v.c), type(v.d))

    <class 'int'> <class 'float'> <class 'decimal.Decimal'> <class 'decimal.Decimal'>

这篇关于pandas read_csv 列 dtype 设置为十进制但转换为字符串的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持跟版网!

本站部分内容来源互联网,如果有图片或者内容侵犯了您的权益,请联系我们,我们会在确认后第一时间进行删除!

相关文档推荐

Multiprocessing on Windows breaks(Windows 上的多处理中断)
How to use a generator as an iterable with Multiprocessing map function(如何将生成器用作具有多处理映射功能的可迭代对象)
read multiple files using multiprocessing(使用多处理读取多个文件)
Why does importing module in #39;__main__#39; not allow multiprocessig to use module?(为什么在__main__中导入模块不允许multiprocessig使用模块?)
Trouble using a lock with multiprocessing.Pool: pickling error(使用带有 multiprocessing.Pool 的锁时遇到问题:酸洗错误)
Python sharing a dictionary between parallel processes(Python 在并行进程之间共享字典)