How to load large data into pandas efficiently? [duplicate]

Question

I am working with a very wide dataset (1005 rows * 590,718 columns, 1.2G). Loading such a large dataset into a pandas dataframe result in code failure entirely due to insufficient memory.

I am aware that Spark is probably a good alternative to Pandas for dealing with large datasets, but is there any amenable solution in Pandas to reduce memory usage while loading large data?

grshankar · Accepted Answer

You could use

pandas.read_csv(filename, chunksize = chunksize)

How to load large data into pandas efficiently? [duplicate]

Tags:

python

pandas

dataframe

RJF

1 Answers

grshankar

Recent Activity

Donate For Us

How to load large data into pandas efficiently? [duplicate]

Tags:

python

pandas

dataframe

RJF

1 Answers

grshankar

Related questions

Recent Activity

Donate For Us