pandas在数据分析中的作用

最近在Kaggle上发现大牛们都熟练的运用pandas, 这个用于python更加方便处理数的库。当我第一次使用df = pandas.read_csv("file")来读取原始的数据文件(用csv格式存储),并存成dataFrame对象的时候,我感觉整个世界都亮了。

Getting Started with Pandas - Predicting SAT Scores for New York City Schools 这篇文章介绍了利用pandas来做数据的整合,清洗,并且将数据类型转换成通常的机器学习模型能够使用的形式。