learn-NLP-luhuibo
learn-NLP-luhuibo copied to clipboard
用pandas将一列数据转为float求平均值
1、使用数据集: 数据集下载地址:豆瓣评论数据集:https://github.com/Computing-Intelligence/datasource/raw/master/movie_comments.csv 2、用pandas打开,查看原始数据类型,是object的,直接使用douban['star'].mean()会报错 3、网上搜索尝试了多种方法,但是没用 4、最后在文章https://juejin.im/post/5acc36e66fb9a028d043c2a5中,进行修改,在打开csv文档时加入converters={'star': lambda x: pd.to_numeric(x, errors='coerce')}
import pandas as pd
douban = pd.read_csv('.\input\movie_comments.csv',converters={'star': lambda x: pd.to_numeric(x, errors='coerce')})
douban.info()
douban.dtypes
douban.fillna(0, inplace = True)
douban.info()
douban.dtypes
douban.isnull().describe()