【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《财务大数据基础参考答案 (2)[1页]》,欢迎阅读!
项目八 数据清洗
一、单选题
1. 下列选项中,描述不正确的是( B ) A. 数据清洗的目的是为了提高数据质量 B. 空值一定要删除
C. 数据预处理包括数据的清洗、合并、重塑与转换 D. 在Pandas中,缺失值使用NaN表示
2. 下列选项中,用于删除缺失值或空值的方法是( B )
A. isnull() B. dropna() C. notnull() D. fillna() 3. 下列选项中,说法不正确的选项是( A )
A. fillna()函数不能通过inplace参数来确定是否对原始数据集进行填充更改 B. 使用位于空值前面的数据进行填充的代码是df.fillna(method='bfill')
C. 使用位于空值后面的数据进行填充的代码是df.fillna(method='ffill') D. 用平均值填充空值的代码是df.fillna(df.mean()) 4. 对于下列代码生成的数据集df,下列哪个选项的结果和其他三个选项不一样( C ) import pandas as pd
data = {"姓名":['李彦','赵科','章丽','王静','彭伟','金子'],"性别":['男','男','女','女','男','女']} df = pd.DataFrame(data)
A. df.duplicated(subset=['性别']) B. df.duplicated(subset='性别')
C. df.duplicated(subset=['性别'],keep='last') D. df.duplicated(subset=['性别'],keep='first') 5. 下列选择项中,用于删除重复值的函数是( A ) A. drop_duplicates()函数 B. drop()函数 C. dropna()函数 D. del()函数
二、实操题
实操题答案见“代码”文件夹下“ch8”文件夹中的“项目八-技能训练-实操题.ipynb”。
本文来源:https://www.wddqxz.cn/8ba698c487254b35eefdc8d376eeaeaad1f316ef.html