此工具用于数据预处理,适用于数据分析、机器学习模型训练、数据清洗等场景,尤其是在面对带有缺失值、需要标准化的原始数据。
主要包括以下操作:
缺失值处理:支持不同的缺失值填充方式(取均值mean/取中位数median)和删除方式(删除remove),若仅需进行数据标准化,此处选择任意值皆可。
数据清洗:提供按行或按列删除缺失值的功能,可选值:"remove_columns":删除包含缺失值的列;"remove_rows":删除包含缺失值的行(缺失值处理方式值为remove时使用)
数据标准化:支持两种常见的标准化方法(Z-Score 和 Min-Max),并可以选择不进行标准化。
输入文件:
包含缺失值或需要执行数据标准化和数据清洗的待处理数据,需包含行名和列名,支持csv/txt/tsv格式
小工具结果:
① 数据填充结果(按照每一列的均值mean填充缺失值)
② 删除包含缺失值的列
③ 按照每一列的均值mean填充缺失值,并使用zscore进行数据标准化
当前版本为1.0版本,上架时间为:2025-05-09