博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据清洗
阅读量:4205 次
发布时间:2019-05-26

本文共 334 字,大约阅读时间需要 1 分钟。

数据清洗

常用清洗工具

Excel

power query。

SQL

Python

datastage

最专业的ETL工具,价格不菲。

informatica

专业程度如Datastage旗鼓相当,价格似乎比Datastage便宜。

kettle

业界最有名的开源ETL工具。开源当然就免费,免费的有些东西使用就不是很方便。

DataWrangler

ODI

oracle数据库厂商提供的工具,有局限性,与oracle数据库耦合太深。

Cognos

beeload

最好的国产ETL工具,但产品化程度还有一定距离。

Google Refine

,一般;

OpenRefine

Hawk

DataWrangler

斯坦福大学的可视化组设计来清洗和重排数据的。不好;

资料

转载地址:http://eytli.baihongyu.com/

你可能感兴趣的文章
Java 理论与实践: 线程池与工作队列
查看>>
Java多线程1-安全性、互斥与同步
查看>>
Java多线程2-线程协作、Timer和TimerTask
查看>>
Java多线程3-线程池、Callable和Future
查看>>
Java多线程4- Lock、Condition
查看>>
Android bootchart使用步骤
查看>>
Android不同层次开启硬件加速的方式
查看>>
Android 4.1性能分析的一般步骤
查看>>
Analyzing Display and Performance with Systrace
查看>>
Profiling with Traceview and dmtracedump
查看>>
SVN Eclipse插件Subclipse安装和配置
查看>>
SQLIteDatabase.query method
查看>>
ACM题目推荐
查看>>
推荐配色方案
查看>>
操作XML以及签名实例
查看>>
不依赖焦点和选中的TextView跑马灯
查看>>
Android 进程和线程模型
查看>>
Android 应用程序签名
查看>>
UML类图几种关系的总结
查看>>
GitHub Android 开源项目汇总
查看>>