PDI最佳实践etl开发必备手册
2021-01-28 04:29:03 150KB etl pdi 最佳实践 大数据
1
ETL对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,了解并掌握一种etl工具的使用,必不可少,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现,使用它减少了非常多的研发工作量,提高了我们的工作效率。
2021-01-28 04:25:07 856.6MB kettle spoon etl
1
此Azkaban是在官网上下载后经过编译的,Azkaban安装包版本为3.56.0,包含了依赖包。只需解压即可使用。
2021-01-28 04:25:03 21.27MB Azkaban etl调度
1
9.1版本 Kettle,很好的开源ETL工具,免安装,直接解压使用,百度网盘链接,官网巨慢,搬运不易!
2021-01-28 04:24:26 204B etl kettle
1
【实时数仓篇】基于 Flink 的典型 ETL 场景实现
2021-01-28 04:18:16 24.31MB 大数据
1
回答:1、ETL 在数数据仓库角色 2、为什么建数据仓库需要ETL工具 3、如何选择ETL工具 4、ETL工具厂商的价值 5、拥有15年以上知名商用ETL工具历程
2021-01-28 03:33:16 926KB ETL工具 数仓工具 商用ETL工具
1
一、 總體說明 3 1. DataStage總體劃分 3 2. Jobs的總體劃分 5 二、 Job轉置開發 8 1. 一對一轉置(結構全部相同,直接轉) 8 2. 一對一轉置(結構不同,需轉換類型後轉置) 34 3. 多對一轉置 47 4. 多對多轉置 55 5. Routimes開發 75 6. Sequece開發 84 7. Job的資料庫、使用者、密碼、抄表日等資料傳遞 97 8. ETL調用SP開發 97 9. Job編譯 107 10. Job的導入,導出 111 三、 技巧及經驗共享 120 1. 方法:快速開發,Copy相同處理Job後更改 120 2. 問題:Client登錄出錯 121 3. 問題:同一Job的多個clear table出錯 121 4. 經驗:外部Call DataStage 121 5. 問題:code=-99 [General repository interface 'other error'] 122 6. 經驗:Job之Allow Multiple Instance使用 123 7. 經驗:導入table的key設定 123 8. 經驗:Sybase的環境變數的影響 123 9. 問題:Sybase OC Stage的transaction size不為0造成的死鎖 123 10. 經驗:Hashed File寫入優化 123 11. 經驗:Sequence不可包含Sequence 123 12. 經驗:Hashed File的比較 123 13. 經驗:Sequence的中斷(stop)處理 124 14. 經驗:Director中log auto-purge的設定 124 15. 經驗:Director中reset的使用 124 16. 經驗:不用Transformer的錯誤,原因未明 124 17. 出錯記錄: 126 18. Basic語法 127 19. 向IBM咨詢 127 20. 問題:Job出錯後需重新編譯的解決方案 128 21. 問題:DataStage權限設定 129 22. 問題:Job運行的過程中,會產生相關的uvsh.exe說明 131 四、 附件說明 132 1. Update action選項說明 132 2. 傳入參數Type說明 133 3. Execution action說明 133
2021-01-28 03:10:57 4.6MB ETL  Job轉置
1
gbase 数据在使用ETL连接时需要使用的JDBC驱动包,把该文件COPY到ETL工具下的JDBC文件夹就可以使用。
2021-01-28 02:54:26 794KB gabase jdbc ETL驱动包
1
支持并发,单独日志,有问题私聊 可用于:调度任务,参数化使用
2021-01-28 02:20:57 3KB java etl
1
ETL 技术 E-L-T架构起源、典型产品...... 与E-T-L架构技术参数对比
2021-01-28 02:02:38 694KB etl 中间件
1