数据仓库

数据仓库

0
推荐
2463
浏览

10万级etl批量处理作业调度工具Taskctl Web应用版0元永久授权使用

软件下载:关注公众号:【Taskctl】关键字回复 "领取" 或 "软件" 即可获得认识 Taskctl-webTASKCTL 遵循软件产品标准化的原则,以“专业、专注”为设计理念,结合ETL 调度领域自身的...

ETL批量调度-Taskctl 发表了文章 • 2020-11-24 10:11

0
推荐
1791
浏览

ETL基础知识有哪些?3分钟让你轻松搞定

ETL发展的历史背景随着企业的发展,各业务线、产品线、部门都会承建各种信息化系统方便开展自己的业务。随着信息化建设的不断深入,由于业务系统之间各自为政、相互独立造成的数据孤岛”现象尤为普遍,业务不集成...

ETL批量调度-Taskctl 发表了文章 • 2020-08-03 16:07

1
推荐
1816
浏览

元数据是什么?举例告诉你哪种方式更适合元数据的录入

元数据,一个简单的定义是描述数据的数据。在企业中,无论哪里有数据,都有相应的元数据。只有存在完整而准确的元数据,我们才能更好地理解数据并充分利用数据的价值。为了让大家更好地了解什么是元数据,TaskCtl...

ETL批量调度-Taskctl 发表了文章 • 2020-07-28 17:12

0
推荐
1468
浏览

大数据与批量调度的紧密关系

当大数据在手机端花枝招展地跳跃时,你很自豪地说,我知道它是怎么来的,它是从网络另一端来的。可当碰到一个刨根问底的家伙,他又问,那网络另一端的数据又是怎么来的,你是否一脸蒙逼?不,你可能说,作为一枚I...

ETL批量调度-Taskctl 发表了文章 • 2020-07-21 15:26

0
推荐
1537
浏览

新手一看就秒懂的数据挖掘的10大算法

一个优秀的数据分析师,除了要掌握基本的统计学、数据库、数据分析方法、思维、数据分析工具技能之外,还需要掌握一些数据挖掘的思想,帮助我们挖掘出有价值的数据,这也是数据分析专家和一般数据分析师的差距之...

ETL批量调度-Taskctl 发表了文章 • 2020-07-20 14:39

0
推荐
1679
浏览

MySQL Explain 详解(优化MySQL性能第一步)

MySQL Explain 详解使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句。分析你的查询预付或表结构的性能瓶颈。查询结果返回字段分析1、id列select查询的序列号,包含一组数字...

ETL批量调度-Taskctl 发表了文章 • 2020-07-17 16:00

0
推荐
2269
浏览

【开源】企业10万级调度软件 taskctl 6.0 永久免费授权使用

关注公众号 "taskctl" 关键字回复 "领取" 即可获得永久免费授权TASKCTL作为敏捷批量调度的开拓者,产品设计从一开始就专门为整洁的体验而设计,并提供丰富、直观的用户界面,以简化常见的作业调度执行编排流程。T...

ETL批量调度-Taskctl 发表了文章 • 2020-07-14 15:35

0
推荐
2096
浏览

中美两国10万级作业调度工具 "TaskCtl" Vs "Control-M" 如何选用

前言:美方:Control-M ( www.bmc.com)中方:TASKCTL ( www.taskctl.com )ETL调度工具中美PK ( TASKCTL VS Control-M)Control-M图片源自网络TaskCtl图片源自网络而国内,在众多的软件中选择TASKCTL,我似乎没有任...

ETL批量调度-Taskctl 发表了文章 • 2020-07-09 09:54

0
推荐
2471
浏览

数据调度平台etl系统二大种类及其实现方法与流程

什么是调度系统调度系统,更确切地说,作业调度系统(Job Scheduler)或者说工作流调度系统(workflow Scheduler)是任何一个稍微有点规模,不是简单玩玩的大数据开发平台都必不可少的重要组成部分。除了Crontab...

ETL批量调度-Taskctl 发表了文章 • 2020-07-06 15:30

1
推荐
2145
浏览

开源数据调度平台taskctl免费分享领取

产品简介taskctl是一款由成都塔斯克信息技术公司历经10年研发的etl作业集群调度工具,该产品概念新颖,体系完整、功能全面、使用简单、操作流畅,它不仅有完整的调度核心、灵活的扩展,同时具备完整的应用体系。...

ETL批量调度-Taskctl 发表了文章 • 2020-07-03 18:00

0
推荐
2231
浏览

【搞事情】10万级商用etl作业调度工具taskctl免费开源了

工具背景taskctl是一款由成都塔斯克信息技术公司历尽10年研发的etl作业集群调度工具,该产品概念新颖,体系完整、功能全面、使用简单、操作流畅,它不仅有完整的调度核心、灵活的扩展,同时具备完整的应用体系。...

ETL批量调度-Taskctl 发表了文章 • 2020-06-29 11:33

0
推荐
2256
浏览

ETL调度系统及常见工具对比:azkaban、oozie、taskctl

最近遇到了很多正在研究ETL及其工具的伙伴向我们抱怨:同样都在用 Kettle ,起点明明没差异,但为什么别人ETL做的那么快那么好,自己却不断掉坑?其实,类似于像 Kettle 这样开源的工具,已经覆盖了大部分日常工...

ETL批量调度-Taskctl 发表了文章 • 2020-06-28 15:41

0
推荐
1733
浏览

高性能数据仓库

【摘要】作为高性能计算数据仓库,SPL Server 可以在离线跑批、在线查询、多维分析和内存计算 4 个方面提供高效的计算输出,帮助用户解决由于性能带来的这些问题:1. 半夜跑批跑不完,出错了来不及再来;2. 看个...

润乾软件 发表了文章 • 2019-06-03 17:06

0
投票
1
回答
2216
浏览

oracle中存储过程刷新物化视图

seng 回复了问题 • 2019-05-16 09:05
条新动态, 点击查看
农夫

农夫 回答了问题 • 2015-10-27 13:05 • 5 个回复 不感兴趣

如何保证数据质量?

赞同来自:

数据质量这块深有体味,曾经开发实施ERP多年,接过很多ERP业务需求并深入了解过业务,BI报表的需求等,有关数据质量分几种:
1.系统BUG问题:
 产生原因:A.开发测试验收流程不规范,遵循开发加自测=》测试=》业务需求部门验收的流程操作,减少这块引起的数据... 显示全部 »
数据质量这块深有体味,曾经开发实施ERP多年,接过很多ERP业务需求并深入了解过业务,BI报表的需求等,有关数据质量分几种:
1.系统BUG问题:
 产生原因:A.开发测试验收流程不规范,遵循开发加自测=》测试=》业务需求部门验收的流程操作,减少这块引起的数据质量问题。
        B.开发过程中,可能版本控制的问题,对公用的过程,我修改后另外的开发人员进行覆盖等等问题
 解决方案:A.规范开发测试及版本控制流程,没有任何捷径所走,上面几个朋友都有提到,对已发生的问题开发人员进行修改;
        B.曾经使用过一套平台化开发的ERP系统,主要原因是开发人员的进进出去,修修改改,数据质量经常不准确,后来通过3个月的时间,把所有单据明细与库存明细帐、销售明细账、期间表、即时库存、成本表等等所有的过账逻辑在晚上进行修复重算,再更新重算后正确的数据,一举解决了困扰公司几年老大难的问题。但这工作需要对业务、数据结构、ERP业务流程、开发能力都比较强的人员来操作,才能保证重算的准确。
2.分析指标统一口径问题:
 产生原因:在一公司做BI系统的时候,指标口径不统一,比如像成本有:门店成本、销售成本、加成成本等等好几个,每次开会的时候,采购部、销售中心、财务中心、市场部等等拿出来的数据可能名称一样,但数据都不一样;
 解决方案:我想这一块还是比较好解决的,只要先统计整理公司所有的指标,然后把业务部门请上来,统一指标名称、指标解释、计算公式等,就不会产生同一个人,这个叫李老四,那个叫李二狗。
3.企业不同的时期业务系统处理方式上逐步优化产生的数据差异:
 产生原因:企业在不同的发展时间,系统处理会有所差异,特别是二开比较多的公司
 解决方案:A.后续规范的数据与前面不规范的数据,看是否可以通过相对应的关系,进行整理统一;
        B.如果上述都不能处理的话,我想还是对前面的一些数据进行分开统计分析,否则两者不一样统计了来会误导业务人员
        以前在一通讯行业工作的时候,原来在联通新用户(存费送机、购机送费、单开户)、老用户等等以前都是通过一个或几个字段的状态标志进行区别,后来业务发展,发现这样太复杂,后来做了一个政策层级的分类,统一规范。在处理前面数据的时候,对以前的数据进行修复处理,以保证与后续的数据统计方式一致。否则区别两个统计方式。
4.因为实际业务过程中无法规范而产生的数据质量问题:
 问题举例:在一服装制造行业工作的时候,来统计产品的实际工时,因为是A产品完工、B产品新生产,在这一交接阶段,同时进行生产,无法正确的统计实际的生产工时,这是正常的实际情况。
 解决方案:后与业务部门沟通,将当天的实际工时根据当天完工产品的理论工价来按比例分配,这样对统计分析虽然会有不真实的情况,但也是能相对真实。
 所以碰到问题的时候,可以是否可以折中处理,只要不完全违背统计分析的原则,还要以考虑相应的处理方式。
 说了这么多废话,希望可以在实际工作中引起一些思考。
BIWORK

BIWORK 回答了问题 • 2015-10-09 15:18 • 13 个回复 不感兴趣

关于数据仓库模型的选取和大家进行一个讨论

赞同来自:

个人理解:
星型模型和雪花型模型没有绝对的谁好谁不好之分,都是维度建模的一种设计思想,只是看在什么情形下使用。
 
星型模型的提出主要是方便业务人员理解业务模型,通过什么样的维度来看数据,星型模型更加直观,并且查询效率高。雪花型模型对于业务人员来说直观程度不够... 显示全部 »
个人理解:
星型模型和雪花型模型没有绝对的谁好谁不好之分,都是维度建模的一种设计思想,只是看在什么情形下使用。
 
星型模型的提出主要是方便业务人员理解业务模型,通过什么样的维度来看数据,星型模型更加直观,并且查询效率高。雪花型模型对于业务人员来说直观程度不够,并且在查询上效率略低。
 
但是我来举一个反例。
日-月-年,产品-产品小分类-中分类-大分类,国家-省份-地区 加一个事实度量。如果每一个日,月,年类似于这样的都是一张维度表的话,就意味着这张事实表的外键涉及到上述所有的维度,变成 10 个外键维度和一个事实度量。可以想象一下这样的事实就如同一条蜈蚣一样形成了一个蜈蚣事实表,维度外键过多,虽然是星型模型但是实则并不好。
 
退一步说,这张事实表只关联到日,产品,地区这三个维度,日-月-年 成为日期维度的一部分属性,这种情况最终三个维度+一个事实,这种星型模型要稍微好一点。
 
我继续基于这个星型模型再来说明,我假设在产品维度中(产品-小分类-中分类-大分类) 假设小分类,中分类,大分类各有5个非重复的值,但是却有10W个产品。也就意味着在产品维度中,小分类-中分类-大分类差不多要重复10W次。 也就意味中如果要统计分类的量需要从这10W条里面做去重统计操作,这种做法我认为效率很低。
 
再次,如果小分类,中分类,大分类不仅仅是一个标签而且还包含着标签描述信息和其它的属性,可想而知在星型模型下的处理方式就只能扩展同样重复的字段,这种重复率随着需要补充描述的属性越多变得越高。反之,如果再把这些单个的小分类,中分类拉出去形成维度和事实度量值构成一个星型模型,就又回到我刚才说的蜈蚣表了。
 
所以,没有最好的设计,只有最合适的选择,我们就从上面的几个设计推演就能考虑很多星型模型的弊端,在很多时候不一定就是最好的。
 
关于第二个问题可以看看我的这篇文章 - http://www.flybi.net/blog/biwork/1084 微软BI 之SSAS 系列 - 维度的优化、灌木丛属性关系、以及自然层次结构与非自然层次结构的概念
 
Devin

Devin 回答了问题 • 2016-03-21 13:51 • 3 个回复 不感兴趣

亲们 Erwin逻辑模型怎么映射物理模型啊

赞同来自:

没太搞懂你的问题,你是想在ERWIN里面把逻辑模型转换成物理模型么? 这类建模工具都有提供讲逻辑模型转换成物理模型的功能,也支持多种数据库,比如常见的Oracle,DB2等等。
没太搞懂你的问题,你是想在ERWIN里面把逻辑模型转换成物理模型么? 这类建模工具都有提供讲逻辑模型转换成物理模型的功能,也支持多种数据库,比如常见的Oracle,DB2等等。
seng

seng 回答了问题 • 2017-03-01 11:09 • 1 个回复 不感兴趣

BIEE+mysql 使用ago函数的优化问题。

赞同来自:

同比环比可以使用日期对应表,记录的数据如
2017.1.1 -  2016.1.1
 
同比环比可以使用日期对应表,记录的数据如
2017.1.1 -  2016.1.1
 
Bob

Bob 回答了问题 • 2017-03-14 13:22 • 1 个回复 不感兴趣

数据仓库从MySQL向大数据平台迁移的方案

赞同来自:

数据仓库建议选择使用hive,用hql语句也能完成update delete的操作。
如果仓库是在hive上,那原来的ETL操作 都改为使用hql脚本吧。这个查询语言是类似mysql的语法。
 
迁移的优先级建议先搬迁底层原始数据、然后建立ETL清洗规则,最后... 显示全部 »
数据仓库建议选择使用hive,用hql语句也能完成update delete的操作。
如果仓库是在hive上,那原来的ETL操作 都改为使用hql脚本吧。这个查询语言是类似mysql的语法。
 
迁移的优先级建议先搬迁底层原始数据、然后建立ETL清洗规则,最后搬DW数据。
在搬迁底层数据时建议你hive原始表与mysql的原始表保持结构一致。
不需要,基于多维建模事实表由两部分组成,一部分是维度部分,即维度表相关外键信息。一部分是度量部分,是事实表真正要存放的数据,即金额,数据等,即指标。
 
设计要考虑的部分
 
1。根据分析主题确认适合的粒度。
2。考虑增量获取数据,即 增加时间戳。
3。不要包... 显示全部 »
不需要,基于多维建模事实表由两部分组成,一部分是维度部分,即维度表相关外键信息。一部分是度量部分,是事实表真正要存放的数据,即金额,数据等,即指标。
 
设计要考虑的部分
 
1。根据分析主题确认适合的粒度。
2。考虑增量获取数据,即 增加时间戳。
3。不要包含 描述性的信息,也 不要包含除 事实表与维表中对应的关联字段 之外的数据。
 
看你应用目标了,
 
不过吧,如果你搞不准,干脆分别建一个维度、一个度量,根据不同的场景用不同的
看你应用目标了,
 
不过吧,如果你搞不准,干脆分别建一个维度、一个度量,根据不同的场景用不同的
gogodiy

gogodiy 回答了问题 • 2017-05-22 17:59 • 1 个回复 不感兴趣

tableau能连数据库中的存储过程吗?

赞同来自:

MSSQL可以,注意在添加存储过程的时候,如果有参数,需要给定参数值。
MSSQL可以,注意在添加存储过程的时候,如果有参数,需要给定参数值。
悟

回答了问题 • 2017-06-09 00:17 • 1 个回复 不感兴趣

BI针对高层的售前需要准备什么PPT材料比较好

赞同来自:

这是我之前做的一张PPT,给领导汇报肯定是要偏管理、宏观、风险、预测方面。

40370
 
这是我之前做的一张PPT,给领导汇报肯定是要偏管理、宏观、风险、预测方面。

40370
 
悟

回答了问题 • 2017-06-14 10:40 • 4 个回复 不感兴趣

SQL SERVER 中MTD,QTD,YTD如何写SQL 语句?

赞同来自:

SQL中没有这样的函数,但是你可以把大段的公式写成自定义函数。
SQL中没有这样的函数,但是你可以把大段的公式写成自定义函数。
我不知道你这个会计时间的维度是不是做过处理了,如果是的话那么它的起始时间与结束时间可能不是自然月
一般是不需要合并的,只需要简单的在 row上,再加一个计算量值
我不知道你这个会计时间的维度是不是做过处理了,如果是的话那么它的起始时间与结束时间可能不是自然月
一般是不需要合并的,只需要简单的在 row上,再加一个计算量值
这个刚刚试了下,也是可以的,没想到啥好办法,刚试的方法,需要绕个圈:
就是Foreach循环的时候,每一次循环,都可以获取当前导入的数据量即行数,存到一个变量里;
然后再将这个变量和另一个汇总变量相加,存到汇总变量里,就可以了,截图看下
首先是这2个变量
ex... 显示全部 »
这个刚刚试了下,也是可以的,没想到啥好办法,刚试的方法,需要绕个圈:
就是Foreach循环的时候,每一次循环,都可以获取当前导入的数据量即行数,存到一个变量里;
然后再将这个变量和另一个汇总变量相加,存到汇总变量里,就可以了,截图看下
首先是这2个变量
excel_row_count:记录每一次循环加载的行数
excel_total_count:记录总行数
45819
然后,看下我这个例子
这个read_excle:就是循环读取excel了,将数据插入到数据库
total_count:就是计算总行数,
45820
 
注意这个excel_total_sql:我是使用SQL来计算了个和 select excel_row_count+excel_total_count
45821
 
最后将结果集返回

45822
 
最后测试结果是可以的
 
 

 
liutangwow

liutangwow 回答了问题 • 2017-08-09 10:59 • 1 个回复 不感兴趣

SSIS循环抽取EXCLE文件,记录文件名到日志?

赞同来自:

可以的,在遍历的时候,可以获取文件名称,可以选择获取的文件名称还是文件全路径名

45814
 
在变量映射中,我们可以获取到变量

45815
 
可以的,在遍历的时候,可以获取文件名称,可以选择获取的文件名称还是文件全路径名

45814
 
在变量映射中,我们可以获取到变量

45815
 
46815
用个函数ifnull就可以啦 ,见上图,除非是你的模型建的不对
 
46815
用个函数ifnull就可以啦 ,见上图,除非是你的模型建的不对
 
问题已解决,原因是由于id设置了不能为空,而id的值是数据库中的sequence,报不能解析的警告,把不能为空not null检查(仅限于流)的勾去掉就好了
问题已解决,原因是由于id设置了不能为空,而id的值是数据库中的sequence,报不能解析的警告,把不能为空not null检查(仅限于流)的勾去掉就好了
0
投票
1
回答
4383
浏览
0
投票
2
已解决
2128
浏览
4
推荐
3444
浏览

Friday BI Fly | 2016年11月4日晚8点半微信直播交流游戏行业数据仓库存储模型第38场 图文版记录

公告周五BI飞起来,每周一个主题,一场跟数据有关的行业、工具、技术的交流盛宴,锁定在每周五晚20:30,不见不散!未来几期的微信直播活动分享主题将包括在“增长黑客”在Power BI中的应用、Excel商业智能案例分享...

天善智能 发表了文章 • 2016-11-07 10:41

1
投票
4
已解决
3700
浏览
14
推荐
4883
浏览

数据仓库日期维度表 Oracle,DB2,Sqlserver

  数据仓库是BI平台的基础,主要有两大作用:1、统一的,高质量的集团信息视图,更好的保护企业数据资产2、为数据分析和挖掘提供数据基础。   数据仓库中典型的设计方案是维度建模,有兴趣的话大...

攻城的狮子 发表了文章 • 2016-08-21 19:23

0
投票
3
已解决
2622
浏览

如何发现用电量异常单位?

BAO胖子 回复了问题 • 2016-06-20 16:11
1
投票
4
已解决
5465
浏览

关于公司搭建一个数据仓库的疑问

jackharkness 回复了问题 • 2016-02-24 15:46
1
投票
5
已解决
3609
浏览
0
投票
3
已解决
3923
浏览
4
投票
13
已解决
8669
浏览
1
投票
5
已解决
6300
浏览
1
投票
4
已解决
4682
浏览
0
投票
3
已解决
3457
浏览

数据仓库需求问题

BIWORK 回复了问题 • 2015-09-08 17:52
0
投票
4
已解决
4568
浏览
0
投票
1
回答
2216
浏览

oracle中存储过程刷新物化视图

seng 回复了问题 • 2019-05-16 09:05
0
投票
2
回答
3125
浏览
0
投票
0
回答
3373
浏览
0
投票
1
回答
2280
浏览
0
投票
2
回答
2821
浏览
0
投票
1
回答
3171
浏览
0
投票
0
回答
2825
浏览
0
投票
0
回答
2065
浏览
0
投票
1
回答
5319
浏览
0
投票
1
回答
1787
浏览
0
投票
0
回答
2173
浏览
0
推荐
2463
浏览

10万级etl批量处理作业调度工具Taskctl Web应用版0元永久授权使用

软件下载:关注公众号:【Taskctl】关键字回复 "领取" 或 "软件" 即可获得认识 Taskctl-webTASKCTL 遵循软件产品标准化的原则,以“专业、专注”为设计理念,结合ETL 调度领域自身的...

ETL批量调度-Taskctl 发表了文章 • 2020-11-24 10:11

0
推荐
1791
浏览

ETL基础知识有哪些?3分钟让你轻松搞定

ETL发展的历史背景随着企业的发展,各业务线、产品线、部门都会承建各种信息化系统方便开展自己的业务。随着信息化建设的不断深入,由于业务系统之间各自为政、相互独立造成的数据孤岛”现象尤为普遍,业务不集成...

ETL批量调度-Taskctl 发表了文章 • 2020-08-03 16:07

1
推荐
1816
浏览

元数据是什么?举例告诉你哪种方式更适合元数据的录入

元数据,一个简单的定义是描述数据的数据。在企业中,无论哪里有数据,都有相应的元数据。只有存在完整而准确的元数据,我们才能更好地理解数据并充分利用数据的价值。为了让大家更好地了解什么是元数据,TaskCtl...

ETL批量调度-Taskctl 发表了文章 • 2020-07-28 17:12

0
推荐
1468
浏览

大数据与批量调度的紧密关系

当大数据在手机端花枝招展地跳跃时,你很自豪地说,我知道它是怎么来的,它是从网络另一端来的。可当碰到一个刨根问底的家伙,他又问,那网络另一端的数据又是怎么来的,你是否一脸蒙逼?不,你可能说,作为一枚I...

ETL批量调度-Taskctl 发表了文章 • 2020-07-21 15:26

0
推荐
1537
浏览

新手一看就秒懂的数据挖掘的10大算法

一个优秀的数据分析师,除了要掌握基本的统计学、数据库、数据分析方法、思维、数据分析工具技能之外,还需要掌握一些数据挖掘的思想,帮助我们挖掘出有价值的数据,这也是数据分析专家和一般数据分析师的差距之...

ETL批量调度-Taskctl 发表了文章 • 2020-07-20 14:39

0
推荐
1679
浏览

MySQL Explain 详解(优化MySQL性能第一步)

MySQL Explain 详解使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句。分析你的查询预付或表结构的性能瓶颈。查询结果返回字段分析1、id列select查询的序列号,包含一组数字...

ETL批量调度-Taskctl 发表了文章 • 2020-07-17 16:00

0
推荐
2269
浏览

【开源】企业10万级调度软件 taskctl 6.0 永久免费授权使用

关注公众号 "taskctl" 关键字回复 "领取" 即可获得永久免费授权TASKCTL作为敏捷批量调度的开拓者,产品设计从一开始就专门为整洁的体验而设计,并提供丰富、直观的用户界面,以简化常见的作业调度执行编排流程。T...

ETL批量调度-Taskctl 发表了文章 • 2020-07-14 15:35

0
推荐
2096
浏览

中美两国10万级作业调度工具 "TaskCtl" Vs "Control-M" 如何选用

前言:美方:Control-M ( www.bmc.com)中方:TASKCTL ( www.taskctl.com )ETL调度工具中美PK ( TASKCTL VS Control-M)Control-M图片源自网络TaskCtl图片源自网络而国内,在众多的软件中选择TASKCTL,我似乎没有任...

ETL批量调度-Taskctl 发表了文章 • 2020-07-09 09:54

0
推荐
2471
浏览

数据调度平台etl系统二大种类及其实现方法与流程

什么是调度系统调度系统,更确切地说,作业调度系统(Job Scheduler)或者说工作流调度系统(workflow Scheduler)是任何一个稍微有点规模,不是简单玩玩的大数据开发平台都必不可少的重要组成部分。除了Crontab...

ETL批量调度-Taskctl 发表了文章 • 2020-07-06 15:30

1
推荐
2145
浏览

开源数据调度平台taskctl免费分享领取

产品简介taskctl是一款由成都塔斯克信息技术公司历经10年研发的etl作业集群调度工具,该产品概念新颖,体系完整、功能全面、使用简单、操作流畅,它不仅有完整的调度核心、灵活的扩展,同时具备完整的应用体系。...

ETL批量调度-Taskctl 发表了文章 • 2020-07-03 18:00

0
推荐
2231
浏览

【搞事情】10万级商用etl作业调度工具taskctl免费开源了

工具背景taskctl是一款由成都塔斯克信息技术公司历尽10年研发的etl作业集群调度工具,该产品概念新颖,体系完整、功能全面、使用简单、操作流畅,它不仅有完整的调度核心、灵活的扩展,同时具备完整的应用体系。...

ETL批量调度-Taskctl 发表了文章 • 2020-06-29 11:33

0
推荐
2256
浏览

ETL调度系统及常见工具对比:azkaban、oozie、taskctl

最近遇到了很多正在研究ETL及其工具的伙伴向我们抱怨:同样都在用 Kettle ,起点明明没差异,但为什么别人ETL做的那么快那么好,自己却不断掉坑?其实,类似于像 Kettle 这样开源的工具,已经覆盖了大部分日常工...

ETL批量调度-Taskctl 发表了文章 • 2020-06-28 15:41

0
推荐
1733
浏览

高性能数据仓库

【摘要】作为高性能计算数据仓库,SPL Server 可以在离线跑批、在线查询、多维分析和内存计算 4 个方面提供高效的计算输出,帮助用户解决由于性能带来的这些问题:1. 半夜跑批跑不完,出错了来不及再来;2. 看个...

润乾软件 发表了文章 • 2019-06-03 17:06

0
推荐
2036
浏览

数据仓库跑批提速方案

【摘要】随着数据量的不断增长和业务复杂度的不断增加,数据仓库跑批任务量越来越繁重,耗时越来越长。众多项目出现了整晚都算不完、跑不完的情况。造成如此困境的原因是什么?如何破局?点击数据仓库跑批提速方...

润乾软件 发表了文章 • 2019-03-25 10:38

0
推荐
2354
浏览

给学生朋友们一个福利——阿里校招直通通道

开门见山:一年一度的阿里校招又开始了,相信各位学生朋友们已经在各个渠道上看到校招申请入口了。而今天我要给关注我的学生朋友们带来一个福利:数据技术与产品部的校招直通通道!直通通道的好处:只要你有志于...

陈丹奕 发表了文章 • 2019-03-14 11:24

  数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。
数据仓库是决策支持系统和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。其特征在于面向主题、集成性、稳定性和时变性