Kylin事实表里的数据怎样更新

0
已邀请:
0

Kiwi2021 2021-07-15 回答

如果在使用 Kylin 中遇到了问题
使用搜索引擎(谷歌/百度)、Kylin 的邮件列表的存档, Kylin 的 JIRA 列表 来寻求解决办法。
浏览 Kylin 官方网页,尤其<a href="https://www.1685100.com/view/z ... gt%3B SG飞艇</a>是文档 和 常见问题 页面。
向社区求助,用户可以在订阅 Apache Kylin 的邮件列表之后,用个人邮箱向 Apache Kylin 邮件列表发送邮件,所有订阅了邮件列表的用户都会看到此邮件,并回复邮件以发表自己的见解。
Apache Kylin 主要有 3 个邮件列表,分别是 dev、user、issues。dev 列表主要讨论 Kylin 的开发及新版本发布,user 列表主要讨论用户使用过程中遇到的问题,issues 主要用于追踪 Kylin 项目<a href="https://www.1685100.com/view/z ... gt%3B 极速赛车</a>管理工具(JIRA)的更新动态,订阅的方法请参考 Apache Kylin 邮件群组 页面中的订阅方法。
也正因为 Apache Kylin 社区是开源社区,所有用户和 Committer 都是志愿进行贡献的,所有的讨论和求助是没有 SLA(Service Level Agreement)的。为了提高讨论效率、规范提问,建议用户在撰写邮件时详细描述问题的出错情况、重现过程、安装版本和 Hadoop 发行版版本等,并且最好能提供相关的出错日志。另外,因为用户的全球化,建议提问时使用英文撰写邮件内容、至少保证邮件主题使用英文。有一篇关于如何提问的How To Ask Questions The Smart Way 文章,推荐阅读。
Kylin 是大数据的通用 SQL 引擎吗?
不,Kylin 是一个带有 SQL 接口的 OLAP 引擎。 SQL 查询需要与预定义的 OLAP 模型匹配。

什么是使用 Apache Kylin 的典型场景?
如果用户有一个巨大的表 (如:超过 1 亿行) 与维表进行 JOIN,而且查询需要在仪表盘、交互式报告、BI (商务智能) 中完成,用户并发数量为几十个或者几百个,那么 Kylin 是最好的选择。

Kylin 支持多大的数据量表? 性能怎么样?
Kylin 可以支持 TB 到 PB 级数据集的亚秒级查询。 这已经被 eBay,美团,头条等用户验证过。<a href="https://www.1685100.com/view/z ... gt%3B 天津快乐十分</a> 以 美团的案例为例(至 2018-08),973 个 Cube,每天 380 万个查询,原始数据 8.9 万亿,总 Cube 大小 971 TB(原始数据更大),50%查询在 <0.5 秒内完成,90% 查询 <1.2秒。

Cube 的膨胀率是多大(与原始数据相比)
Cube 的膨胀率取决于多个因素,例如维度 / 度量的数量,维度的基数,Cuboid 的数量,压缩算法等。用户可以通过多种方式优化 Cube 体积。

如何比较 Kylin 与其他 SQL 引擎(如 Hive,Presto,SparkSQL,Impala)
SQL 引擎以不同的方式回答查询,Kylin 不是它们的替代品,而是它们的查询加速器。很多用户将 Kylin 与其他 SQL 引擎一起使用。对于高频率查询的模式,构建 Cube 可以极大地提高性能并给集群负荷减压。

运行 Kylin 需要多少个 Hadoop 节点?
Kylin 可以在 Hadoop 集群上运行,从几个节点到数千个节点,取决于您拥有多少<a href="https://www.1683990.com/"> nice</a>数据。 该架构可水平扩展。
因为大多数计算都是在 Hadoop(MapReduce / Spark / HBase)中进行的,所以通常只需要在几个节点中安装Kylin。
 
 


 

要回复问题请先登录注册