0
推荐
1165
阅读

莫非我就是被时代召唤的数学人

​最近中美贸易战,华为成了焦点。任老爷子一席大论,据说有 27 次提到了数学;紧接着,某著名公号的一篇《时代呼唤数学家》又刷了屏,直把数学家推到了风口浪尖,让人感觉数学的春天就要来了。熟悉我所做工作的朋友也来问我:是不是有很多人来找我了。其实惭愧,并没有多少,所以写个文章蹭蹭热点宣传一下。我是在用数学...

发表了文章 • 2019-05-30 20:09 • 0 条评论

1
推荐
1419
阅读

这个产品能支持多大数据量?

经常有用户会问这个问题,你家的产品能处理多大数据量?似乎是这个值越大产品就越牛。这个问题,其实没多大意义。能处理多大的数据量,还有个很关键的因素是期望的响应时间,在脱离这个因素单纯谈大数据产品的数据处理量,就不知道怎么回答了。考虑只有单台机器的简单情况。如果是希望秒级响应的OLAP式汇总,那么GB级都...

发表了文章 • 2018-06-12 10:34 • 0 条评论

0
推荐
1376
阅读

最简单的大数据性能估算方法

大数据的性能是个永恒的话题。不过,在实际工作中我们发现,许多人都不知道如何进行最简单的性能估算,结果经常被大数据厂商忽悠:)。这个办法我在以往的文章中也提到过,不过没有以这个题目明确地点出来。其实很简单,就是算一下这些数据从硬盘上取出来用的时间。除了个别按索引取数的运算外,绝大多数运算都会涉及对数...

发表了文章 • 2018-06-11 17:22 • 1 条评论

0
推荐
1340
阅读

大清单报表的打印?

我们谈了大清单报表的呈现方法,其实有时候这些报表还需要打印,比如银行打印流水对账单。那么,打印是不是也要像呈现那样做一个缓存机制呢?没有这个必要。打印和浏览不同,一般是从头到尾过一遍就行了,过程中没有翻页的需求。这样,只要流式读入数据逐步生成打印页就可以了,不会发生内存溢出的问题。但这个做法仍然...

发表了文章 • 2018-06-05 11:36 • 0 条评论

1
推荐
1638
阅读

做基础软件很悲壮?

这几天中国数据库界出了一件悲伤的事情,南大通用创始人崔维力先生突然因病去世。我和崔先生神交已久,但却未曾谋面,一直希望有机会当面沟通讨教,这一下就成永远的遗憾了。崔先生的英年早逝(60多岁的年纪而已)又引发一个话题:做基础软件,特别是做国产基础软件,是个苦行僧的活。相比于应用软件,基础软件的技术含...

发表了文章 • 2018-05-29 13:15 • 0 条评论

0
推荐
1409
阅读

存储和计算技术的选择

                     前一阵子公司有个售前来沟通某个用户的情况:数据量比较大,又涉及很多复杂的关联计算,在数据库中用SQL计算性能很差。本来这种场景是比较适合集算器的集文件(集算器特有的压缩二进制格式...

发表了文章 • 2018-05-24 09:52 • 0 条评论

1
推荐
2337
阅读

区块链技术的一些疑问

下面是我在学习了解区块链技术过程中产生的疑问,思考问题的过程中也会让自己对这项技术理解得更深刻。我不算初学者(知道区块链已有五年之久了),但一直也没有深入学习,不能算链圈的专业人士,所以可能孤陋寡闻,不能确认这些问题是不是已经被解决了,或者根本就是问得毫无意义,权当学习笔记。 1. 区块链只适合...

发表了文章 • 2018-05-23 10:24 • 0 条评论

1
推荐
2011
阅读

数据蒋堂新一年

时光匆匆,《数据蒋堂》已经走过一年。在这里,也庸俗地感谢一下读者们的一路相伴!老实说,这一年写这玩意儿有点难度的,主要原因是时间周期卡得有点死,每周一篇执行起来是不太容易,一开始小看了这个频度;另外是篇幅问题,一周一篇讲一个问题,也不希望太短。结果有时工作忙了来不及搞,就会感觉是个负担了,而且偶...

发表了文章 • 2018-05-23 09:32 • 1 条评论

0
推荐
1372
阅读

大数据技术的4个E

大数据的4个V说法在业界已经尽人皆知,这是指的大数据本身的特征。现在我们来考察一下用于处理大数据的技术应该具有的特性。为方便记忆,类似4个V,我们把这些特性总结成4个E,用户在选择大数据技术解决方案时可作为参考。1. Easy 大数据技术要足够简单易用这个E很容易理解。要进行大数据处理的场景很多,涉及工作人员也...

发表了文章 • 2018-05-21 23:45 • 0 条评论

0
推荐
1680
阅读

【数据蒋堂】第48期:Hadoop中理论与工程的错位

Hadoop是当前重要的大数据计算平台,它试图摒弃传统数据库的理念,重新构建一套新的大数据体系。但是,这并不是件很容易的事,在Hadoop的设计和实现中能看到一些先天不足的地方,其中一点就是把理论问题和工程问题给搞拧了。所谓理论方法,是指试图解决问题的一般情况,设计通用的算法能适应尽量多的情况,并努力使算法...

发表了文章 • 2018-05-09 09:45 • 0 条评论

1
推荐
1588
阅读

【数据蒋堂】第47期:Hadoop – 一把杀鸡用的牛刀

Hadoop是个庞大的重型解决方案,它的设计目标本来就是大规模甚至超大规模的集群,面对的是上百甚至上千个节点,这样就会带来两个问题:1. 自动化管理管任务分配机制:这样规模的集群,显然不大可能针对每个节点提供个性化的管理控制,否则工作量会大到累死人,必须采用自动化的管理和任务分配手段,而这并不是件简单的事...

发表了文章 • 2018-05-08 11:06 • 0 条评论

0
推荐
1405
阅读

【数据蒋堂】第46期:大数据集群该不该透明化?

这好像是个多余的问题,大部分大数据平台都把集群透明化作为一个基本目标在努力实现。所谓集群透明化,是指把一个多台机器的集群模拟得像一个巨大的单机,只是系统管理层面知道体系是由很多单机集群而成,应用程序则应当尽量少地感受到集群的存在,在概念上可以把整个集群理解成一台机器,甚至在代码级都可能和单机运算...

发表了文章 • 2018-05-03 09:20 • 0 条评论

0
推荐
1357
阅读

做基础软件要投入很多钱?

现在有个说法,国家对基础软硬件的投入太少,经常会说微软、Oracle、Intel这些巨头每年的研发费有多少多少,我们的投入连个零头都不到,当然做不出什么象样的东西了。看起来还真是,似乎还要再加大投入才行?我不懂芯片的事,不知道是不是需要花很多钱才能建出基本的实验生产环境,但软件的研发成本还是比较熟悉的。在我...

发表了文章 • 2018-05-02 11:31 • 0 条评论

0
推荐
1318
阅读

国产操作系统还能怎么做?

一家之言,开个脑洞。操作系统在市场上的关键点,并不在于进程管理、文件系统这些看起来很核心的东西,这些东西真地可以抄(借鉴一下没关系的)。操作系统要普及成功,关键在于上面开发技术的方便性,也就是开发工具的易用性以及API的丰富性。开发工具就是操作系统的用户界面,决定了用户体验;下层核心是为上层API服务...

发表了文章 • 2018-05-02 11:27 • 0 条评论

1
推荐
1251
阅读

国产数据库通通都没戏!

这标题摆明了就是招人骂,一下子把国内做数据库的同行们都得罪了,甚至连自己都没落下(我也算做数据库的,而且当然也是国产的)。这观点已经有N年了,而且也多次讲过。这次正好有个热点来蹭,就把它写出来。既然蹭热点嘛,那就不怕标题党了。不过,还是要先澄清一下,这里说的“没戏”,并不是说国内厂商做不出一个可用的...

发表了文章 • 2018-05-02 11:20 • 0 条评论