加入收藏 | 设为首页 | 会员中心 | 我要投稿 淮安站长网 (https://www.0517zz.cn/)- 运营、云管理、经验、智能边缘、云硬盘!
当前位置: 首页 > 大数据 > 正文

网易大数据平台架构实践分享!

发布时间:2018-09-09 12:38:48 所属栏目:大数据 来源:火龙果软件工程
导读:副标题#e# 随着网易云音乐、新闻、考拉、严选等互联网业务的快速发展,网易开始加速大数据平台建设,以提高数据获取速度,提升数据分析效率,更快发挥数据价值。 本次演讲主要分享网易如何围绕和改造开源技术,以产品化思维打造网易自己的大数据平台, 也会

如果用MapReduce这样的离线计算,我会得到四条数据会得到0~100区间内有2条记录, 100~200区间内有1条记录。但如果用流式计算,可能就会遇到问题,为什么这么说呢?如果你现在已经处理了3条数据,就是说(1,、30),(,2,、10),(3,、80)这三条数据,这个情况下你说出的输出的结果是0-100有三个商家。当第四条数据参与计算后,系统可能就会输出0-100有三个有3个商家,100-200有一个有1商家,这个结果就是有误的,这是因为实时计算没有去纠正已经输出的计算结果。的原则是不停得计算并输出结果。

11

(编辑:淮安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读