会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 小红书将业界最大数据湖迁至阿里云!

小红书将业界最大数据湖迁至阿里云

时间:2024-12-27 14:15:48 来源:肝肠寸断网 作者:知识 阅读:147次

记者获悉,小红经过一年奋战,书将数据小红书已把业界体量最大的业界数据湖0故障迁上阿里云。据统计,最大至该项目共有1500人参与,湖迁迁移数据500PB。小红

作为中国头部互联网公司之一,书将数据小红书月活已过3亿,业界其数据湖存储了过去11年的最大至所有原始数据,包括结构化、湖迁半结构化和非结构化数据。小红近年来,书将数据随着业务的业界高速增长,小红书在线处理数据的最大至需求不断增加,同时离线处理所积累的湖迁历史问题,也会在未来的切换中带来更多成本与风险。

小红书将业界最大数据湖迁至阿里云

为此,2023年11月,小红书发起迁云项目——计划一年内,把小红书的数据湖搬上阿里云。

迁移至阿里云上后,数据湖可通过多个OSS Bucket支持纳入统一资源池,实现多个Bucket共享资源池内的OSS吞吐及QPS能力。这样的流控能力在面向小红书复杂业务场景,可灵活调配资源,高效利用吞吐性能,降低不同业务租户间的互相影响。阿里云原生HDFS+DLA元数据可实现无缝对接Hadoop EMR体系,支持元数据线性扩展能力,轻松应对小红书数百PB数据下的元数据线性增长。

较于过往业界体量最大的案例,小红书的本次迁移的数据体量更大。

*注:任务=数据处理过程

(图片来自小红书官方公众号)

据介绍,小红书的迁云项目经历了三个阶段。第一步,项目组首先解决标准问题,然后根据标准进行治理;第二步,完成治理后,项目在2024年5月正式进入双跑阶段。把数据拷贝到阿里云上,两边同时跑数,验证正确性与及时性;第三步,2024年8月,项目结束双跑,进入割接阶段。阿里云团队全程在现场保障,顺利完成了割接。

2024年11月,小红书迁云项目正式宣告结束。在0故障的情况下,迁移数据500PB,任务11万,参与人数1500人,涉及部门40多个。项目涉及产品之多和数据体量之大均创下业界记录。

(责任编辑:娱乐)

相关内容
  • [流言板]公牛队记:在拉文交易谈判中,纳吉成为了关键的分歧点
  • 西汉姆球员将在对狼队赛前穿安东尼奥球衣,球衣将拍卖做慈善
  • 陶瓷般质感!铭瑄Intel Arc B580 iCraft 12G显卡图赏
  • [流言板]状态欠佳!戈登全场6投1中,三分4中0,得到6分2篮板6助攻
  • [流言板]拼尽全力!坎宁安抢断反击快攻,詹姆斯全力追防破坏出界
  • 忘了小机器人吧!《黑神话:悟空》Steam首个重大更新上线:吐槽的都改了
  • 两射一传,欧冠官方:奥利塞当选矿工vs拜仁全场最佳球员
  • 张朝阳建议考试把百分制换成五分制:减轻教育压力
推荐内容
  • [流言板]属于我的夜晚!里夫斯晒绝杀庆祝照:圣诞快乐
  • 老甲A超级组:辽足获季军!邓乐军进球、付佳双响,辽宁22北京
  • CBA:广厦男篮力克深圳男篮 豪取主场9连胜
  • 《漫威争锋》3天玩家破1000万 Steam多半好评
  • 年轻人的电竞新机登场!荣耀GT全面评测:颜值在线性价无敌
  • 漫威大尺度爽片:《猎人克莱文》今日正式上映