概述

基于Hadoop的生态系统帮助企业流程各种数据集并构建可操作的分析。但是,由于这些平台以大规模采用,因此企业面临提供集群的挑战,增加成本,治理和表现。Analytical,Sandbox类型的环境需要提供按需计算需求,这些需求困难,因为它不支持解耦计算和存储。

标识

企业可以通过迁移到稳定,安全的,治理的云平台来解决这些问题,可以衡量按需,有效地管理成本,促进每次使用付费功能并满足合规要求。分析用户还可以点击基础设施的按需供应,并利用大基础预构建库组件。Hadoop迁移到云在数据景观现代化中发挥着关键作用,可以帮助利用数据经济提供的机会。

我们的Hadoop移民战略和加速器可以帮助企业有效地加速迁移之旅。

Infosys数据和分析团队通过明确定义的策略和工具套件建立了解决方案,以加速Hadoop迁移旅程到云平台。

我们已经确定了有效迁移到云的不同方法:

  • 升降机/移位 - 迁移内部内部过程,没有变化云
  • 改造 - 迁移对象,具有最小的变化,如存储组件和兼容新环境的功能
  • 重新架构师:重新设计应用程序以实现现代化平台的好处
  • Hybrid:将应用程序迁移到不同模式的组合
数据运营服务产品

图1:Hadoop迁移到AWS模式

我们已经设计了加速器和流程,以帮助通过上述任何模式迁移内部内部数据湖对象和应用程序,然后是实现策略,以帮助客户实现缩放和可预测的结果。

数据运营服务产品

图2:实施策略

使用Infosys向导和AWS加速您的云迁移

与我们的专家交谈

通过能力加速云迁移旅程50% -

  • 库存元数据集合
  • 架构转换
  • 历史数据迁移和追赶负载
  • 数据认证

Infosys数据向导可以帮助加速迁移过程。该解决方案包括以下组件:

  • 评估:全面的评估框架,可以识别源数据存储的使用模式,并推荐最适合目标数据存储
  • 现代化建议:决策矩阵有助于确定每种类型数据存储的正确方法
  • 数据库对象迁移:解决方案加速器有助于迁移不同类型的DB对象库存类
  • 代码/管道迁移:解决方案加速器,有助于迁移不同类型的数据处理对象库存类
  • 消费迁移解决方案加速器有助于迁移不同类型的消费物对象库存类
  • 历史数据迁移:解决方案加速器,有助于将历史数据迁移到目标数据平台
  • 测试和验证:全面的测试解决方案,加速了迁移资产的验证
  • 合作伙伴生态系统:供应商合作伙伴关系补充迁移框架和解决方案

我们有多种方法可以满足客户特定的需要迁移与不同平台上的工具兼容的工作流/代码。

可以在下面的方式启用从Hadoop到AWS的迁移:

  • Hadoop平台在云上
  • Hadoop到AWS EMR
  • Hadoop到Next-Gen服务(本机+第三方)
线

挑战和解决方案

  • 在一开始,捕获和监控其整个方面建立价值实现框架
  • 利用目标平台提供的能力,如:
    • 托管服务简化和保存管理费用
    • 与持久性相比,使用临时,按需存储和处理集群(短信模型)
    • 存储/计算设计定期任务以节省成本

通过能力加速云迁移旅程50% -

  • 通过考虑目标平台工具的好处,确保正确的迁移方法遵循类似的迁移方法 - 升降-n转移,改造,重新建立等等。还取决于工作负载,可以遵循所有这些方法而不是一个方法。
  • 开始小型 - 构建测试沙箱和运行POC,具有较小/非关键数据,关联的作业和调谐目标产品配置
  • 识别数据摄取,数据工程,常见数据库,目标工具中的数据治理(质量,元数据,血统)的数据摄取,数据工程,常见数据库的构建基础组件
  • 目标产品供应商或其合作伙伴利用迁移工具
  • 杠杆现成的测试工具(由目标产品供应商推荐)

通过Clear Raci构建合适的移民团队(负责任,负责任,咨询和通知)

  • 恰当地向计划进行失败。
  • 制定跨治理,硬件,Hadoop软件,架构,应用程序(数据,对象,代码,工作流,消费),测试和部署的综合计划计划

通过时间戳,业务线,工作负载分离数据域并将其转换为APT MVP(最小可行的产品)

  • Sprint计划
  • 人们流失不可避免,所以考虑知识MGT。,发行MGT。作为关键活动

  • 安全(授权/访问)和迁移监视(审计,记录)应在开始时考虑
  • 使用较小的数据验证安全合规性的每个目标技术组件(网络,防火墙,软件,应用程序,静态/运动加密)
  • 在迁移发布以进行生产之前运行安全性