一家为农业设备提供售后保证的全球农业设备制造商寻求使其数据生态系统现代化,以便进行数据分析和货币化。
印孚瑟斯与该公司及其遍布美国的经销商网络合作,收集数据用于高级分析。
主要挑战
准备好体验吗?
专家说业务用户可以访问相关数据,对风险进行客观评估,从而生成全面的保修政策
印孚瑟斯扩大了数据来源,以了解设备的生命周期。现有系统只跟踪保修期内的数据。在保修期间,印孚瑟斯从设备数据中提取了超过7500万条记录,并扩展了覆盖范围,以及经销商的维修/服务记录。
我们的团队利用Spring XD和Python进行数据传输和导出数据的批处理。我们使用Informatica ETL产品和IBM Netezza数据仓库设备来优化数据系统。
有一些软件框架可以吸收和处理大量的数据,包括HDFS、Apache Crunch、Hadoop MapReduce、Apache Hive、Sqoop和Oozie工作流调度器系统。Java DOM Parser、XSLT和XSD用于管理和存储文档。
该技术堆栈创建了一个可伸缩的大数据系统,用于实时数据捕获、摄取和分析。它集成了产品、保修、远程信息、客户和经销商数据。来自生态系统的实时数据流入存储历史记录的Hadoop数据湖和数据集市环境。
印孚瑟斯的系统平均每天处理超过40万条记录,包括保修后的维修/维护订单和备件的场外销售。
我们的大数据解决方案提供库存的实时可见性和强大的并发分析过程。