挑战

我们的客户端是一名领先的发布者,需要通过易于使用的搜索功能使用户可以轻松访问用户。为此,他们需要一个强大的自学习信息检索平台,该平台将摄取超过300个数据源,并以用户友好的方式使其可用。

解决方案

Infosys利用其AI平台NIA,开发稳定的架构设计,并实现了符合Metadata收获(OAI-PMH)的开放式档案计划协议(OAI-PMH)的数据收割机。这使得可以使用各种开源和AWS工具来摄取级别的数据。搜索功能得到增强,包括先进的NLP和机器学习技术,以及自动化的“类型前方”功能。

线

结果

基于火花的ETL框架仅在2.8秒内摄取数据容器

搜索质量评估的系统方法

通过NLP和机器学习改进了搜索功能

通过信息检索专家组获得最佳搜索项目

了解更多信息如何帮助您更好地管理和访问数据。