【资料图】
IT之家 12 月 14 日消息,阿里巴巴开源了自研搜索引擎 Havenask,目前项目文件已在 GitHub 推出。
仓库介绍称,Havenask 是阿里巴巴集团自研的搜索引擎,也是阿里巴巴内部广泛使用的大规模分布式检索系统,支持了包括淘宝、天猫、菜鸟、高德、饿了么、全球化在内整个阿里巴巴集团的搜索业务,为用户提供高性能、低成本、易用的搜索服务。
同时,Havenask 具有灵活的定制和开发能力,支持算法快速迭代,帮助客户和开发者量身定做适合自身业务的智能搜索服务,助力业务增长。
据介绍,Havenask 的核心能力与优势,有以下几点:
极致的工程性能:支持千亿级数据实时检索,百万 QPS 查询,百万 TPS 写入,毫秒级查询延迟与秒级数据更新。 C++ 的底层构建:对性能、内存、稳定性有更高保障。 SQL 查询支持:支持 SQL 语法便捷查询,查询体验更友好。 丰富的插件机制:支持各类业务插件,拓展性强。 支持图化开发:实现算法分钟级快速迭代,定制能力丰富,在新一代智能检索场景下的支持效果优秀。 支持向量检索:可通过与插件配合实现多模态搜索,满足更多场景的搜索服务搭建需求(待发布)。IT之家了解到,该引擎底层主要使用 C++ 编写,并采用了少量的 Python 语言,需要使用 Docker 容器运行,机器内存需大于 10GB,CPU 大于 2 核,磁盘大小大于 50GB。
GitHub 页面:点此查看