阿里云开放搜索服务OpenSearch (简称OpenSearch )基于阿里巴巴自主研发的大规模分布式搜索引擎平台(该平台承载了阿里集团所有主要搜索业务)搭建而成。其主要为解决用户结构化数据搜索需求的托管服务,支持数据结构、搜索排序、数据处理自由定制。开放搜索服务主要为的网站或应用程序提供简单、低成本、稳定、高效的搜索解决方案。[1]
1、文档索引结构定制,以及自由修改
将搜索引擎复杂的索引结构概念简单化、可视化和自助定制化。开发者可以通过控制台创建搜索应用,定制文档字段的结构和属性,包括字段名称、类型、分词方式、搜索属性等。搜索应用在运行过程中可以自由修改,满足了产品快速变化的需求,极大缩短了需求变更到上线的过程。
2、主流阿里云存储产品的自动对接,数据自动同步更新
开发者只需要在控制台中授权,数据就可以自动同步至OpenSearch中,后续数据的更新也可以自动实时同步。
3、多表数据推送,及字段文本处理和转换
类似于数据库,每个搜索应用可以创建一张或者多张表,每张表的字段上可以内置数据处理插件,对字段内容做文本处理和转换,例如拼音转换、HTML标签剔除、JSON数据解析等,多个表会Join在一起实现联合查询。
4、两轮相关性排序定制,简单灵活加速产品效果优化迭代
索结果相关性排序是影响用户体验最关键的一环,OpenSearch支持开发者定制两轮相关性排序规则来准确控制搜索结果的排序。第一轮为粗排,从命中的文档集合里海选出相关文档。第二轮为精排,对粗排的结果做更精细筛选,支持任意复杂的表达式和语法。方便开发者能更准确控制排序效果,优化系统性能,提高搜索响应速度。
开放搜索团队为阿里集团内部上百个产品和应用提供搜索服务
2014年7月
??在阿里云上云发布,开始对外公测
2014年9月
??ODPS源自动对接OpenSearch上线;
??in_polygon、in_query_polygon等新插件function发布,为O2O用户提供更优质的搜索效果体验;
??API/SDK推送文档用户指定时间戳保序功能发布,方便多线程用户更好的控制文档更新流程
2014年10月
??分区域部署上线,支持杭州区域;
??JAVA SDK V2.1.1发布:优化调试信息打印、增加超时时间设置、gzip方式支持、最大连接数设置、开放rerake_size参数等;
??PHP SDK V2.0.4发布:取消默认时区、优化调试信息打印、增加超时时间设置、开放rerank_size参数等;
??配额预警功能上线,文档即将超配额自动邮件通知,提醒用户及时修正
2014年11月
??实时引擎发布,数据处理时效性(从数据推送到系统到能检索到)达到10+秒级别;
??创建、修改应用结构流程优化:去掉多值字段,改为新增ARRAY类型,更方便用户理解;去掉可聚合类型,引擎对于可聚合与可过滤处理逻辑相同,勾选可过滤即可支持原可聚合的功能。
2014年12月
??附表数据自动更新功能发布,无需用户手动触发主表即可生效
2015年1月正式对外开放搜索服务
??错误码优化,方便用户排查问题;
??RDS数据源自动对接OpenSearch发布,支持杭州区域mysql5.5、mysql5.6的自动数据同步;
??应用结构流程优化,数据源及索引重建功能拆分,优化用户导入数据体验
2015年2月
??QP一期重磅发布,新增提供公共词典的纠错、停用词、词权重等查询分析功能,可以让用户更好的干预搜索结果,以获得更好的搜索体验;
??ODPS支持分区等功能,方便用户做全量数据版本控制
2015年3月
??北京机房上线,支持北京区域;
??新增多粒度MWS_TEXT及用户自定义NWS_TEXT分词字段类型,提供更强大的分词功能,提高召回率。
??query子句新增query boost功能,允许用户指定查询词权重,新增exact_match_boost、first_phase_score函数,二者配合使用,可以更好的控制排序效果。