微博搜索(微博APP「搜索」功能分析)

懵懂先生 网文资讯微博搜索(微博APP「搜索」功能分析)已关闭评论151阅读模式

文章源自略懂百科-http://wswcn.cn/20820.html

本文从用户需求满足的使用场景出发,进行典型方案拆解、业务逻辑分析,探讨搜索功能在功能和策略方面的迭代优化。文章源自略懂百科-http://wswcn.cn/20820.html

一、项目背景文章源自略懂百科-http://wswcn.cn/20820.html

选择query调研微博搜索功能对用户需求满足情况,从以下两个维度对所选择query进行分类,文章源自略懂百科-http://wswcn.cn/20820.html

内容类型维度:社会、影视娱乐、时尚美妆、体育运动、旅游、美食、互联网、文娱、科普教育、生活记录;需求理解维度:需求明确-结构简单清晰的query、需求明确-口语化的query、需求明确有额外条件、需求不明确。文章源自略懂百科-http://wswcn.cn/20820.html

因此进行case调研的query如下图所示:文章源自略懂百科-http://wswcn.cn/20820.html

在微博手机客户端搜索这些query,记录得到的结果与相应的问题,汇总case如下图所示。文章源自略懂百科-http://wswcn.cn/20820.html

由于是手机截图,粘贴到文章里会比较占地方,所以本文就没有粘贴本次调研的实际情况截图,大家感兴趣的话可以用微博自己搜一下试试看。文章源自略懂百科-http://wswcn.cn/20820.html

对以上case中,存在问题的case进行分析,如下图所示。文章源自略懂百科-http://wswcn.cn/20820.html

汇总这些case的问题原因,即需要针对性解决的问题,如下图所示。文章源自略懂百科-http://wswcn.cn/20820.html

二、项目目标1. 产品目标文章源自略懂百科-http://wswcn.cn/20820.html

用户以最低成本获得需要的信息。文章源自略懂百科-http://wswcn.cn/20820.html

2. 核心指标定义文章源自略懂百科-http://wswcn.cn/20820.html

用户搜索成功率,即用户在搜索query后,没有后续行为(包括更改query,切换tab等),直接获得需要的结果的概率。文章源自略懂百科-http://wswcn.cn/20820.html

3. 重要指标定义query解析准确率,即query解析准确的概率;匹配准确率,即第一结果匹配准确的概率;前10排序准确率,即前10结果排序准确的概率;Query前10结果相关性,即一个query前10条结果与该query相关的概率。文章源自略懂百科-http://wswcn.cn/20820.html

case以上5个指标的满足情况如下图所示:文章源自略懂百科-http://wswcn.cn/20820.html

用户搜索成功率:27.50%;query解析准确率:50.00%;匹配准确率:40.00%;前10排序准确率:35.00%;Query前10结果相关性:52.50%。4. 项目目标用户搜索成功率提升至40.00%;Query解析准确率提升至60.00%;匹配准确率提升至60.00%;前10排序准确率提升至50.00%;Query前10结果相关性提升至70.00%。三、需求概述文章源自略懂百科-http://wswcn.cn/20820.html

针对本次项目需要解决的问题,设计相应改进方案,并根据问题影响面&预期可解决影响面与成本,排列解决方案优先级,如下图所示。文章源自略懂百科-http://wswcn.cn/20820.html

四、需求详述1. query解析文章源自略懂百科-http://wswcn.cn/20820.html

(1)改进方案一文章源自略懂百科-http://wswcn.cn/20820.html

方案:query解析增强常用口语词库与口语转义词库,提高对query的口语识别能力。文章源自略懂百科-http://wswcn.cn/20820.html

逻辑说明:对口语化query,利用常用口语词库找出query中的口语,再利用口语转义词库进行转义,获得需求明确的简要query后再进行切词工作。文章源自略懂百科-http://wswcn.cn/20820.html

Case举例:文章源自略懂百科-http://wswcn.cn/20820.html

(2)改进方案二文章源自略懂百科-http://wswcn.cn/20820.html

方案:query解析提高切词正确性,对长query允许以多种query处理结果进行搜索。文章源自略懂百科-http://wswcn.cn/20820.html

逻辑说明:当用户输入较长query时,不仅能够针对query整体对微博结果进行召回,同时能够在切词后,对query进行处理,转换为多种可能的query,去除query中一些无关紧要的词,并再次对微博结果进行召回。通过多次召回,在所有结果中,命中匹配相关性最好的微博。文章源自略懂百科-http://wswcn.cn/20820.html

Case举例:文章源自略懂百科-http://wswcn.cn/20820.html

(3)改进方案三文章源自略懂百科-http://wswcn.cn/20820.html

方案:query解析增强转义词库,提高对query额外条件的识别能力文章源自略懂百科-http://wswcn.cn/20820.html

逻辑说明:用户输入的query,在切词后,能够通过转义词库,提取出query中的额外条件,在匹配与排序的逻辑中为该标签增加权重文章源自略懂百科-http://wswcn.cn/20820.html

Case举例:文章源自略懂百科-http://wswcn.cn/20820.html

(4)改进方案四文章源自略懂百科-http://wswcn.cn/20820.html

方案:query解析增强专有名词库,提高对query需求主体识别能力。文章源自略懂百科-http://wswcn.cn/20820.html

逻辑说明:对query切词后,根据专有名词库找出query主体。文章源自略懂百科-http://wswcn.cn/20820.html

Case举例:文章源自略懂百科-http://wswcn.cn/20820.html

2. 结果匹配文章源自略懂百科-http://wswcn.cn/20820.html

(1)改进方案五文章源自略懂百科-http://wswcn.cn/20820.html

方案:匹配逻辑中,根据搜索query,提高匹配阈值,增加权威性、热度、时效性、原创性、内容相关性标签权重文章源自略懂百科-http://wswcn.cn/20820.html

逻辑说明:当用户搜索query较为复杂或长度较长,同时具有额外条件时,需要提高对召回结果的匹配阈值,过滤相关性较低的微博。文章源自略懂百科-http://wswcn.cn/20820.html

除此之外根据搜索query本身的特性与提取出的额外条件,增加与额外条件对应的权威性、热度、时效性、原创性等标签的权重。文章源自略懂百科-http://wswcn.cn/20820.html

Case举例:文章源自略懂百科-http://wswcn.cn/20820.html

(2)改进方案六文章源自略懂百科-http://wswcn.cn/20820.html

方案:根据搜索query,召回结果中,对数量异常多,热度异常高等特殊情况导致的达到命中阈值的结果进行异常处理,减少刷量等行为带来的错误匹配命中。文章源自略懂百科-http://wswcn.cn/20820.html

逻辑说明:根据搜索query,召回结果中,当出现某一类型结果微博数量异常多,或某一结果微博热度异常高,导致轻易突破匹配阈值的情况,需要针对性提高这一类搜索query内容相关性标签的权重,并将内容相关性作为一个辅助阈值。文章源自略懂百科-http://wswcn.cn/20820.html

综合阈值突破,然而内容相关性阈值未突破的情况下,对该类召回结果做特殊处理(不匹配,或者折叠,或者去重)。从而减少刷量、刷热度等行为带来的错误匹配命中。文章源自略懂百科-http://wswcn.cn/20820.html

Case举例:文章源自略懂百科-http://wswcn.cn/20820.html

3. 结果排序文章源自略懂百科-http://wswcn.cn/20820.html

(1)改进方案七文章源自略懂百科-http://wswcn.cn/20820.html

方案:在用户的连续搜索行为中,提高排序逻辑中上下文场景之间的关联性标签权重以及更新时效,提高连续搜索行为中同一主体的关联性。文章源自略懂百科-http://wswcn.cn/20820.html

逻辑说明:在用户具有连续搜索行为时,触发该逻辑。针对用户搜索query之间的相关性(例如鹿晗电影、鹿晗),在召回结果匹配时,提高与之前的搜索行为有关联的标签权重,并提高这类标签的更新时效,及时更新。文章源自略懂百科-http://wswcn.cn/20820.html

Case举例:文章源自略懂百科-http://wswcn.cn/20820.html

4. 结果展示文章源自略懂百科-http://wswcn.cn/20820.html

(1)改进方案八文章源自略懂百科-http://wswcn.cn/20820.html

方案:调整特定词汇(名词,范围如历史人物、特定名词)的页面展示逻辑文章源自略懂百科-http://wswcn.cn/20820.html

逻辑说明:框定部分词汇范围(如莎士比亚,名人类;片儿川,风土类),调整该类词汇搜索结果的页面展示顺序逻辑,优先展示百科信息,并优先展示热门问答、热门文章等信息。文章源自略懂百科-http://wswcn.cn/20820.html

Case举例:文章源自略懂百科-http://wswcn.cn/20820.html

5. 资源分析文章源自略懂百科-http://wswcn.cn/20820.html

(1)改进方案九文章源自略懂百科-http://wswcn.cn/20820.html

方案:提高对站内微博信息的语义分析准确率,优化匹配结果文章源自略懂百科-http://wswcn.cn/20820.html

逻辑说明:通过名词转义、口语词库与转义、转有名词库、切词等手段,提高对站内微博信息的语义分析准确率,优化匹配结果。文章源自略懂百科-http://wswcn.cn/20820.html

Case举例:文章源自略懂百科-http://wswcn.cn/20820.html

五、统计需求文章源自略懂百科-http://wswcn.cn/20820.html

统计如下指标,对优化需求效果进行评估。文章源自略懂百科-http://wswcn.cn/20820.html

本文由 @misbone 原创发布于人人都是产品经理,未经许可,禁止转载文章源自略懂百科-http://wswcn.cn/20820.html

题图来自 Unsplash,基于 CC0 协议文章源自略懂百科-http://wswcn.cn/20820.html

文章源自略懂百科-http://wswcn.cn/20820.html

懵懂先生
  • 本文由 发表于 2022年8月3日 11:54:58
  • 转载请注明:http://wswcn.cn/20820.html
网文资讯

王八(乌龟、王八、甲鱼、鳖的区别?)

看过一个笑话: 一个男子去海鲜市场买菜,问老板说:老板,你这有王八卖吗? 老板说:我这不卖王八。 男子又仔细看了一下柜面,说:你这不是王八吗? 老板哈哈一笑说:这不是王八,这是甲鱼。 男子说:甲鱼就是...
网文资讯

同比怎么计算(同比、环比你真的会算吗?)

何罗鱼国际货运业务管理系统的大数据图表里会按月展示收入、支出以及利润图表供管理层决策参考,并有实时计算同比、环比增长或下降比例,同比的算法比较好理解,但环比算法还真要琢磨一下。同比 Year on Y...
网文资讯

房贷利率计算器(最新LPR利率利率下调,你的房贷利率降了吗)

▶房贷的由来 买房这一概念,可以说已经深入到了国人的心中。几乎每一位中国人都在为买房做出不断努力,而由于房子的价格越来越高,大多数人无法拿出一次性的买房资金,通常会选择贷款买房的方式来得到自己心仪的房...
网文资讯

孕妇感冒了怎么办(孕期感冒不要慌!)

近期,美国流感新闻充斥在各大新闻平台,依老美的公众卫生防疫能力,本次流感居然达到了广泛传播级别,是近13年来的首次! 而流感可不分国界,菌菌的朋友圈里被各个医院里人山人海的场面刷屏,流感袭来,医院的门...