陌路茶色

陌路茶色

海阔凭鱼跃,天高任鸟飞

知乎上有同类的解读 见:https://zhuanlan.zhihu.com/p/556283928
原论文:https://storage.googleapis.com/pub-tools-public-publication-data/pdf/28195006135023ef2c41f65ac16b60fa6ac99cb8.pdf

abstract

切入点是说,当前的单一向量表示没法很好的体现query和doc在某些方面的相关性,比如电商场景中的query是"白色耐克袜子",Dense Retrieval可能召回"白色阿迪袜子",即没有捕捉到品牌意图。由此,增加了一个aspect预测的任务,让模型用不同的 aspect embedding来体现不同的 aspect信息,并设计了一个轻量级的融合网络来融合这些aspect embedding,在一个电商数据集上高于比较好的Dense Retrieval模型,同时也发现aspect embedding可以加强dense Retrieval的可解释性

More...


Paper readding
Interested in:
(1)Query understanding、Retrieval、Relevance、Rank、Multi-modal
(2)Large Language Model
Keywords:Information Retrieval、Lexicon-aware retrieval、Dense retrieval、dual-encoder、sparse representations for queries and documents

More...



虽然可以在知乎,csdn等上面写自己的blog,或者用github搭建,但是感觉都不太方便,一方面大众的平台写东西确实能够带来不小的流量,但是有时候也不希望占用公共流量或者想写一些自己的个人随笔啥的,另一方面github搭建的blog访问慢也很麻烦,于是决定自己购买服务器/IP搭建blog,这样也是督促自己要持续不断地学习,同时也能记录所学的知识,让自己表达更加清晰

More...