1月23日, 國(guó)際學(xué)術(shù)會(huì)議WWW 2024論文接收結(jié)果公布。高瓴人工智能學(xué)院師生有16篇論文被錄用。WWW 2024(The Web Conference)是中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF) 推薦的A類國(guó)際學(xué)術(shù)會(huì)議。本年度會(huì)議將于2024年5月在新加坡舉行。
論文介紹
論文題目:Generating Multi-turn Clarification for Web Information Seeking
作者:趙梓良,竇志成
通訊作者:竇志成
論文概述:提出多輪澄清問(wèn)題已應(yīng)用于各種對(duì)話式搜索系統(tǒng)中,以幫助向用戶推薦人物、商品和圖像。然而,它的重要性在Web搜索中仍然沒(méi)有被強(qiáng)調(diào)。在本文中,我們首次嘗試將多輪澄清生成擴(kuò)展到Web搜索,以澄清用戶模糊或多方面的意圖。與其他對(duì)話式搜索場(chǎng)景相比,Web搜索查詢更加復(fù)雜,因此應(yīng)該生成澄清面板而不是現(xiàn)有研究中普遍應(yīng)用的選擇選擇澄清面板。為此,我們首先定義了多輪Web搜索澄清的整個(gè)過(guò)程,包括澄清候選生成、最佳澄清選擇和文檔檢索。由于缺乏多輪開(kāi)放域澄清數(shù)據(jù),我們首先設(shè)計(jì)一種簡(jiǎn)單而有效的基于規(guī)則的方法來(lái)適應(yīng)上述三個(gè)組成部分。之后,我們利用大語(yǔ)言模型(LLM)的上下文學(xué)習(xí)和零樣本教學(xué)能力,通過(guò)提示LLM進(jìn)行少量的演示和聲明來(lái)實(shí)現(xiàn)澄清生成和選擇,進(jìn)一步提高澄清效果。為了評(píng)估我們提出的方法,我們首先應(yīng)用Qulac數(shù)據(jù)集來(lái)衡量我們的方法是否可以提高檢索文檔的能力。我們使用MIMICS數(shù)據(jù)集進(jìn)一步評(píng)估生成的方面項(xiàng)的質(zhì)量。實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有的單輪Web搜索澄清方法相比,我們提出的框架更適合開(kāi)放域Web搜索系統(tǒng)中提出多輪澄清問(wèn)題以澄清用戶模糊或多方面的意圖。
論文題目:Metacognitive Retrieval-Augmented Large Language Models
作者:周雨佳,劉政,金佳杰,聶建云,竇志成
通訊作者:劉政,竇志成
論文概述:在自然語(yǔ)言處理領(lǐng)域,檢索增強(qiáng)型語(yǔ)言模型是解決幻覺(jué)問(wèn)題的的關(guān)鍵技術(shù)。傳統(tǒng)方法主要基于單次檢索,最新的研究趨勢(shì)已經(jīng)轉(zhuǎn)向利用多次檢索來(lái)處理復(fù)雜的多跳推理任務(wù)。然而,即便這些方法取得了一定進(jìn)步,現(xiàn)有的策略仍受限于預(yù)設(shè)的推理步驟,這可能會(huì)導(dǎo)致在生成回應(yīng)時(shí)出現(xiàn)不準(zhǔn)確。本文介紹了一種創(chuàng)新方法——元認(rèn)知檢索增強(qiáng)生成框架(MetaRAG)。該框架將檢索增強(qiáng)生成過(guò)程與認(rèn)知心理學(xué)中人類元認(rèn)知過(guò)程相結(jié)合。元認(rèn)知使得人們能夠自我反思,并且批判性地評(píng)估自身的認(rèn)知過(guò)程。通過(guò)融入這一理念,MetaRAG賦予了模型監(jiān)控、評(píng)估及規(guī)劃響應(yīng)策略的能力,從而加強(qiáng)了其內(nèi)省推理能力。通過(guò)一個(gè)包含三個(gè)步驟的元認(rèn)知調(diào)節(jié)流程,模型不僅能評(píng)估其答案的適當(dāng)性,還能識(shí)別潛在不足的原因,并制定出改進(jìn)方案。在多跳問(wèn)答數(shù)據(jù)集上的實(shí)證評(píng)估表明,MetaRAG在性能上顯著超越了現(xiàn)有方法。
論文題目:Cognitive Personalized Search Integrating Large Language Models with an Efficient Memory Mechanism
作者:周雨佳,朱倩男,金佳杰,竇志成
通訊作者:竇志成
論文概述:傳統(tǒng)的搜索引擎通常向所有用戶展示相同的搜索結(jié)果,這種做法忽視了個(gè)人的搜索偏好。為了解決這一問(wèn)題,研究者們開(kāi)發(fā)出了個(gè)性化搜索技術(shù),該技術(shù)能夠根據(jù)用戶的查詢?nèi)罩痉治龀鰝€(gè)人偏好,并據(jù)此調(diào)整搜索結(jié)果的排序。雖然基于深度學(xué)習(xí)的個(gè)性化搜索方法展現(xiàn)出巨大潛力,但它們高度依賴大量的訓(xùn)練數(shù)據(jù),因此面臨數(shù)據(jù)稀缺的挑戰(zhàn)。本文提出了一種新型的認(rèn)知個(gè)性化搜索(CoPS)模型,該模型將強(qiáng)大的大型語(yǔ)言模型與人類認(rèn)知的認(rèn)知記憶機(jī)制相結(jié)合。CoPS利用大型語(yǔ)言模型來(lái)構(gòu)建用戶畫(huà)像,從而提升了用戶的搜索體驗(yàn)。這一認(rèn)知記憶機(jī)制包括:用于迅速感知反應(yīng)的感知記憶,用于處理復(fù)雜認(rèn)知任務(wù)的工作記憶,以及用于儲(chǔ)存海量歷史互動(dòng)數(shù)據(jù)的長(zhǎng)期記憶。CoPS通過(guò)三個(gè)步驟高效處理新的查詢請(qǐng)求:首先識(shí)別用戶的重復(fù)查找行為,然后構(gòu)建包含相關(guān)歷史信息的用戶畫(huà)像,最后根據(jù)個(gè)性化的查詢意圖對(duì)搜索結(jié)果進(jìn)行排序。實(shí)驗(yàn)結(jié)果顯示,CoPS模型在零樣本測(cè)試場(chǎng)景中表現(xiàn)優(yōu)于基線模型。
論文題目:Mining Exploratory Queries for Conversational Search
作者:劉文涵,趙梓良,朱余韜,竇志成
通訊作者:竇志成
論文概述:在對(duì)話式搜索中,查詢澄清技術(shù)通過(guò)向用戶提問(wèn)一個(gè)澄清式問(wèn)題并提供可選擇的澄清候選項(xiàng)來(lái)更好地澄清用戶的查詢子意圖。然而,用戶除了這種澄清需求,還可能有一些探索性需求。例如一個(gè)搜索“卡地亞女士手表”的用戶可能還想通過(guò)搜索“勞力士女士手表”或者“卡地亞女士項(xiàng)鏈”來(lái)探索一些跟當(dāng)前查詢平行的探索式查詢。這種探索性的信息需求在用戶搜索行為中很常見(jiàn),但卻難以被查詢澄清技術(shù)滿足。本文聚焦于挖掘并向用戶推薦這種探索式的查詢來(lái)更好地滿足用戶在對(duì)話式搜索中的探索性信息需求。為此,我們首先設(shè)計(jì)了一個(gè)基于規(guī)則的模型來(lái)根據(jù)查詢搜索結(jié)果中的結(jié)構(gòu)化信息生成探索式查詢。其次,我們提出使用弱監(jiān)督數(shù)據(jù)并結(jié)合多任務(wù)學(xué)習(xí)訓(xùn)練生成模型,從而對(duì)基于規(guī)則的模型進(jìn)行泛化。最后,我們利用大模型的情境學(xué)習(xí)能力并結(jié)合提示工程技術(shù)來(lái)生成探索式查詢。我們基于人工標(biāo)注構(gòu)建了我們這個(gè)任務(wù)的評(píng)測(cè)集并進(jìn)行了一系列的實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明了我們提出的模型的有效性,同時(shí)也證明了使用搜索結(jié)果中的結(jié)構(gòu)化信息生成探索式查詢的可行性。
論文題目: Spectral Heterogeneous Graph Convolutions via Positive Noncommutative Polynomials
作者:何明國(guó),魏哲巍,Shikun Feng, Zhengjie Huang, Weibin Li, Yu Sun, Dianhai Yu
通訊作者:魏哲巍
論文概述:異構(gòu)圖神經(jīng)網(wǎng)絡(luò)(HGNNs)在各種異構(gòu)圖學(xué)習(xí)任務(wù)中獲得了顯著的成功。然而,大多數(shù)現(xiàn)有的HGNNs依賴于空域的方法來(lái)聚合信息,往往手動(dòng)選擇元路徑或使用一些啟發(fā)式模塊,缺乏理論保證。此外,這些方法無(wú)法在頻譜域內(nèi)學(xué)習(xí)任意有效的異構(gòu)圖過(guò)濾器,這限制了它們的表達(dá)能力。為了解決這些問(wèn)題,我們提出了一種通過(guò)正的非交換多項(xiàng)式實(shí)現(xiàn)的頻譜異構(gòu)圖卷積?;谠搱D卷積,我們提出了PSHGCN,一種新穎的異構(gòu)圖卷積網(wǎng)絡(luò)。PSHGCN提供了一種簡(jiǎn)單而有效的方法來(lái)學(xué)習(xí)有效的異構(gòu)圖濾波器。此外,我們?cè)趫D優(yōu)化框架中表明了PSHGCN的合理性。我們進(jìn)行了廣泛的實(shí)驗(yàn)研究,證明了 PSHGCN可以學(xué)習(xí)多樣的異構(gòu)圖濾波器,并在真實(shí)數(shù)據(jù)上超越了現(xiàn)有方法。
論文題目:Exploring Neural Scaling Law and Data Pruning Methods For Node Classification on Large-scale Graphs
作者:Zhen Wang,Yaliang Li,Bolin Ding,魏哲巍
通訊作者:魏哲巍
論文概述:這篇論文揭示了在直推式節(jié)點(diǎn)分類設(shè)置下,圖神經(jīng)網(wǎng)絡(luò)(GNNs)存在冪律縮放,其中指數(shù)大小意味著不令人滿意的樣本效率。受到現(xiàn)有研究中報(bào)告的具有相似聚合特征的節(jié)點(diǎn)性能相關(guān)性的啟發(fā),本文提出利用直推式設(shè)置來(lái)修剪具有與測(cè)試節(jié)點(diǎn)不同的聚合特征的節(jié)點(diǎn)。大型圖上的實(shí)證結(jié)果證實(shí)了這種修剪策略的有效性,并且本文放寬了先前理論分析中的一個(gè)假設(shè)。
論文題目:FairSync: Ensuring Amortized Group Exposure in Distributed Recommendation Retrieval
作者:徐晨,徐君,丁一鳴,張驍,祁琦
通訊作者:徐君
論文概述:為了追求公平和平衡的發(fā)展,推薦系統(tǒng)(RS)通常優(yōu)先考慮群體公平,確保特定群體在一定時(shí)期內(nèi)保持最低曝光水平。例如,RS平臺(tái)通常需要確保新提供者或特定類別的物品根據(jù)它們的需求獲得足夠的曝光?,F(xiàn)代工業(yè)RS通常采用兩階段流程:第一階段(retrieval階段)從分布在各種服務(wù)器上的數(shù)百萬(wàn)個(gè)物品中檢索候選項(xiàng),第二階段(rank階段)專注于從第一階段選擇的物品中呈現(xiàn)小而準(zhǔn)確的選擇?,F(xiàn)有的確保分?jǐn)側(cè)后w曝光的工作通常集中在第二階段,然而,第一階段對(duì)于任務(wù)也是至關(guān)重要的。沒(méi)有高質(zhì)量的候選項(xiàng)集,第二階段的ranker無(wú)法確保群體的所需曝光。為確保分布檢索過(guò)程中的群體曝光,我們引入了一個(gè)名為FairSync的模型,將問(wèn)題轉(zhuǎn)化為受約束的分布式優(yōu)化問(wèn)題。具體來(lái)說(shuō),F(xiàn)airSync通過(guò)將問(wèn)題移至對(duì)偶空間來(lái)解決問(wèn)題,在這個(gè)空間中,中央節(jié)點(diǎn)將歷史公平數(shù)據(jù)聚合成一個(gè)向量并將其分發(fā)到所有服務(wù)器。為了在效率和準(zhǔn)確性之間權(quán)衡,我們使用梯度下降技術(shù)周期性更新對(duì)偶向量的參數(shù)。我們的實(shí)證實(shí)驗(yàn)證明,我們的方法在滿足公平要求的同時(shí),在各種條件下甚至在極端情況下都能實(shí)現(xiàn)更好的檢索準(zhǔn)確性。
論文題目:AgentCF: Collaborative Learning with Autonomous Language Agents for Recommender Systems
作者:張君杰,侯宇蓬,謝若冰,孫文奇,Julian McAuley,趙鑫,林樂(lè)宇,文繼榮
通訊作者:趙鑫
論文概述:大語(yǔ)言模型強(qiáng)大的決策能力展現(xiàn)了作為人類代理的潛力。然而現(xiàn)有工作關(guān)注于模擬人類對(duì)話,而人類非語(yǔ)言行為的模擬,例如推薦系統(tǒng)中的物品點(diǎn)擊,盡管可以隱式的展現(xiàn)用戶偏好以及增強(qiáng)用戶建模,尚沒(méi)有被深入探索。我們認(rèn)為主要原因在于語(yǔ)言建模和行為建模的差異以及大語(yǔ)言模型對(duì)用戶-物品關(guān)系缺乏理解。為了解決這個(gè)問(wèn)題,我們提出了AgentCF,通過(guò)基于智能體的協(xié)同過(guò)濾來(lái)模擬推薦系統(tǒng)中的用戶-物品交互行為。我們將用戶和物品都模擬為智能體,并利用協(xié)同學(xué)習(xí)的方式同時(shí)對(duì)二者進(jìn)行優(yōu)化。具體來(lái)說(shuō),在每個(gè)時(shí)間步,我們首先提示用戶和物品智能體進(jìn)行自主交互。然后,基于智能體交互決策和真實(shí)世界交互記錄的差異,我們提示智能體協(xié)同地反思和調(diào)節(jié)錯(cuò)誤的模擬偏好信息,從而學(xué)習(xí)和建模用戶和物品之間的關(guān)系。在后續(xù)交互過(guò)程中,這些智能體進(jìn)一步將習(xí)得的偏好傳播給其余的智能體,隱式的建模了協(xié)同過(guò)濾?;谶@個(gè)框架,我們模擬了多樣化的用戶-物品交互形式,結(jié)果表明這些智能體可以展示類人的行為。
論文題目:Understanding Human Preferences: Towards More Personalized Video to Text Generation
作者:吳宜函,宋睿華,陳旭,蔣昊, 曹朝,Jin Yu
通訊作者:宋睿華,陳旭
論文概述:視頻到文本生成模型已經(jīng)取得了顯著的成功,但它們大多關(guān)注在如何理解視頻內(nèi)容,忽略了如何捕捉人類個(gè)性化的偏好。對(duì)于構(gòu)建一個(gè)的有吸引力的多模態(tài)聊天機(jī)器人,這是非常需要的。在本工作中,我們定義了個(gè)性化視頻評(píng)論生成的任務(wù),并設(shè)計(jì)了一個(gè)端到端的個(gè)性化框架來(lái)解決該任務(wù)。具體而言,我們認(rèn)為視頻評(píng)論生成的個(gè)性化可以體現(xiàn)在兩個(gè)方面,(1)對(duì)于同一段視頻,不同的用戶可能會(huì)對(duì)不同的片段進(jìn)行評(píng)論;(2)對(duì)于同一段視頻,不同的人也可能會(huì)以不同的評(píng)論風(fēng)格表達(dá)不同的觀點(diǎn)。因此我們?cè)O(shè)計(jì)了兩個(gè)模塊——視頻幀選擇模塊和個(gè)性化生成模塊。視頻幀選擇模塊負(fù)責(zé)預(yù)測(cè)用戶可能在視頻中感興趣的位置,個(gè)性化文本生成模塊根據(jù)上述預(yù)測(cè)的片段和用戶的偏好生成評(píng)論。在我們的框架中,這兩個(gè)組件以端到端方式進(jìn)行優(yōu)化以相互增強(qiáng),同時(shí)我們?cè)O(shè)計(jì)了基于置信度感知的計(jì)劃采樣和迭代生成策略,以解決在推理階段缺乏真實(shí)片段的問(wèn)題。由于缺乏個(gè)性化的視頻到文本數(shù)據(jù)集,我們收集并發(fā)布了一個(gè)新的數(shù)據(jù)集來(lái)研究這個(gè)問(wèn)題,同時(shí)我們進(jìn)行了大量的實(shí)驗(yàn)來(lái)證明我們模型的有效性。
論文題目:Bridging the Space Gap: Unifying Geometry Knowledge Graph Embedding with Optimal Transport
作者:劉雨涵,曹澤麟,高星,張佶,嚴(yán)睿
通訊作者:嚴(yán)睿
論文概述:知識(shí)圖譜的表示是一個(gè)關(guān)鍵技術(shù),它的目的是將知識(shí)圖譜中的元素轉(zhuǎn)化為連續(xù)空間中的向量形式,從而為結(jié)構(gòu)化數(shù)據(jù)提供強(qiáng)大的表示能力。目前,使用雙曲空間或歐幾里得空間來(lái)表達(dá)知識(shí)圖譜已成為研究領(lǐng)域的常用方法。然而,知識(shí)圖譜通常包含多種幾何數(shù)據(jù)結(jié)構(gòu),例如鏈狀和層次狀結(jié)構(gòu),這些復(fù)雜的結(jié)構(gòu)特性往往超出了單一空間表示法的有效范圍。為此,我們創(chuàng)新性地提出了一種名為UniGE的表示方法,旨在應(yīng)對(duì)知識(shí)圖譜中不同幾何結(jié)構(gòu)的數(shù)據(jù)表示挑戰(zhàn)。UniGE是首個(gè)結(jié)合雙曲空間和歐幾里得空間表示法的方法,采用了最優(yōu)傳輸理論和Wasserstein重心的思想,引入了一種創(chuàng)新的表示對(duì)齊和融合策略。我們還提供了全面的理論分析,確立了更加穩(wěn)健的誤差邊界,從而證明了我們方法的優(yōu)勢(shì)。在三個(gè)主要的基準(zhǔn)數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)表明,UniGE在有效性方面表現(xiàn)出色,且與理論分析得出的結(jié)論相一致。
論文題目:Unify Graph Learning with Text: Unleashing LLM Potentials for Session Search
作者:吳宋浩,涂權(quán),劉洪,徐家,劉忠義,張冠男,陳秀穎,嚴(yán)睿
通訊作者:陳秀穎,嚴(yán)睿
論文概述:面對(duì)日益復(fù)雜的信息需求,用戶往往通過(guò)一系列交互式查詢和操作來(lái)實(shí)現(xiàn)最終的檢索任務(wù),這一過(guò)程被稱為會(huì)話搜索(session search)。當(dāng)前策略通??紤]優(yōu)化序列建模方法以實(shí)現(xiàn)更好的語(yǔ)義理解,但忽視了交互中的圖結(jié)構(gòu)對(duì)理解用戶意圖的幫助。一些方法專注于捕捉結(jié)構(gòu)化行為數(shù)據(jù),但它們使用泛化的文檔表示,忽略了詞級(jí)別細(xì)粒度的語(yǔ)義交互。在本文中,我們提出了基于符號(hào)圖(Symbolic Graph)的會(huì)話搜索模型,旨在利用大語(yǔ)言模型的優(yōu)勢(shì),實(shí)現(xiàn)文本語(yǔ)義和圖結(jié)構(gòu)的結(jié)合。具體來(lái)說(shuō),我們首先提出了自定義符號(hào)圖的文法,使用符號(hào)語(yǔ)法規(guī)則將圖結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)換為文本。這使得集成會(huì)話搜索歷史、交互過(guò)程和任務(wù)描述為語(yǔ)言模型的輸入成為可能。鑒于自定義的符號(hào)語(yǔ)言理解同大語(yǔ)言模型預(yù)訓(xùn)練任務(wù)的差距,為此我們引入了一系列自監(jiān)督符號(hào)學(xué)習(xí)任務(wù),包括鏈接預(yù)測(cè)、節(jié)點(diǎn)內(nèi)容生成和基于文本生成方法的圖對(duì)比學(xué)習(xí),使大語(yǔ)言模型能夠從粗粒度到細(xì)粒度捕捉拓?fù)湫畔ⅰT贏OL和Tiangong-ST兩個(gè)基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證實(shí)了我們方法的優(yōu)越性。我們的范式還提供了一種新穎有效的方法論,彌合了傳統(tǒng)搜索方法與現(xiàn)代大語(yǔ)言模型之間的差距。
論文題目:Harnessing Multi-Role Capabilities of Large Language Models for Open-Domain Question Answering
作者:孫宏達(dá),劉宇軒,吳成偉,閆海鈺,邰騁,高欣,商爍,嚴(yán)睿
通訊作者:嚴(yán)睿
論文概述:開(kāi)放域問(wèn)答(ODQA)是網(wǎng)絡(luò)挖掘領(lǐng)域的一個(gè)關(guān)鍵研究熱點(diǎn)。現(xiàn)有的 ODQA 方法遵循兩種主要范式來(lái)收集證據(jù):1)retrieve-then-read范式從外部語(yǔ)料庫(kù)中檢索相關(guān)文檔; 2) generate-then-read范式采用大型語(yǔ)言模型 (LLM) 來(lái)生成相關(guān)文檔。盡管兩種范式都有各自的優(yōu)點(diǎn),但單一范式無(wú)法兼顧多方面的證據(jù)需求。為此,我們提出了一個(gè)通用框架LLMQA,將ODQA過(guò)程制定為三個(gè)基本步驟:查詢擴(kuò)展、文檔選擇和答案生成,作為一種結(jié)合基于檢索和生成的證據(jù)優(yōu)勢(shì)的新穎范式?,F(xiàn)有研究已證實(shí)LLM展現(xiàn)其出色的角色扮演能力來(lái)完成各種類型的任務(wù)。因此,與之前利用專門(mén)的模型來(lái)完成ODQA的各個(gè)模塊不同,我們指導(dǎo)LLM在我們的統(tǒng)一框架中分別扮演生成器、重排序器和評(píng)估器的多重角色,并將它們集成起來(lái)相互協(xié)作,共同提高ODQA任務(wù)的性能。此外,我們引入了一種新的提示優(yōu)化算法來(lái)改善角色扮演提示,引導(dǎo)LLM產(chǎn)生更高質(zhì)量的證據(jù)和更準(zhǔn)確的答案。 我們?cè)谌齻€(gè)廣泛使用的benchmarks:NQ、WebQ 和 TriviaQA上進(jìn)行了實(shí)驗(yàn)。結(jié)果表明,LLMQA在答案準(zhǔn)確性和證據(jù)質(zhì)量方面都可以達(dá)到最佳性能,展示了其推進(jìn) ODQA 研究和應(yīng)用的潛力。
論文題目:A Quasi-Wasserstein Loss for Learning Graph Neural Networks
作者:程敏杰,許洪騰
通訊作者:許洪騰
論文概述:在圖神經(jīng)網(wǎng)絡(luò)(GNNs)進(jìn)行節(jié)點(diǎn)級(jí)預(yù)測(cè)任務(wù)時(shí),大多數(shù)現(xiàn)有的損失函數(shù)是獨(dú)立應(yīng)用各個(gè)節(jié)點(diǎn)的,盡管由于圖結(jié)構(gòu)的存在,節(jié)點(diǎn)嵌入和它們的標(biāo)簽并非獨(dú)立同分布。為了消除這種不一致性,我們提出了“Quasi-Wasserstein”損失(QW loss),利用圖上定義的最優(yōu)傳輸,設(shè)計(jì)了一種新的GNNs的學(xué)習(xí)和預(yù)測(cè)范式。 在訓(xùn)練階段,通過(guò)最小化節(jié)點(diǎn)標(biāo)簽與它們的預(yù)測(cè)值之間的Quasi-Wasserstein距離學(xué)習(xí)基于邊上的標(biāo)簽的最優(yōu)傳輸。利用基于Bregman散度的正則化器,我們得到兩個(gè)求解器學(xué)習(xí)GNN和標(biāo)簽傳輸。 在預(yù)測(cè)節(jié)點(diǎn)標(biāo)簽時(shí),我們的模型將GNN的輸出與由標(biāo)簽傳輸?shù)玫降臍埐盍拷Y(jié)合,得到一種新的transductive預(yù)測(cè)范式。實(shí)驗(yàn)證明,所提出的QW loss有助于改善在節(jié)點(diǎn)級(jí)分類和回歸任務(wù)中的性能。
論文題目:Causally Debiased Time-aware Recommendation
作者:王磊,馬辰,吳賢,邱昭鵬,鄭冶楓,陳旭
通訊作者:陳旭
論文概述:時(shí)間感知的推薦算法得到了人們的大量關(guān)注,被廣泛用于動(dòng)態(tài)建模用戶的喜好,但是用戶的交互受到用戶偏好的影響,在時(shí)間分布上是不均勻的,進(jìn)而會(huì)導(dǎo)致數(shù)據(jù)和推薦模型產(chǎn)生偏差,模型性能下降。因此,我們提出了一種因果去偏時(shí)間感知推薦框架,從時(shí)間和物品兩個(gè)維度同時(shí)進(jìn)行去偏。考慮到用戶行為的復(fù)雜性,我們用敏感性分析建模未測(cè)量混淆因子,進(jìn)一步提高去偏的效果。我們?cè)谌齻€(gè)現(xiàn)實(shí)世界的數(shù)據(jù)集上進(jìn)行了大量實(shí)驗(yàn),以展示我們模型的有效性。
論文題目:On Truthful Item Acquiring Mechanisms for Reward Maximization
作者:?jiǎn)瘟迹瑥埓T,王子賀,張捷
通訊作者:王子賀、張捷
論文概述:本文研究了收集者僅根據(jù)物主申報(bào)的物品質(zhì)量和獨(dú)立評(píng)估師的評(píng)分來(lái)決定是否收取物品的問(wèn)題。其中物主希望最大限度的提高收集者收取物品的概率,并且只有物主知道物品的實(shí)際質(zhì)量。評(píng)估師公正地履行職責(zé),但她的評(píng)估可能會(huì)受到隨機(jī)噪音的影響,因此可能無(wú)法準(zhǔn)確反映物品的實(shí)際質(zhì)量。該問(wèn)題的主要挑戰(zhàn)在于設(shè)計(jì)一種機(jī)制能夠使物主透露出真實(shí)準(zhǔn)確的信息,從而優(yōu)化收集者的預(yù)期回報(bào)。本文針對(duì)單一物品與多物品情況設(shè)計(jì)了一系列機(jī)制,并且還通過(guò)實(shí)驗(yàn)驗(yàn)證了這些機(jī)制的有效性與魯棒性。本文研究的內(nèi)容在會(huì)議文章錄用決策、應(yīng)用商店審核流程、二手房產(chǎn)市場(chǎng)、古董收藏品市場(chǎng)等多個(gè)方向都有能夠應(yīng)用的廣泛空間。
論文題目:List-aware Reranking-Truncation Joint Model for Search and Retrieval-augmented Generation
作者:徐士成、龐亮、徐君、沈華偉、程學(xué)旗
通訊作者:龐亮
論文概述:信息檢索(IR)的結(jié)果通常以候選文檔的排名列表的形式呈現(xiàn),例如面向人類的網(wǎng)絡(luò)搜索和面向大型語(yǔ)言模型(LLM)的檢索增強(qiáng)范式。 列表感知檢索旨在捕獲列表級(jí)上下文特征以返回更好的列表,主要包括重排序和截?cái)唷?重排序會(huì)對(duì)列表中的文檔進(jìn)行精細(xì)地重新評(píng)分。 截?cái)鄤?dòng)態(tài)確定排名列表的截止點(diǎn),以實(shí)現(xiàn)整體相關(guān)性和避免不相關(guān)文檔的錯(cuò)誤信息之間的權(quán)衡。 之前的研究將它們視為兩個(gè)獨(dú)立的任務(wù)并分離建模。 然而,分離建模并不是最佳的。 首先,兩個(gè)任務(wù)之間很難共享信息。 具體來(lái)說(shuō),重排序可以為截?cái)嗵峁┘?xì)粒度的相關(guān)性信息,而截?cái)嗫梢詾橹嘏判蛱峁┬в眯枨蟆?其次,這通常會(huì)遇到錯(cuò)誤累積問(wèn)題,其中重排序階段的微小錯(cuò)誤可能會(huì)在很大程度上影響截?cái)嚯A段的結(jié)果。 為了解決這些問(wèn)題,我們提出了一種可以同時(shí)執(zhí)行這兩個(gè)任務(wù)的重排序-截?cái)嗦?lián)合模型(GenRT)。 GenRT 利用基于編碼器-解碼器架構(gòu)的生成范式來(lái)同時(shí)執(zhí)行重排序和截?cái)鄡蓚€(gè)任務(wù)。 我們還設(shè)計(jì)了用于聯(lián)合優(yōu)化的損失函數(shù),使模型能夠平衡高效地學(xué)習(xí)這兩項(xiàng)任務(wù)。 在公開(kāi)的learning-to-rank基準(zhǔn)和開(kāi)放域問(wèn)答任務(wù)上的實(shí)驗(yàn)表明,我們的方法在面向網(wǎng)絡(luò)搜索和檢索增強(qiáng)的大語(yǔ)言模型的重排和截?cái)嗳蝿?wù)上均實(shí)現(xiàn)了最佳性能。