理學院大數據研究團隊在人工智能與大數據處理領域發表系列高水平研究成果
我校理學院大數據研究團隊在人工智能與大數據處理技術研究方面取得系列進展,研究成果分別發表在IEEE Transactions on Neural Networks and Learning Systems、IEEE Transactions on Cybernetics和Information Sciences三大人工智能頂級期刊。神經網絡是人工智能領域中目前最為火熱的研究方向——深度學習的架構基礎。雖然深度學習在近幾年發展迅速,但是關于如何設計最優神經網絡架構的問題仍處于探索階段。該團隊分別針對人工智能中神經網絡結構復雜、高維大規模數據存在無效和冗余特征、難以獲取長時序信息等問題與缺陷,設計出了一系列網絡結構優化、大數據特征選擇和時序循環神經網絡模型,有效改善了上述不足,提高了人工智能模型的學習性能。 題目為《帶Group Lasso懲罰與控制冗余的神經網絡特征選擇》(Feature Selection using a Neural Network With Group Lasso Regularization and Controlled Redundancy)的研究論文發表在人工智能領域權威國際期刊IEEE Transactions on Neural Networks and Learning Systems。王健副教授和博士生張華清為該論文共同第一作者, 我校榮譽教授Nikhil R. Pal院士(印度統計研究所)參與指導,中國石油大學(華東)為第一署名單位。該項工作得到國家自然科學基金、國家科技重大專項、山東自然科學基金、中央高校基本科研業務費、中國石油天然氣集團公司重大科技項目以及山東省高校青年創新科技支撐計劃的資助。 特征選擇技術也稱屬性選擇,是指從原始特征或屬性中選擇出最有效的特征或屬性以降低數據維度的過程,它是人工智能數據預處理環節的重要步驟,也是大數據處理技術的重要環節。該項工作在神經網絡中嵌入Group Lasso懲罰項并實現特征冗余控制,在選出對解決問題最有幫助、蘊含信息量最大的特征或屬性的同時,控制所選特征子集的冗余程度,以達到降維的最優效果,從而使模型的泛化能力更強,降低神經網絡模型產生過擬合的風險。 題目為《基于L1正則化的神經網絡結構優化模型設計與分析》(Learning Optimized Structure of Neural Networks by Hidden Node Pruning With L1Regularization)的研究論文發表在國際人工智能領域權威期刊IEEE Transactions on Cybernetics。碩士生謝雪濤和博士生張華清為論文共同第一作者,王健副教授為通訊作者,我校榮譽教授Nikhil R. Pal院士(印度統計研究所)參與指導,中國石油大學(華東)為第一署名單位。該項研究成果得到了國家自然科學基金、山東省自然科學基金和中央高校基本科研業務費的資助。 該項工作借助L1正則子具有的稀疏表達能力,提出兩種神經網絡結構優化學習模型;本項工作另外一個突出貢獻就是提出了一種簡單且具有通用性的收斂性證明方法,同時保證了模型設計的合理性。實驗結果表明所提出模型具有強大的魯棒性、廣泛的適用性、理想的剪枝能力和良好的泛化能力,適用處理高維大數據。該研究成果在人工智能與深度學習構造最簡網絡結構方面具有很強的指導作用和應用推廣價值。
中國石油大學(華東)
2021-02-01