讓機器會說更生動的句子，阿里巴巴論文入選計算機視覺頂級會議

DinK發表於2017-07-28

7月28日，阿里巴巴的“NASA大腦”iDST（Institute of Data Science Technology）表示，《Hierarchical Multimodal LSTM for Dense Visual-Semantic Embedding》入選2017年國際計算機視覺大會ICCV，即計算機視覺領域的頂級會議之一。

這也是阿里巴巴本月內第三次公佈論文入選國際頂級學術會議的好訊息。

據瞭解，這篇論文涉及的是計算機視覺（Vision）和自然語言處理（Language）兩個獨立領域結合的學術研究，提出了對影像（或影像顯著區域）更為細緻精確的描述，顯示出阿里巴巴在Vision&Language研究方向的持續挖掘。

該論文透過創新的多模態、層次化的遞迴神經網路（Hierarchical Multimodal LSTM）方法，可以將整個句子、句子中的短語、整幅影像及影像中的顯著區域同時嵌入語義空間，並且自動學習出“句子-影像”及“短語-影像區域”間的對應關係，生成包含更多形容詞的稠密語義空間，對影像或影像區域進行更詳細和生動的描述。

也就是說，計算機以後不僅能說“一隻鳥站在樹枝上”，還能說出“一隻羽翼未豐的小鳥站在春天抽芽的樹枝上”、“一隻張嘴乞食的小鳥”、“一隻小鳥站在抽芽的樹枝上，撲騰翅膀學習飛翔”這樣更為生動複雜的句子。

論文作者介紹，這一研究將被用於“看圖說話（Image Captioning）”任務及其他頗有意義的應用場景。如應用於自動導盲系統，將拍攝的影像轉換成文字和語音，以便提示盲人避障。

此外，還能用於“跨模態檢索（Cross-media Retrieval）”任務，當使用者在電商搜尋引擎中輸入一段描述性文字如“夏季寬鬆波西米亞大擺沙灘裙”，系統就能為使用者提供最相關的商品。

ICCV全稱為IEEE International Conference on Computer Vision，與CVPR（計算機視覺模式識別會議）和ECCV（歐洲計算機視覺會議）並稱計算機視覺方向的三大頂級會議。

在本月早些時候，阿里巴巴先後釋出三篇論文入選國際多媒體會議ACM MM，四篇論文入選國際計算機視覺與模式識別會議CVPR的訊息。

今年3月，阿里巴巴宣佈啟動NASA計劃，要為未來20年研發核心科技。在這一計劃的號召下，阿里正在人工智慧領域全面發力，在機器學習、視覺識別等領域不斷追趕世界頂尖的學術水平。

全球計算機視覺頂會CVPR 2019論文出爐:騰訊優圖25篇論文入選
2019-03-08
計算機視覺
計算機視覺頂會引用格式
2024-05-24
計算機視覺
阿里雲DNS形式化驗證論文入選國際計算機系統頂級會議SOSP’23
2023-10-30
阿里DNS計算機
論文資源： CVPR、ICCV、ECCV、IJCAI等計算機視覺、影像處理頂會頂刊歷年論文連結
2020-10-24
AI計算機視覺
大模型時代的計算機視覺！CVPR 2024線上論文分享會啟動
2024-05-08
大模型計算機視覺
【計算機視覺前沿研究熱點頂會】ECCV 2024中目標檢測有關的論文
2024-09-04
計算機視覺
計算機視覺論文集
2020-04-06
計算機視覺
解讀 | 2019年10篇計算機視覺精選論文（上）
2019-12-19
計算機視覺
2024年3月的計算機視覺論文推薦
2024-03-18
計算機視覺
2024年4月計算機視覺論文推薦
2024-04-27
計算機視覺
2020年十大計算機視覺論文 - kdnuggets
2021-01-10
計算機視覺
人工智慧頂級會議論文彙總（全文下載 | 報告視訊）
2018-07-12
人工智慧
必看，10篇定義計算機視覺未來的論文
2019-08-17
計算機視覺
論文榮登計算機體系結構頂會ISCA，晶片架構成為邊緣AI最佳平行計算選擇
2024-08-13
計算機晶片架構AI
計算機視覺、機器學習相關領域論文和原始碼大集合
2020-04-06
計算機視覺機器學習原始碼
騰訊AI八篇論文入選頂級醫學影像會議MICCAI ，涉及病理癌症影像分類等
2019-10-16
AI
機器學習工作坊 - 計算機視覺
2022-04-13
機器學習計算機視覺
引領深度學習潮流，刷屏計算機視覺頂會，揭祕商湯研究夢之隊
2019-10-30
深度學習計算機視覺
在機器人頂會 RSS 2024 上，中國的人形機器人研究斬獲最佳論文獎
2024-07-22
機器人
京東智聯雲4篇論文入選國際語音頂級大會Interspeech 2020
2020-10-29
17篇論文入選視覺領域權威頂會CVPR 百度大腦AI實力享譽國際
2019-04-30
視覺AI
計算機經典論文
2018-06-21
計算機
計算機視覺領域如何從別人的論文裡獲取自己的idea？
2020-04-06
計算機視覺Idea
計算機視覺入門系列（一）綜述
2020-12-16
計算機視覺
計算機影象與視覺入門必備
2018-11-10
計算機視覺
iOS計算機視覺—ARKit
2019-03-04
iOS計算機視覺
2024年6月計算機視覺論文推薦：擴散模型、視覺語言模型、影片生成等
2024-06-23
計算機視覺模型
0基礎讀頂會論文—Kappa：一種用於無伺服器計算的程式設計框架
2024-11-05
APP伺服器程式設計框架
自動下載MarkDown格式會議論文的程式
2021-11-13
計算機視覺中的注意力機制
2019-02-15
計算機視覺
京東科技集團21篇論文高票入選國際頂會AAAI 2021
2021-02-09
AI
OpenVINO計算機視覺模型加速
2022-12-07
計算機視覺模型
計算機視覺環境配置
2020-11-06
計算機視覺
計算機視覺—影象特效（3）
2018-05-22
計算機視覺特效
計算機視覺中的深度學習
2021-09-09
計算機視覺深度學習
【計算機視覺】視訊格式介紹
2020-10-07
計算機視覺
資料庫行業頂級會議
2020-11-10
資料庫行業
2022年全球頂級安全會議指南
2022-02-28
三篇論文入選國際頂會SIGMOD，厲害了騰訊雲資料庫
2022-06-14
資料庫

讓機器會說更生動的句子，阿里巴巴論文入選計算機視覺頂級會議

相關文章