用不了多久就要實裝了?
從 AI 創業公司,科技巨頭到手機廠商,都紛紛亮出了自己的新產品。
先是微軟釋出了商業智慧體,隨後 Anthropic 推出了升級版大模型 Claude 3.5 Sonnet。它能夠根據使用者指令移動游標,輸入資訊,像人一樣使用計算機。
就在同一天,榮耀正式推出了 MagicOS 9,透過 AI 智慧體開啟了「自動駕駛」手機的新模式。只需要跟語音助手說我要點杯美式,AI 就會自動點開美團,選擇瑞幸的門店下單,你只需要最後點選付款就可以了。
其實最近,華為的一些研究也正在探索這一領域。
論文標題:Lightweight Neural App Control 論文地址:https://arxiv.org/pdf/2410.17883
AcT 是負責預測動作型別的模型(之後還會點選目標),其是基於一種經典 Transformer 架構構建的。但不同於標準 Transformer(其 token 是文字或字元),AcT 的 token 是對映到 Transformer 的隱藏維度的預訓練的嵌入。如圖 1 所示。