AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報導了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯絡報導。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
論文: https://huggingface.co/papers/2409.17115
程式碼框架: https://github.com/GAIR-NLP/ProX
預訓練實驗的全實驗細節和模型: https://huggingface.co/gair-prox
超過 100B 的高質量通用語料和 5B 的高質量數學語料: https://hf.co/collections/gair-prox/prox-dataset-66e81c9d560911b836bb3704
設計出更靈活的介面,以覆蓋多樣化的資料最佳化需求,進一步提升資料質量。 將 ProX 發展到更多專用 domain:例如程式碼領域、多語言語料上,促進領域大模型的發展。 透過進一步減小模型尺寸、和其他加速手段,減小推理代價,使清洗 TB 級別文件不再遙遠。