模型文章列表
- 權重、程式碼、資料集全開源,效能超越Mistral-7B,蘋果小模型來了蘋果模型
- KDD 2024|港大黃超團隊深度解析大模型在圖機器學習領域的「未知邊界」大模型機器學習
- 模型訓練時間預測,計算量估計 Scaling Laws for Neural Language Models模型
- 通俗易懂理解 模型微調finetune模型
- ffmpeg記憶體模型記憶體模型
- LLM-01 大模型 本地部署執行 ChatGLM2-6B-INT4(6GB) 簡單上手 環境配置 單機單卡多卡 2070Super8GBx2 打怪升級!大模型
- C#使用OllamaSharp呼叫Llama 3、Phi 3等大語言模型C#模型
- NeurIPS 2024 Workshop 科學基礎模型: 進展, 機遇, 挑戰模型
- Llama系模型總結模型
- onnx模型視覺化以及pytorch運算元與onnx節點對應關係模型視覺化PyTorch
- 小模型捲起來了:Mistral聯合英偉達開源12B小模型,128k上下文模型
- Spring AI(使用Ollama大模型進行AI驗證)SpringAI大模型
- Pytorch模型檔案`*.pt`與`*.pth` 的儲存與載入PyTorch模型
- 阿里釋出革新的音訊多模態模型 Qwen2-Audio;月之暗面回應大模型顯示「9.11 大於 9.9」丨 RTE 開發者日報阿里音訊大模型開發者日報
- 多程序模型模型
- 賈佳亞團隊聯手劍橋清華等共推評測新正規化 一秒偵破大模型“高分低能”大模型
- OpenAI超級對齊團隊遺作:兩個大模型博弈一番,輸出更好懂了OpenAI大模型
- 9.11和9.9誰大?我們實測15個大模型,超半數翻車大模型
- ACL 2024 | 對25個開閉源模型數學評測,GPT-3.5-Turbo才勉強及格模型GPT
- 谷歌的時間序列預測的基礎模型TimesFM詳解和對比測試谷歌模型
- modelscope上的模型如何下載?模型
- 大模型中的token是指什麼?大模型
- SciTech-EECS-電設計- PCB設計-電路設計與模擬系統 + SPICE 模擬描述與模型模型
- Mistral AI兩連發:7B數學推理專用、Mamba2架構程式碼大模型AI架構大模型
- 大語言模型無法理解連結串列 Large Language Models Fails to Understand Chained Table[up to 202407017]模型AI
- 全面對比:天工大模型 vs 紫東太初大模型大模型
- 為視覺語言多模態模型進行偏好最佳化視覺模型
- 大模型的量化大模型
- 公理訓練讓LLM學會因果推理:6700萬引數模型比肩萬億引數級GPT-4模型GPT
- 拋棄視覺編碼器,這個「原生版」多模態大模型也能媲美主流方法視覺大模型