JC3509人工智慧機器學習

j22h7x發表於2024-03-31
人工智慧2023-2024年人工智慧理學學士請仔細閱讀以下所有資訊**評估I簡報檔案——單獨評估(無團隊合作)課程:JC3509–機器學習注意:這部分評估說明
課程總分的30%。學習成果成功完成此部分後,學生將具備以下區域:
•能夠識別、準備和管理適當的資料集進行分析。
•能夠適當地呈現資料分析的結果。
•能夠分析資料分析的結果,並評估分析的效能上下文中的技術。
•分析技術的知識和理解,以及適當應用的能力他們在上下文中,對如何做到這一點做出正確的判斷。剽竊和行為資訊:您提交的報告可能會被提交剽竊檢查(例如Turnitin)。有關更多資訊,請參閱MyAberdeen上的幻燈片在你開始進行評估之前,提供有關避免抄襲的資訊。還請閱讀大學提供的以下資訊此外,請您熟悉以下檔案“學生行為準則”學科(學術)”:https://tinyurl.com/y92xgkq6
報告指南和要求
您的報告必須符合以下結構,幷包括每個報告中概述的所需內容部分每個子任務都分配了自己的標記。您必須提供一份書面報告,以及相應的程式碼,包含所有不同的部分/子任務,提供完整的關鍵和反思對所進行過程的說明。
概述
此任務要求您完成完整的機器學習流程,代 寫 JC3509人工智慧機器學習包括資料處理以及對所開發方法的處理、模型構建和訓練以及評估。你是其任務是建立一個神經網路,將資料分類為3類。第2頁,共3頁*請仔細閱讀以下所有資訊**滿足本評估要求所需的資料集可在MyAberdeen中找到。
資料
該資料包含3家不同製造商生產的食品的化學特性。本實驗的目的是探索所列化學措施之間的關係以下是食品的製造商。該資料有177條記錄,其中第一列
“生產商”表示生產分析樣品的製造商。資料集的特徵如下所示:
•生產商——產品製造商(TARGET)。
•氨基酸–氨基酸的總含量百分比。
•蘋果酸–蘋果酸的百分比含量。
•灰分——產品中存在的灰分。
•Alc–存在的灰燼的鹼度。
•Mg——鎂的計量單位。
•酚類——酚類的總量。
•黃酮類化合物——產品中黃酮類酚的含量。
•非類黃酮酚類——產品中非類黃酮類酚類的含量。
•原花青素-原花青素測量。
•Colo_int–顏色強度。
•色調–顏色的色調。
•OD–產品的蛋白質含量。
•脯氨酸–脯氨酸氨基酸的測量。
目標:
使用這些資料的主要目的如下:
1.分類:透過分析確定產品的原產地(製造商)測量。
2.分析:推斷哪些分析因素可能會影響的分類產品。為了實現這些目標,我們希望使用機器學習。
屈服
請提供以下資訊:
1.一份書面報告,解釋每項任務所採取的步驟以及每項任務背後的決定選擇你應該使用機器學習原理來解釋你的結果圖形和/或表格。
2.一個程式碼提交,包括一個帶註釋的python檔案,其中包含所需的所有程式碼
複製書面報告中的調查結果。第3頁,共3頁*請仔細閱讀以下所有資訊**任務1——資料準備(10分)
子任務:
1.匯入資料集:請提供所提供資料的簡短描述並匯入資料進入您的程式設計環境;提供用於這些目的的程式碼片段。
2.預處理資料:如果您對資料進行了任何預處理,例如歸一化,請解釋它以及您進行預處理的原因;如果你沒有做任何預處理,也請解釋一下。
任務2——模型構建(50分)
您的任務是從頭開始構建簡單的完全連線的人工神經網路,以對記錄分為3類(1、2或3)。您不允許使用任何機器學習或統計庫,您應該
從頭開始構建神經網路,即僅使用核心Python和NumPy。
子任務:
1.損失功能:選擇並執行適當的損失功能,解釋您為什麼有選擇了與資料和問題相關的損失函式。
2.網路設計:構建一個至少有一個隱藏層的全連線神經網路。解釋您的體系結構選擇,並透過程式碼片段、測試和書面演示解釋您的程式碼按預期執行。要實現這一點,您需要施二者都
a.向前傳球。
b.後向傳球。
3.梯度下降:透過小批次隨機梯度下降更新權重。透過程式碼片段、測試和書面解釋證明重量更新。如果您願意,您可以使用高階最佳化技巧,即動量。
注意:如果您無法完成上述任務,您可以使用其他庫(即PyTorch),但這將導致扣20分。
任務3——模特培訓(15分)
從上一個任務中獲取模型,並根據在任務1中預先處理的資料對其進行訓練。確保您在一個子資料集上訓練您的模型,並拿出一個子集進行驗證。
子任務:
1.模型訓練:對訓練集進行訓練和引數選擇。
2.模組正則化:實現正則化方法,簡單解釋(最多200字)
如何在程式碼上下文中工作,請使用程式碼片段來提供幫助。
3.模型推理:透過對儲存的驗證資料進行推理來驗證模型。第4頁,共3頁**請仔細閱讀以下所有資訊**
任務4——評估(25分)評估經過訓練的分類器的效能,並採用機器學習原理用圖表和/或表格解釋你的結果。此外,對經過培訓的人員進行一些分析
模型,以更好地瞭解哪些分析因素可能會影響的分類產品。
子任務:
1.呈現結果:透過問題的適當度量來呈現分類器的結果陳述
2.繪圖:繪製用於培訓和驗證的損失曲線,回答以下問題:
a.你的損失曲線告訴你什麼?
b.您是否觀察到任何過盈或過盈?
c.增加正規化有幫助嗎?
3.解釋結果:根據問題解釋前幾個子任務的結果語句/設定。標記標準
•知識的深度和廣度。
•形式化、實現和虛擬碼的技術細節。
•溝通技巧(清晰、技術性內容和合理的推理)
•檔案結構。提交說明您應該向Codio提交報告的PDF版本和隨附程式碼
環境關於此評估的截止日期,請在MyAberdeen上檢視。的名稱
PDF檔案應具有“JC3509_評估1 _<您的姓氏>_<您第一個
name>_<您的學生證>”。例如,“JC3509_Assession1_Smith_John_4568985.pdf”,
其中4568985是您的學生ID。
與本評估的任何方面有關的任何問題,請在課程中解決

相關文章