R語言作業：樣本容量與好樣本概率的關係

一盒南京發表於2020-11-02

原文網址 : https://blog.csdn.net/m0_46521785/article/details/109441295

R語言

題目要求

作業內容：在30000個人中抽取100000次，抽樣數量依次為20,40，…500，並最後以抽取數量為自變數，概率為因變數作圖。

考察知識點

規則向量的生成
如何在向量中新增資料
mean、sample的使用
繪圖函式plot的使用

思路

首先讀取資料，因為得到的資料是data.frame格式，我們先將其轉化為矩陣形式，然後轉化為一維向量格式，便於抽取樣本。

做一個雙重迴圈，針對每個樣本容量，都進行100000次實驗，變數sum用來統計符合條件的次數。使用sample函式，指定replace=FALSE表示取出不放回，對取出的資料計算平均值，判斷平均值是否在169～170之間，如果滿足這個條件sum就加1，最後通過sum與實驗次數（100000）的比值計算概率。使用append函式，將計算得到的概率新增在列表good_sample_p中。

使用plot繪圖函式，指定xlab和ylab標籤，再指定影像型別為點劃線，最後使用title函式新增標題

程式碼

a <- read.csv('heigh_30000.csv')
a <- as.matrix(a)
data <- as.vector(a)

good_sample_p <- c()

for (i in seq(20,500,by=20)){
  sum <- 0  # 記錄滿足條件的個數
  for (j in 1:100000){
    x <- sample(data,i,replace=FALSE)  # 抽取不放回
    y <- mean(x,trim=0,na.rm=TRUE)  # trim=0不修剪掉排在首尾的部分 ，na.rm=TRUE移除預設值
    if( 169<y && y<170){
      sum <- sum+1
    }
  }
  p <- sum/100000  # 計算概率
  good_sample_p <- append(good_sample_p,p)
}

# 新增x，y資料，設定x軸，y軸標籤，也可以在title函式中放置
plot(seq(20,500,by=20), p_list,type = 'b',xlab = 'Sample size',ylab = 'Good sample probability')
# 新增標題
title('Relationship between Sample size and Good sample probability', col.lab = 2, cex.lab = 2)

截圖

在這裡插入圖片描述

從因果關係來看小樣本學習
2020-10-09
定性檢測的樣本量估算之精確概率法
2022-03-28
招標書樣本
2024-10-10
領域本體與DDD的UL語言
2021-11-02
R資料分析：樣本量計算的底層邏輯與實操，pwr包
2022-03-03
樣本協方差矩陣的定義與計算
2020-08-13
矩陣
不平衡樣本的處理
2018-09-27
AnglerEK的Flash樣本解密方法初探
2020-08-19
解密
大資料與程式語言關係
2020-10-24
大資料
EMNLP 2019 | 基於BERT的跨語言上下文相關詞向量在零樣本依存分析中的應用
2019-11-20
Go語言slice的本質-SliceHeader
2018-12-31
GoHeader
小樣本學習，路在何方？
2020-01-10
某EXCEL漏洞樣本shellcode分析
2020-08-19
Excel
對抗樣本綜述(一)
2021-07-10
Facebook增強版LASER開源：零樣本遷移學習，支援93種語言
2019-01-24
遷移學習
起底語音對抗樣本：語音助手危險了嗎？
2018-03-06
大腦、視覺與語言有趣關係
2024-06-30
視覺
python與c語言的語法有哪些不一樣的
2020-11-17
PythonC語言
Go程式語言前景怎麼樣？參加培訓好就業嗎
2019-04-03
Go就業
你真的懂對抗樣本嗎？一文重新思考對抗樣本背後的含義
2019-09-17
【開源樣本庫分享】Five-Billion-Pixels-ENVIFormat 五十億畫素高精度樣本庫分享
2024-06-14
ORM
樣本量估算：隨機對照試驗（兩組均數）比較的樣本量計算方法
2020-12-22
隨機
近似熵-樣本熵-多尺度熵
2020-08-23
熵
使用對抗樣本的攻擊過程
2020-09-29
Python對比其他語言有什麼好處?Python就業怎麼樣?
2019-11-06
Python就業
R語言ggplot怎麼在熱圖上標註相關係數
2024-07-01
R語言
時間解析度、取樣率與取樣深度三者關係理解
2024-08-11
R 語言中雙中括號 [[]]與資料型別列表的關係
2024-03-25
資料型別
2024 CCF BDCI 小樣本條件下的自然語言至圖查詢語言翻譯大模型微調|Google T5預訓練語言模型訓練與PyTorch框架的使用
2024-11-24
大模型GoPyTorch框架
程式語言：型別系統的本質
2022-07-03
型別
對抗樣本學習筆記（一）
2019-04-21
筆記
程式語言的“別樣”編年史
2019-01-05
真實原件製作》皇家墨爾本理工大學畢業證|*一模一樣畢業版本
2019-07-23
r語言
2019-10-18
R語言
推薦幾本javascript與jquery的好書
2018-03-08
JavaScriptjQuery
OCR訓練中文樣本庫和識別
2018-11-23
CVE2015-0057漏洞樣本構造探索
2020-08-19
c語言作業
2024-10-02
C語言

R語言作業：樣本容量與好樣本概率的關係

題目要求

考察知識點

思路

程式碼

截圖

相關文章