R語言作業:樣本容量與好樣本概率的關係
題目要求
作業內容:在30000個人中抽取100000次,抽樣數量依次為20,40,…500,並最後以抽取數量為自變數,概率為因變數作圖。
考察知識點
- 規則向量的生成
- 如何在向量中新增資料
- mean、sample的使用
- 繪圖函式plot的使用
思路
首先讀取資料,因為得到的資料是data.frame格式,我們先將其轉化為矩陣形式,然後轉化為一維向量格式,便於抽取樣本。
做一個雙重迴圈,針對每個樣本容量,都進行100000次實驗,變數sum用來統計符合條件的次數。使用sample函式,指定replace=FALSE表示取出不放回,對取出的資料計算平均值,判斷平均值是否在169~170之間,如果滿足這個條件sum就加1,最後通過sum與實驗次數(100000)的比值計算概率。使用append函式,將計算得到的概率新增在列表good_sample_p中。
使用plot繪圖函式,指定xlab和ylab標籤,再指定影像型別為點劃線,最後使用title函式新增標題
程式碼
a <- read.csv('heigh_30000.csv')
a <- as.matrix(a)
data <- as.vector(a)
good_sample_p <- c()
for (i in seq(20,500,by=20)){
sum <- 0 # 記錄滿足條件的個數
for (j in 1:100000){
x <- sample(data,i,replace=FALSE) # 抽取不放回
y <- mean(x,trim=0,na.rm=TRUE) # trim=0不修剪掉排在首尾的部分 ,na.rm=TRUE移除預設值
if( 169<y && y<170){
sum <- sum+1
}
}
p <- sum/100000 # 計算概率
good_sample_p <- append(good_sample_p,p)
}
# 新增x,y資料,設定x軸,y軸標籤,也可以在title函式中放置
plot(seq(20,500,by=20), p_list,type = 'b',xlab = 'Sample size',ylab = 'Good sample probability')
# 新增標題
title('Relationship between Sample size and Good sample probability', col.lab = 2, cex.lab = 2)
截圖
相關文章
- 從因果關係來看小樣本學習
- 定性檢測的樣本量估算之精確概率法
- 招標書樣本
- 領域本體與DDD的UL語言
- R資料分析:樣本量計算的底層邏輯與實操,pwr包
- 樣本協方差矩陣的定義與計算矩陣
- 不平衡樣本的處理
- AnglerEK的Flash樣本解密方法初探解密
- 大資料與程式語言關係大資料
- EMNLP 2019 | 基於BERT的跨語言上下文相關詞向量在零樣本依存分析中的應用
- Go語言slice的本質-SliceHeaderGoHeader
- 小樣本學習,路在何方?
- 某EXCEL漏洞樣本shellcode分析Excel
- 對抗樣本綜述(一)
- Facebook增強版LASER開源:零樣本遷移學習,支援93種語言遷移學習
- 起底語音對抗樣本:語音助手危險了嗎?
- 大腦、視覺與語言有趣關係視覺
- python與c語言的語法有哪些不一樣的PythonC語言
- Go程式語言前景怎麼樣?參加培訓好就業嗎Go就業
- 你真的懂對抗樣本嗎?一文重新思考對抗樣本背後的含義
- 【開源樣本庫分享】Five-Billion-Pixels-ENVIFormat 五十億畫素高精度樣本庫分享ORM
- 樣本量估算:隨機對照試驗(兩組均數)比較的樣本量計算方法隨機
- 近似熵-樣本熵-多尺度熵熵
- 使用對抗樣本的攻擊過程
- Python對比其他語言有什麼好處?Python就業怎麼樣?Python就業
- R語言ggplot怎麼在熱圖上標註相關係數R語言
- R 語言中雙中括號 [[]]與資料型別列表的關係資料型別
- 時間解析度、取樣率與取樣深度三者關係理解
- 程式語言:型別系統的本質型別
- 2024 CCF BDCI 小樣本條件下的自然語言至圖查詢語言翻譯大模型微調|Google T5預訓練語言模型訓練與PyTorch框架的使用大模型GoPyTorch框架
- 對抗樣本學習筆記(一)筆記
- 程式語言的“別樣”編年史
- 真實原件製作》皇家墨爾本理工大學畢業證|*一模一樣畢業版本
- r語言R語言
- 推薦幾本javascript與jquery的好書JavaScriptjQuery
- 【R語言入門】R語言環境搭建R語言
- c語言作業C語言
- OCR訓練中文樣本庫和識別