在每次的資料分析工作中,將分析過程與結果寫成一份通俗易懂的報告是工作的最後一步,並且對有的人來說,這也是最難的一步。
一份技術報告的目的是傳遞資訊。然而,技術資訊是很難讓人理解的,因為它不僅複雜,而且無法讓人輕易的瞭解。將數學焦慮等融入到任何事情都可以被統計資料證實這一流行觀念中,你就可以明白為什麼做資料分析報告是一份挑戰。如果你對資料分析報告撰寫流程很陌生的話,可以考慮學習下面的內容。
一、明確內容
從你最瞭解的部分著手開始。在寫一份資料分析報告時,你最瞭解的部分應該是你分析的統計資料、繪製的圖形以及建立的模型。
你應該有能力去描述你是如何呈現總體特徵的,如何生成這些資料的或者是提供了這些資料的源頭,在做探索性的分析時你發現了資料存在哪些問題,你是如何處理這些資料的,對異常資料你做了怎樣的處理,應用了怎樣的變換方法,對於缺失的和重複的資料你做了什麼,你是如何處理違反假設的情況和不顯著的結果的。
接下來,你需要決定什麼是重要的內容,以及,哪些內容對報告閱讀者來說是重要的。因為除非你寫的報告是面向你的大學教授或者是同齡的資料分析專業人員,否則的話,你可以十分確定的認為沒有人想聽你講你是如何解決各類問題的,你用了什麼技巧,或者你在分析資料的時候多麼努力。沒有人在意你的結果是來自Excel表格還是一段自己用R語言編寫的程式。
一旦整理出了你需要的資訊,就為這份報告寫一個概述,這樣你就會知道你都要寫些什麼內容。這樣做可以幫助你不偏離主線。你的總結或許可以選擇以下三種形式中的一種:
1.執行總結
執行總結面對的是決策者或者那些沒有足夠的時間或耐心去閱讀超過400字的文章的人。把你的概述縮減到一頁以內,不要使用任何術語,只提供那些決策者需要的,可以幫助他採取適當行動的結果資訊(也就是:你想要傳達的資訊)
2.總括
總括面對的是大部分讀者,無論他們是否會閱讀這份報告。一篇總括是報告內容的刪減版,並且關注點在你想要傳達的資訊上。總括的內容也不應超過幾頁紙。
3.摘要
摘要面對的是同專業的人以及其他可以看懂資料分析的人。一篇摘要的內容通常是一頁紙或者少於一頁紙,並且總結了你所做的所有的重要的工作,從定義總體到評估效應量。摘要通常被用在學術論文寫作中。一旦你知道了你的讀者是誰,你就可以重新撰寫概述以便抓住讀者的注意力。
二、瞭解讀者
每篇教你自學技術寫作的文章都會首先告訴讀者要考慮他們撰寫報告的觀眾。即使如此,或許很少有作者真的這樣去做。
在統計分析中,你通常會先開始考慮你想要做出推斷的那些總體所具有的特徵。與之相似的,當你開始撰寫一篇分析報告時,你通常會先開始考慮你想要進行交流的那些讀者所具有的特徵。
你必須考慮那些即將閱讀你的報告的讀者的這些特徵:是誰(who)、是什麼(what)、為什麼(why)、在哪裡(where)、什麼時間(when),以及如何做(how)。這裡有一些你需要考慮的和讀者有關的內容。
1.Who
讀者通常是通過他針對報告所扮演的角色來定義的。一些讀者會用這份報告來做決策。一些讀者會通過這份報告學習新的資訊。其他的會根據自己已經知道的情況來評論這份報告。因此,一份統計報告的讀者通常會被定義為:決策人員、股東(利益相關者)、評論家或者對報告感興趣的個人。
有的報告只會被一個人閱讀,但是大部分報告會有很多讀者。各行各業的人都有可能閱讀你的報告。因此,會有初級的、中級的、甚至更多不同級別的讀者參與閱讀。這是有問題的,因為你無法取悅每個人。因此,要通過定位你的讀者,首先關注接收你的資訊的最重要的讀者,其次關注讀者中群體最大的那一部分。
2.What
一旦知道你的報告的目標受眾是哪些人,你就應當嘗試弄明白他們的特徵。或許對於一個技術報告作者來說,最重要的特徵是讀者對報告的主題和報告中描述的統計技術的瞭解程度。你可能沒辦法改變讀者對報告主題的知識儲備,但是你可以通過調整呈現統計資訊的方式幫助讀者理解內容。例如,一個資料分析師可能遇到的讀者型別包括:
(1)數學恐懼者
懼怕數字但是或許願意瞭解概念。不要使用任何統計學術語。不要呈現公式。儘可能少的使用數字。例如,用“大約一半”代替任何百分比在50%左右的數字。那些額外的精度對數學恐懼者來說並不重要。
(2)遊客
懂一些知識並且有興趣。穩當一點。只是用你定義明確的基本術語。可以使用數字,只不過在一張表格裡不要用得太多。將數值化為證書以保證你沒有暗示錯誤的精確度。堅持使用餅圖、柱狀圖,或許偶爾使用一下散點圖,不要使用比這些更復雜的工具。不要使用任何公式。
(3)賣弄者
懂得比自己認為的少並且想要展示。只要你把你表達的意思定義出來,就可以使用術語。甚至一個喜歡賣弄的人也可能學到些東西。同樣的,使用數字、統計圖表,以及公式也是可以的,只要你能清晰的解釋它們的含義。這類人如果沒有指導的話可能會得出不正確的結論。
讀者的特徵為報告的長度、撰寫的語調和風格提供了指導。
3.Why
那些讀者很可能是對你的報告非常感興趣呢還是僅僅是對它感到好奇(如果他們沒有興趣,那麼他們就不算是讀者)?對自己坦誠一點。為什麼別人要有興趣閱讀你的報告呢?你將誰定義成為你的目標讀者呢?他們會用你的發現做些什麼呢?他們會了解到有用資訊嗎?他們將會做出一個決策呢還是會採取一個行動呢?這對他們來說是一個很重要的東西呢還是他們必須關注的?
4.Where
這份報告的受眾是一個數量、範圍有限的群體呢,例如為一個組織而進行的分析,還是任何人都有可能閱讀它呢?這份報告的目標是組織中的上層人員呢還是普通人員(也就是說是自下而上還是自上而下)?關於這份報告有沒有安全性或保密性的顧慮呢,無論是在個體還是組織層面上?
5.When
讀者什麼時候需要看到你的報告?在公佈報告以前誰必須複查這份報告以及複查需要多久?截稿日期是否無法變動?你還剩多久的時間來撰寫這份報告?是否有足夠的時間讓你想清楚你需要寫什麼?是不是有時間讓你進行必要的額外的分析以填補報告大綱中的空白?當複查你的報告的時間是你撰寫它所花費的時間的兩倍的時候,你是否會因此生氣呢?
這裡有一些你應當牢記於心的建議。絕對,絕對,絕對不要將你沒有寫完、沒有編輯好的報告的草稿提交上去應付複查。我告訴自己我寫的每份報告都要遵守這條規則。不幸的是,像大多數人一樣,我不聽自己說的話。
最後,你要考慮如何呈現這份報告才能使讀者從中得到最多的資訊
組裝:你寫的報告將被如何組裝起來(也就是說:組裝成一件可以被分銷的產品)?它將是一個簡短的書信式報告,一份綜合報告,一篇部落格或者是一篇網路文章,一篇專業的期刊文章,一份權威報告,還是你的報告會構成其他檔案的組成部分呢?
形式:你的這份報告將以電子檔案的形式還是紙質檔案的形式被分發呢?如果它是以電子形式被分發的話,它能否在網際網路上取得呢?它能否被編輯呢?它是否會以什麼形式限制獲取呢,例如密碼?
外觀:這份報告是隻能以白紙黑字的形式來呈現呢還是可以使用彩色內容?圖表與文字的比重是多少?這份報告是很傳統的呢還是會很華麗,就像營銷手冊一樣?報告裡會有11×17英寸大的摺疊頁呢還是會有超大的像地圖一樣的插入頁呢?
三、明確方法
從高中起你就被告知行文開始前要擬一個大綱,寫分析報告也是這樣。然而有許多可能的提綱你可以根據您的受眾特點和期望來選擇。你首先要決定的是報告最終的建議是什麼
您的報告是像政府部門的行政簡報(不要混淆法律簡報),信函報告,總結報告,綜合報告,網際網路文章或部落格,專業期刊文章或白皮書等等。每一種報告都有自己的受眾型別,內容和風格。
寫報告就像是去旅行。資訊就是你想要傳遞給最終目的地——觀眾的資產。報告的建議是持有資訊的車輛。現在,您需要一張地圖來了解如何到達目的地——那就是提供。
就像地圖上有不只一條可能的路線,這裡也有幾種可能的大綱策略可以用來編寫報告。
1. 跟隨資料的方法
如果您具有非常結構化的資料分析,則可以按順序報告每個資料片段。調查往往屬於這一類。這種方法使編寫報告變得容易,因為在按照原始順序重新組合之前,可以將報告各個部分分開並分發給其他人寫。缺點是這種方法通常沒有給出綜合的結果。讀者只能自己思考這一切意味著什麼。
2. 講故事的方法
這種方法認為閱讀統計報告不應該像修剪草坪一樣枯燥。相反,你應該引導讀者的好奇心,就像解開神祕的謀殺案之謎,你一點點地提供線索,但當把所有的線索放在一起時你給出的結論又十分合理。這與上述的“跟隨資料的方法”幾乎相反。
在講故事的方法中,報告從最簡單的資料分析開始,逐漸地過渡到精彩的高潮 – 分析的結論。與結論不相關的分析將被省略。通常報告的過程有一些弧線,譬如先前介紹的分析結果在後面的章節中被重申,以顯示它是如何支撐整個故事情節。
圖表在這種方法中非常重要。提綱更像是故事概述。對於每個文字頁面,可能圖表佔據了一大半。講故事的報告通常比其他方法的報告需要更長的時間,但是如果你的讀者有耐心閱讀完,那麼結果將是會更深刻的(也就是說,不要試圖把故事講給路人聽)。
所以,確保你有一個合適的提綱,但不要讓它限制你。在構建提綱時,儘量平衡各部分,使讀者有周期性的休息。但是,在每個部分中,小節的長度應與其重要性相對應。
文章來源於大資料分析和人工智慧