所屬課程 | 福州大學軟體工程實踐(2019) |
---|---|
作業要求 | 原型設計(文獻摘要熱詞統計) |
結對學號 | 221600330、221600331 |
作業目標 | 練習原型設計,培養合作能力 |
製作的原型 | 軟工實踐-論文爬取原型設計 |
pdf下載 | 本篇隨筆線上pdf pdf(百度網盤 提取碼:ymnn ) |
一、NABCD
N(Need,需求)
問題:
小櫻是一名大三的學生,一直痴迷於吃雞類遊戲,某日聽聞同宿舍的小狼剛和導師去參加了CVPR會議,內心羨慕不已,便下定決心痛改前非、努力鑽研,希望能在畢業前完成一篇站在時代前沿的優秀論文。但令人苦惱的是,他不知道近幾年頂會的熱門領域和研究方向,根據論文list去一篇一篇查詢總結效率又著實太低,於是求助於“軟工實踐互助愛心組織”,希望我們能幫助他設計一個平臺解決現階段的需求。
需求:
- 根據使用者給定的網址爬取裡面論文的題目、摘要、關鍵詞、年份、釋出平臺、原文連結
- 展示近幾年各個頂會的熱門領域和研究方向,
- 在已爬取的論文中分析熱門領域或熱門研究方向;
- 根據論文的題目、作者、關鍵詞、年份、屬性(oral、spotlight、poster)進行篩選,並返回相關的paper、source code、homepage等資訊;
- 可對多年間、不同頂會的熱詞呈現熱度走勢對比(這裡將範疇限定在計算機視覺的三大頂會CVPR、ICCV、ECCV內);
- 形成如關鍵詞圖譜之類直觀的檢視方式;
A(Approach,做法)
- 1、平臺
- 經過討論,我們決定用手機APP的形式來滿足需求,手機APP軟體的優勢:
- 無需依靠其他媒體和應用,即可實現自己的移動營銷。
- 無需輸入,即可輕鬆瀏覽。
- 隨時隨地,互聯互通。
- 全方位、多媒體顯示。
- 最便捷的企業宣傳冊。
- 資料更新,一步到位。新產品、新服務或者新資訊釋出,更新一步到位。
- 移動網際網路企業名片。
- 有效佔領移動網際網路入口。這些優勢能夠快速佔領一定的商業位置。
- 在”墨刀“上進行原型設計。
- 經過討論,我們決定用手機APP的形式來滿足需求,手機APP軟體的優勢:
- 2、針對使用者需求
- 3、額外功能
- 設定收藏論文功能,在我的收藏頁可方便找到自己收藏過的論文。
- 提供關於三大會議相關的新聞頁面,方便讀者檢視三大會議的最新訊息。
- 提供軟體內外的分享功能。
- 提供論文的原始碼,pdf文件下載。
- 提供論文評論功能。
- 提供軟體內的私聊功能,使用者可通過點選分享的論文連結直接進入論文頁
B(Benefit,好處)
- 使用者不必根據論文列表一篇一篇查詢,只需要提交列表即可得出查詢結果,使用者可以更高效地得到結果,節省了時間和精力。
- 我們的軟體給使用者提供了精美的頁面讓使用者看了心情舒暢。
- 我們幫助使用者整理、分析了論文清單,並直接呈現部分關鍵資訊,方便使用者學習,節省了時間;
- 為使用者推送近期學術新聞和熱點。
C(Competitors,競爭)
優點:
- 我們將平臺定位於手機app,使用app簡單便捷,相對於web端更使用大眾人群。
- 免費使用
- 介面簡單,對於使用者通俗易懂。
- 一站式論文處理分析,優化使用者體驗
缺點: - 功能簡單,缺乏專業網站的分析能力
- 競爭對手過多,沒有突出的個性功能
- 只用python爬取網站時對演算法要求高,爬取整個網頁計算量大。在軟體自帶的資料庫中排序與分析大量資料也是一大技術難題
- 在沒有資源方合作的情況下論文來源不穩定,容易被站方反爬蟲應對。
D(Delivery,推廣)
- 由於與我們軟體相對應的客戶群體比較少,所以沒必要大規模地到處打廣告,只需要針對我們的客戶群體進行一些宣傳。
- 我們可以和一些涉及論文的微信公眾號、微博合作,讓其幫我們做一些宣傳。
- 還有就是可以在一些高校群裡做一些宣傳(跟他們的管理員商量好後)。
二、原型展示
- 1:登入註冊介面
- 點選畫面中的藍色加號進入註冊頁面
- 點選畫面底下圖示使用其他軟體賬號登入
- 輸入賬號密碼後進入軟體主頁面
2:主頁:新聞頁面,頁面上為與各大會議有關的資訊
- 點選選單欄1進入個人資訊頁面 、點選圖示2進入個人收藏的論文頁面 、點選圖示3進入論文檢索頁面、頁面5為論文頁面,有著與論文檢索分析有關的功能。
- 點選選單欄1進入個人資訊頁面 、點選圖示2進入個人收藏的論文頁面 、點選圖示3進入論文檢索頁面、頁面5為論文頁面,有著與論文檢索分析有關的功能。
- 3:論文搜尋介面
- 使用者在論文檢索介面輸入網址,軟體爬取網頁內的論文資訊,包括標題,作者,關鍵詞等。使用者可以選擇修改或者刪除論文,等到使用者選擇完畢後點選收錄將論文資訊儲存至軟體資料庫中以便後續的分析與操作。
- 使用者在論文檢索介面輸入網址,軟體爬取網頁內的論文資訊,包括標題,作者,關鍵詞等。使用者可以選擇修改或者刪除論文,等到使用者選擇完畢後點選收錄將論文資訊儲存至軟體資料庫中以便後續的分析與操作。
- 4:我的收錄介面
- 使用者可在已經收錄的論文中進行高階檢索,包括標題,作者,論文屬性,年份等
- 使用者可在已經收錄的論文中進行高階檢索,包括標題,作者,論文屬性,年份等
- 5:論文分析介面
從軟體資料庫中對會議熱詞、論文數量、論文屬性等資料進行統計分析
介面1展示了收錄論文的幾大熱詞,以及熱詞的詳細排行。輸入熱詞搜尋後可以查詢與該熱詞有關的功能
介面2用圖表記錄了論文數量、屬性佔比、與資料庫各會議論文佔比等資訊
- 6:論文詳情頁面
- 在搜尋結果或者我的收藏頁面可點選文章,並進入詳情頁。
- 詳情頁底部分為三個按鈕,左邊為論文討論區,點選可以進入評論區評論。
- 中間按鈕為分享與下載按鈕,點選會出現四個選項,分別為下載pdf原文,分享至微博,下載原始碼,分享至私聊。
- 點選下載後詳情頁出現下載標識,並在軟體後臺下載。
- 右邊按鈕即收藏與取消收藏。
- 使用者可選擇單詞進行線上翻譯。
- 7:私聊頁面
- 使用者可在評論區或者個人主頁直接私聊。可通過私聊功能進行論文分享,日常聊天等。其他使用者點選連結即進入論文詳情。
- 使用者可在評論區或者個人主頁直接私聊。可通過私聊功能進行論文分享,日常聊天等。其他使用者點選連結即進入論文詳情。
- 8:個人資訊頁面
- 記錄了使用者個人資訊,例如收藏論文數量,關注人數量,以及個人的微博,github,email地址等資訊。
- 記錄了使用者個人資訊,例如收藏論文數量,關注人數量,以及個人的微博,github,email地址等資訊。
三、結隊過程照片
四、PSP表格
PSP2.1 | Personal Software Process Stages | 預估耗時(分鐘) | 實際耗時(分鐘) |
---|---|---|---|
Planning | 計劃 | 20 | 45 |
• Estimate | • 估計這個任務需要多少時間 | 20 | 45 |
Development | 開發 | 360 | 420 |
• Analysis | • 需求分析 (包括學習新技術) | 60 | 45 |
• Design Spec | • 生成設計文件 | 20 | 30 |
• Design Review | • 設計複審 | 120 | 100 |
• Coding Standard | • 程式碼規範 (為目前的開發制定合適的規範) | 0 | 0 |
• Design | • 具體設計 | 60 | 70 |
• Coding | • 具體編碼 | 0 | 0 |
• Code Review | • 程式碼複審 | 0 | 0 |
• Test | • 測試(自我測試,修改程式碼,提交修改) | 0 | 0 |
Reporting | 報告 | 180 | 200 |
• Test Report | • 測試報告 | 0 | 0 |
• Size Measurement | • 計算工作量 | 0 | 0 |
• Postmortem & Process Improvement Plan | • 事後總結, 並提出過程改進計劃 | 30 | 50 |
合計 |
五、總結
遇到的困難
- 在軟體設計過程中由於對許多專業名詞不瞭解,例如熱度趨勢、關鍵詞圖譜等,這樣在討論展示效果時無從下手,浪費了很多時間去查資料。
- 以及在設計原型介面過程中,由於第一次接觸這類工具,對設計工具的不熟練也導致介面往往到達不了想要的效果,例如花了很多時間去學習使用全域性手勢以及各個狀態的跳轉。
- 設計能力的缺乏,導致在畫原型介面草稿時無從下手,或者畫出非常簡陋的介面,需要學習之後才能嘗試著將功能與美感合併。
- 還有有時兩個人的設計審美不同,會導致一些分歧的發生。
效能分析
- 軟體實際執行效能應該非常依賴於排序與統計演算法,因為用python爬取網頁會得到非常多的資料。需要思考如何在軟體資料庫較快地統計分析排序,以及如何將資料用圖表方式展示出來。