我第一個開源AI小產品-video2blog即將正式釋出

aehyok發表於2024-04-30

前言

首先它是為了解決我自己的個人問題。不管能不能幫到你,或者對於看到的你是否有點利用價值,也沒太大的關係,最起碼你可以來看看我開發小產品的整個過程。

一段時間以來,我開始透過youtube平臺來獲取一些知識,或者打發早晚上下班坐地鐵的時間。主要是我早晚通勤時間過長,差不多都是一個小時吧,單純的刷刷什麼某音、某紅的真真的浪費了大量的時間,所以我選擇了youtube平臺。我在 youtube 看影片時,覺得有點用的資訊我會截個圖,方便回頭查詢關鍵字,尤其是看技術類的影片。但有時候雖然截圖了,但是前後是有關聯的,關聯的地方當時又沒截圖,但是隱約的也記不起前後文的聯絡了,於是尷尬了,就只能重新翻看這個影片了。因為我遇到過好多次了,而且比較浪費時間。 於是就有了video2blog。

video2blog的開發歷程

透過影片連結結合AI的能力,將整個影片轉換為一篇圖文筆記或者圖文部落格。圖文最大的好處就是方便我自己回看,就像小時候我們自己的錯題筆記。

image 從3月底附近我就在琢磨我這個小產品了,但當時的思路還沒有開啟,但是腦海中已經有了初步的設想。從那時起程式碼就已經開始了,因為要開發一個pc的客戶端,也有很多的技術沒有使用過,需要投入時間去研究一番。說真的還是有點小興致,畢竟是解決自己的痛點的。

image 剛好4月初跟隨清明節一起請了三天假,玩完回來狀態也非常的nice,那一週真的是瘋狂的碼碼查bug,也慢慢的有了上圖的自我感覺的清晰思路。 目前按照上圖基本上跑通了。但是很多功能還非常不完善或者還沒有加進來。比如影片透過whisper來轉字幕目前透過python實驗成功,但沒加入到專案中,再比如對接AI的字幕轉長文功能也沒真正落地。這些都可以透過其他的工具來實現,所以暫時就先擱置一下,解決我覺得更重要的問題了。

image 我只能說一週的時間真的太短了,因為平常還有別的專案在搞,上班的時候只能抽點時間來看看查查問題,最佳化下思路等等,更多的時候也在思考吧。有幾天真的也不太想上班了。

image 每週實現的功能也不多,但緊緊把把的能基本按照自己的預想在走,有時候一天的問題解決不了,我就擔心這進度要慢了,明天得抓緊時間了。

image 這裡我之前也在3月底的時候留過記錄。我自己的期待也是爭取5月底能有一個比較好的版本出來。就是提前儘量給自己做好計劃目標,哪怕沒完成,沒達到預期,也能在自己覆盤的時候找到問題,或者能總結出一些經驗教訓。

現狀

video2blog.excalidraw
video2blog.excalidraw

透過這個圖便可以簡單的看到我整個小產品的流程走向,其實現在看來流程清晰,思路也是比較簡單粗暴的。 當然了也有其他更好的使用模式。這裡暫時針對我自己算是現階段對我來說是一個比較好的模式選擇了。

我的小產品現階段藉助外部的AI工具是可以走通的。比如可以藉助Whisper模型進行語音轉文字,或者直接透過它來翻譯。 如果有字幕,字幕剛好是英文,也可以透過AI工具進行翻譯為中文。翻譯為中文後,再透過AI工具轉換為文章或者叫筆記。 轉換為文章的時候對prompt是有要求的,轉換的時候要新增上目錄,並且在目錄上新增上影片中的時間區間,這樣方便我根據時間區間來獲取圖片並去除重複的圖片,然後選擇插入到文章中。

最後

現在預釋出這個小產品也算是對我自己,這一個多月時間的階段性總結。也是對我自己的一個小小的挑戰。因為從來也沒有進行過對外釋出一個屬於自己的小產品,這也算是一次小小的嘗試。 很多時候有了想法,那就去做做試試看吧,也許其中有非常多的困難,但是隻有去做了才知道,這些個小困難在一天天的排解中,慢慢的也不算是個什麼困難了。 也許這個小產品並不是很完美,但最起碼我自己能夠慢慢的用起來了。

如果你覺得小工具還有點意思,便可以提前來玩一下看看。如果有什麼問題,也可以隨時聯絡我。 目前支援window和mac,在我自己的電腦上安裝嘗試都沒有問題的。當然可能會有相容性的問題,畢竟第一次嘗試搞一個跨平臺的客戶端。

image
image

我建立了一個video2blog的微信群。

可以關注我的公眾號:那個曾經的少年回來了

然後後臺傳送訊息: video2blog。

由於專案還沒真正的成型釋出,所以暫時就不將開源地址放出來了。因為暫時也是堆疊功能程式碼,主要以實現功能為主。爭取5月底正式釋出第一個完整的版本。
最後如果產品思路對你有價值,你也可以快速復刻一個。

相關文章