將網頁轉換為Markdown並輕鬆將其複製到剪貼簿的免費轉換工具,點選標題進入。
這是基於Jina 提供了一個Reader API,它可以將任何 URL 轉換為 LLM 友好的 Markdown,而且事實證明它支援 CORS
Github地址
特點
- 將任何網站轉換為 markdown
- LLM 過濾
- markdown 模式詳解
- 自動爬蟲(不含站點地圖!)
- 文字和 JSON 響應
- 易於自主託管
- ... 所有這些以及更多內容都是免費的!
在底層,Markdowner 利用 Cloudflare 的瀏覽器渲染和Durable 物件來啟動瀏覽器例項,然後使用 Turndown 將其轉換為 markdown。
什麼是Jina ?
將網路資訊輸入 LLM 是接地的一個重要步驟,但也很有挑戰性。 最簡單的方法是抓取網頁並輸入原始 HTML。 然而,抓爬可能很複雜,而且經常會被阻止,原始 HTML 會被標記和指令碼等無關元素所干擾。
Jina 閱讀器應用程式介面(Reader API)可以解決這些問題,它可以從 URL 中提取核心內容,並將其轉換為簡潔、LLM 友好的文字,確保為您的代理和 RAG 系統提供高質量的輸入。
如果網址是https://example.com,只要在網址前面加上https://r.jina.ai/即可:https://r.jina.ai/example.com
另外一工具:提取 URL
從網頁複製內容並貼上到此處以提取連結的 URL
- 這個工具可以讓你從網頁上覆制一個區域,將其貼上到工具中,並返回一個連結到該文字中的URL列表
- 適合想一次獲取一大堆URL
類似Chrome外掛:Web clipper
類似工具:urltomarkdown. com
類似FireFox外掛:
- https://addons.mozilla.org/en-US/firefox/addon/markdown-collector/