將網頁轉換為Markdown的免費線上轉換工具

banq發表於2024-10-16


將網頁轉換為Markdown並輕鬆將其複製到剪貼簿的免費轉換工具,點選標題進入。

這是基於Jina 提供了一個Reader API,它可以將任何 URL 轉換為 LLM 友好的 Markdown,而且事實證明它支援 CORS

Github地址
特點

  • 將任何網站轉換為 markdown
  • LLM 過濾
  • markdown 模式詳解
  • 自動爬蟲(不含站點地圖!)
  • 文字和 JSON 響應
  • 易於自主託管
  • ... 所有這些以及更多內容都是免費的!

在底層,Markdowner 利用 Cloudflare 的瀏覽器渲染Durable 物件來啟動瀏覽器例項,然後使用 Turndown 將其轉換為 markdown。


什麼是Jina ?
將網路資訊輸入 LLM 是接地的一個重要步驟,但也很有挑戰性。 最簡單的方法是抓取網頁並輸入原始 HTML。 然而,抓爬可能很複雜,而且經常會被阻止,原始 HTML 會被標記和指令碼等無關元素所干擾。

Jina 閱讀器應用程式介面(Reader API)可以解決這些問題,它可以從 URL 中提取核心內容,並將其轉換為簡潔、LLM 友好的文字,確保為您的代理和 RAG 系統提供高質量的輸入。

如果網址是https://example.com,只要在網址前面加上https://r.jina.ai/即可:https://r.jina.ai/example.com


另外一工具:提取 URL
從網頁複製內容並貼上到此處以提取連結的 URL

  • 這個工具可以讓你從網頁上覆制一個區域,將其貼上到工具中,並返回一個連結到該文字中的URL列表
  • 適合想一次獲取一大堆URL

類似Chrome外掛:Web clipper

類似工具:urltomarkdown. com

類似FireFox外掛:

  • https://addons.mozilla.org/en-US/firefox/addon/markdown-collector/

相關文章