七月中旬大科技工程文摘

banq發表於2024-07-19

包含來自 Discord、Expedia、Pinterest、Booking 等的文章!


1. “駕馭 Web 進化:與 Addy Osmani 就 Web 開發和開發者成長進行深入訪談”
Wix ⸱ 閱讀時間 12 分鐘 ⸱ 7 月 16 日
Addy 討論了在 Web 開發測試中如何平衡質量和敏捷性,介紹瞭如何在瞬息萬變的行業中選擇重點關注哪些技術。他分享了他對瀏覽器設計演變和潛在改進領域的看法,並介紹了瀏覽器效能的潛在變革因素,包括 WebAssembly 和 AI 驅動的最佳化。
強烈推薦閱讀!


2. “棄用遺留微服務的風險”
作者:Shashank Jha ⸱ Expedia ⸱ 閱讀時間:4 分鐘 ⸱ 7 月 10 日

  • 探索 Expedia 集團航班詳情堆疊現代化的歷程
  • 描述該專案的動機和整合Cassandra 的提議
  • 涵蓋所面臨的挑戰,包括序列化庫和升級基礎設施的問題
  • 分享引入Redis作為替代方案的決定及其帶來的好處,包括簡化的PubSub實施和成本節省

其他:

“構建你自己的 GPT(BYO-GPT)”
作者 Rajat Gupta ⸱ Walmart ⸱ 閱讀時間 7 分鐘 ⸱ 7 月 8 日
如何為個人資料構建定製的 GPT 並避免將敏感資訊暴露給外部 API?

“Discord 如何使用開源工具進行可擴充套件資料編排和轉換”
Discord ⸱ 2 分鐘閱讀 ⸱ 7 月 12 日
本文提出了使用 Dagster 和 dbt 組合的決定,強調了 Dagster 對 Kubernetes、宣告式自動化和使用者友好型 UI 的支援。

“利用 RAG 解鎖影片知識共享”
作者:Alon Faktor ⸱ Vimeo ⸱ 閱讀時間:13 分鐘 ⸱ 7 月 15 日

  • 介紹 Vimeo 的新影片問答系統,該系統使用生成式 AI 來討論影片內容
  • 探索使用RAG (檢索增強生成)來回答有關特定文字資料庫的問題
  • 討論自下而上處理問答影片記錄的方法
  • 介紹不使用面部識別的說話人檢測技術
  • 介紹如何使用人工智慧生成的藝術作品在影片中尋找準確的參考點,並自動生成新的問題供觀眾提出

“最佳化揀貨流程,讓 Instamart 能夠更快地交貨”
作者:Sonakshi Gupta ⸱ Swiggy ⸱ 閱讀時間:7 分鐘 ⸱ 7 月 10 日

  • 描述 Instamart 在暗店揀貨流程高峰時段的時間延遲問題
  • 介紹批次揀貨訂單的解決方案以提高效率
  • 透過數學模型和演算法實現批次揀選
  • 分享模擬結果,驗證批次揀選的有效性
  • 概述批次揀選如何減少揀選員分配時間和行程時間,從而提高整體效率

“AWS 簡單電子郵件服務安全性”
作者:Tom Spencer ⸱ Capgemini ⸱ 閱讀時間:1 分鐘 ⸱ 7 月 12 日

“利用圖形技術進行實時欺詐檢測和預防”
作者:Deepak Patankar ⸱預訂⸱ 閱讀 6 分鐘 ⸱ 7 月 10 日

  • 描述 Booking.com 背景下的欺詐檢測和預防挑戰
  • 引入以圖表形式表示請求的概念,用於實時欺詐檢測
  • 分享圖表隨時間演變並揭示可疑模式的示例
  • 解釋如何使用圖表進行實時欺詐檢測以及構建圖表的技術要求
  • 涵蓋欺詐檢測服務和圖形服務的系統元件和設計

“以下是我們在柏林 Google I/O Connect 大會上了解到的資訊”
作者:Ed Holloway-George ⸱ ASOS ⸱ 閱讀時間:1 分鐘 ⸱ 7 月 17 日

“識別 LLM 中不安全輸出處理漏洞的 4 階段指南”
作者 Zeev Kalyuzhner ⸱ Wix ⸱ 閱讀時間 3 分鐘 ⸱ 7 月 15 日

  • 探討 LLM 中不安全輸出處理的漏洞
  • 描述惡意行為者如何利用此漏洞破壞系統並訪問私人資料
  • 涵蓋訓練資料中毒的概念及其對 LLM 完整性的影響
  • 介紹利用漏洞入侵系統的實際場景

“使用 Karate 簡化 GraphQL 服務測試”
trivago ⸱ 閱讀 10 分鐘 ⸱ 7 月 8 日

  • 描述 trivago 如何將其現有的 GraphQL 單體重構為微服務架構
  • 探索測試 GraphQL 服務的挑戰,包括巢狀資料結構和錯誤處理
  • 分享如何整合測試框架 Karate 來解決測試挑戰
  • 介紹使用 Justfiles 來抽象複雜任務並確保跨平臺相容性
  • 涵蓋部署到生產環境之前測試更改的藍綠髮布策略的實施

“構建 Pinterest Canvas,一種文字到影像的基礎模型”
作者:Pinterest Engineering ⸱ Pinterest ⸱ 閱讀時間:7 分鐘 ⸱ 7 月 10 日

  • 介紹了 Pinterest Canvas 的開發,這是一種文字到影像的基礎模型,用於增強平臺上現有的影像和產品
  • 討論基礎文字轉影像模型的訓練、生成逼真背景的微調過程,以及針對影像風格的上下文學習過程
  • 解釋如何使用強化學習來鼓勵 Canvas 生成多樣化且具有視覺吸引力的影像
  • 描述背景生成的微調過程,包括訓練階段和納入修復的附加資訊
  • 分享 Pinterest Canvas 模型的未來改進,包括升級到更現代的 Transformer 擴散架構,並重新思考二元掩碼模型調節方法

相關文章