SolrCloud叢集

beifengwang發表於2014-02-17

SolrCloud 是基於Solr和Zookeeper的分散式搜尋方案,是正在開發中的 Solr4.0 的核心元件之一,分散式服務框架是 Apache Hadoop的子專案,它主要是用來解決分散式應用中經常遇到的一些資料管理問題。它的主要思想是使用 Zookeeper 作為叢集的配置資訊中心。當你需要大規模,容錯,分散式索引和檢索能力時使用 SolrCloud它是指Solr中一套新的潛在的分發能力、通過引數讓你建立起一個高可用、容錯的Solr服務叢集。ZooKeeper的目的是為了減輕分散式應用程式所承擔的協調任務。

ZooKeeper使用Java所編寫,但是支援Java和C兩種程式語言。它是一個開源分散式的服務,它提供了分散式協作,分散式同步,配置管理等功能。它提供了一些簡單的操作,分散式的應用可以建立在同步、配置管理、分組和命名等服務的更高階別的實現的基礎之上。使得分散式應用可以基於這些介面實現諸如同步、配置維護和分叢集或者命名的服務。Zookper很容易程式設計接入,它使用了一個和檔案樹結構相似的資料模型。可以使用Java或者C來進行程式設計接入。Zookper的目的就是將分散式服務不再需要由於協作衝突而另外實現協作服務。ZooKeeper資料模型、名稱空間以及節點的概念ZooKeeper資料模型和層次名稱空間提供的名稱空間與標準的檔案系統非常相似。一個名稱是由通過斜線分隔開的路徑名序列所組成的。ZooKeeper中的每一個節點是都通過路徑來識別。

基於Lucene4.6+Solr4.6+Heritrix1.14+S2SH實戰開發從無到有垂直搜尋引擎】課程按照一個從無到有的過程來展開。所有的資料,來自於網際網路,用heritrix去抓取。對於抓取的資料,進行去重,去標籤,然後利用lucene 和 solr 進行索引和搜尋。整個課程,按照一個從無到有的過程來展開。所有的資料,來自於網際網路,用heritrix去抓取。對於抓取的資料,進行去重,去標籤,然後利用lucene 和 solr 進行索引和搜尋。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29212814/viewspace-1082403/,如需轉載,請註明出處,否則將追究法律責任。

相關文章