coreseek實戰(二):windows下mysql資料來源部分配置說明

樑子很威武發表於2016-11-22

coreseek實戰(二):windows下mysql資料來源部分配置說明

關於coreseek在windows使用mysql資料來源的配置,以及中文分詞的詳細說明,請參考官方文件:

mysql資料來源配置:http://www.coreseek.cn/products-install/mysql/

中文分詞:http://www.coreseek.cn/products-install/coreseek_mmseg/

我這裡的配置根據dedecms的dede_archives/dede_addonarticle兩張表來配置,只是基本的應用,還沒有使用到分割槽段查詢和增量索引等;另外,全域性indexer和searchd服務這兩個配置都沒有修改,預設即可。只是改動了source資料來源和indexer定義。如下:

複製程式碼
#MySQL資料來源配置,詳情請檢視:http://www.coreseek.cn/products-install/mysql/

#源定義
source dede
{
    type            = mysql                #資料來源型別,這裡使用mysql
    sql_host        = localhost            #mysql資料來源主機地址
    sql_user        = root                #連線到sql_host的使用者名稱
    sql_pass        = 123456            #密碼,不用說
    sql_db          = dedecmsv57gbksp1    #資料庫名
    sql_port        = 3306                #資料庫埠,mysql預設3306
    sql_query_pre   = SET NAMES utf8    #預查詢,指定伺服器返回行時使用的字元編碼,必須與下面的charset_type一致

    #sql_query 獲取文件主查詢,只能有一個主查詢。它被用來從sql伺服器獲取文件
    #sql_query 第一列id需為整數,而且必須是唯一的正整數值
    #title、body、description作為字串/文字欄位,被全文索引
    #不屬於文件ID(第一列),以及不屬於屬性的列(下面sql_attr_* 設定的),都會被用於建立全文索引
    sql_query = SELECT arc.id, arc.typeid, arc.typeid2, arc.click, arc.title, arc.pubdate, arc.senddate,  arc.description, art.body from dede_archives as arc left join dede_addonarticle as art on arc.id=art.aid        
    
    #下面是設定屬性欄位,通過api例項化sphinx物件後,可用setFilter進行過濾,或者按時間段來排序等
    #sql_attr_uint          = hit        #從SQL讀取到的值必須為整數
    #sql_attr_timestamp     = dates        #從SQL讀取到的值必須為整數,作為時間屬性
    sql_attr_uint            = typeid
    sql_attr_uint            = typeid2
    sql_attr_uint            = click
    sql_attr_timestamp        = pubdate
    sql_attr_timestamp        = senddate
    
}

#index定義
index dede
{
    source            = dede               #對應的source名稱
    path            = var/data/dedecms #請修改為實際使用的絕對路徑,例如:/usr/local/coreseek/var/...
    docinfo            = extern
    mlock            = 0
    morphology        = none
    min_word_len    = 1
    html_strip        = 0

    #中文分詞配置,詳情請檢視:http://www.coreseek.cn/products-install/coreseek_mmseg/   
    #Windows環境下設定,/符號結尾,最好給出絕對路徑,例如:C:/usr/local/coreseek/etc/...
    #mmseg.ini中文分詞路徑
    charset_dictpath    = d:/www/coreseek/etc/
    
    #開啟了該選項,則預設開啟了中文分詞
    charset_type        = zh_cn.utf-8
    
    #取消預設的一元字元切分模式,不對中文分詞產生干擾(當啟用了中文分詞,則不必再設定選項了)
    ngram_len            = 0
    
    #啟用停頓詞
    stopwords            = D:/www/coreseek/etc/stopwords.txt    
}

#全域性index定義
indexer
{
    mem_limit            = 128M
}

#searchd服務定義
searchd
{
    listen              = 9312
    read_timeout        = 5
    max_children        = 30
    max_matches         = 1000
    seamless_rotate     = 0
    preopen_indexes     = 0
    unlink_old          = 1
    pid_file = var/log/searchd_mysql.pid  #請修改為實際使用的絕對路徑,例如:/usr/local/coreseek/var/...
    log = var/log/searchd_mysql.log        #請修改為實際使用的絕對路徑,例如:/usr/local/coreseek/var/...
    query_log = var/log/query_mysql.log #請修改為實際使用的絕對路徑,例如:/usr/local/coreseek/var/...
}
複製程式碼

相關文章