oracle全文索引之LEXER_3_DEFAULT_LEXER

jolly10發表於2009-05-18
本文繼續介紹Oracle全文索引的LEXER屬性,這篇文章介紹Oracle多語言全文索引DEFAULT_LEXER[@more@]

要是DEFAULT_LEXER其實並不複雜,但是確實最常使用的,無論是明確給出DEFAULT_LEXER屬性還是不指定LEXER屬性,Oracle都會使用DEFAULT_LEXER作為LEXER的預設屬性。

但是DEFAULT_LEXER並不是一個真正意義上的LEXEROracle9i的文件上描述的是,如果資料庫在建立的時候指定的是中文則DEFAULT_LEXERCHINESE_VGRAM_LEXER,如果是英文,則DEFAULT_LEXERBASIC_LEXER

但是我在很多Oracle9i的環境下進行測試,發現無論按照時指定中文還是英文,DEFAULT_LEXER的值都是BASIC_LEXER

SQL> CONN SYSTEM/MANAGER@DEMO2已連線。
SQL> SELECT NAME, VALUE$ FROM SYS.PROPS$ WHERE NAME = 'NLS_LANGUAGE';

NAME VALUE$
---------------------------------------- --------------------
NLS_LANGUAGE SIMPLIFIED CHINESE

SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(1000));

表已建立。

SQL> INSERT INTO T VALUES (1, '一箇中文例子,測試預設的語法屬性是否可以正常識別中文。');

已建立 1 行。

SQL> INSERT INTO T VALUES (2, '根據Oracle的文件,資料庫的預設語言是中文會採用CHINA_VGRAM_LEXER');

已建立 1 行。

SQL> COMMIT;

提交完成。

SQL> CREATE INDEX IND_T_DOCS ON T(DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('LEXER CTXSYS.DEFAULT_LEXER');

索引已建立。

SQL> SELECT * FROM T WHERE CONTAINS(DOCS, '中文') > 0;

未選定行

SQL> SELECT PRE_NAME, PRE_OBJECT FROM CTX_PREFERENCES WHERE PRE_NAME = 'DEFAULT_LEXER';

PRE_NAME PRE_OBJECT
------------------------------ ------------------------------
DEFAULT_LEXER BASIC_LEXER

SQL> SELECT * FROM V$VERSION;

BANNER
----------------------------------------------------------------
Oracle9i Enterprise Edition Release 9.2.0.4.0 - Production PL/SQL Release 9.2.0.4.0 - Production
CORE 9.2.0.3.0 Production
TNS for Linux: Version 9.2.0.4.0 - Production
NLSRTL Version 9.2.0.4.0 - Production

看來Oracle的文件在這裡的描述有問題,或者Oracle的實現上和文件不一致。

但是測試發現Oracle10.2.0中,如果按照的時候選擇了中文,則DEFAULT_LEXER屬性的值為CHINESE_VGRAM_LEXER

SQL> CONN YANGTK/YANGTK@YTK已連線。
SQL> SELECT NAME, VALUE$ FROM SYS.PROPS$ WHERE NAME = 'NLS_LANGUAGE';

NAME VALUE$
---------------------------------------- --------------------
NLS_LANGUAGE SIMPLIFIED CHINESE

SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(1000));

表已建立。

SQL> INSERT INTO T VALUES (1, '一箇中文例子,測試預設的語法屬性是否可以正常識別中文。');

已建立 1 行。

SQL> INSERT INTO T VALUES (2, '根據Oracle的文件,資料庫的預設語言是中文會採用CHINA_VGRAM_LEXER');

已建立 1 行。

SQL> COMMIT;

提交完成。

SQL> CREATE INDEX IND_T_DOCS ON T(DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('LEXER CTXSYS.DEFAULT_LEXER');

索引已建立。

SQL> SELECT * FROM T WHERE CONTAINS(DOCS, '中文') > 0;

ID DOCS
---------- ------------------------------------------------------------------
1
一箇中文例子,測試預設的語法屬性是否可以正常識別中文。
2
根據Oracle的文件,資料庫的預設語言是中文會採用CHINA_VGRAM_LEXER

SQL> SELECT PRE_NAME, PRE_OBJECT FROM CTX_PREFERENCES WHERE PRE_NAME = 'DEFAULT_LEXER';

PRE_NAME PRE_OBJECT
------------------------------ ------------------------------
DEFAULT_LEXER CHINESE_VGRAM_LEXER

SQL> SELECT * FROM V$VERSION;

BANNER
----------------------------------------------------------------
Oracle Database 10g Enterprise Edition Release 10.2.0.1.0 - Prod
PL/SQL Release 10.2.0.1.0 - Production
CORE 10.2.0.1.0 Production
TNS for 32-bit Windows: Version 10.2.0.1.0 - Production
NLSRTL Version 10.2.0.1.0 - Production

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/271283/viewspace-1022232/,如需轉載,請註明出處,否則將追究法律責任。

相關文章