2024年3月7日发(作者:漆雕书易)
表和图说明。(2) 位置算符(1) 逻辑算符 (W)与(nW)算符
三种逻辑关系(阴影部分为命中)
AND, OR,最可靠的办法是将需先执行的部分放在括号内。
、逻辑或(or)两个检索词之间的逻辑关系,常用的有三种:逻辑与(and)
逻辑算符(logical operator), 也称布尔算符(Boolean operator),用来表示和逻辑非(not)。这里用A和B分别代表两个检索词,它们的逻辑关系由下 位置算符(proximation operator),表示其连接的两个检索词之间的位置关系,常用的有(W), (nW), (N), (nN), (L), (S), (F)等。 如果一个检索式中包含若干逻辑关系,则其执行优先顺序为: NOT,
现,中间不允许插词,只能有一空格或标点、符号。W是with的缩写。(W)或用( )表示其连接的两个检索词必须按序出
high-class。sensor等。 (S)算符段不限,词序不限。 如:silicon(S)sensor 命中记录出现的匹配情况如:字段中。子字段是指字段中的一部分,如一句句子,一个词组、短语。字 S是Subfield的缩写。(S)表示其连接的两个检索词必须出现在同一子 如:high(W)class 命中的记录中出现的匹配词可能有:high class 或 (F)算符 (N)与(nN)算符词间不允许插词。(nN)中的n表示允许插词量少于或等于n个。 (nW)与(W)类似, 只是它允许插词,插词量小于或等于n个。 如:internet(N)accessing 命中记录中出现的匹配词可能有: internet accessing, accessing internet。 如:internet(1N)accessing 命中记录中除上例的外,还会可能有:能会有:silicon angular rate sensor, silicon-based chemical sensor等等。 N是near的缩写。(N)表示其连接的两个检索词的顺序可以互易,但两 如:silicon(2W)sensor 命中的记录中出现的匹配词除上例的外,还可accessing internet, accessing the internet, internet /intranet accessing等。 如:silicon(1W)sensor 命中的记录中出现的匹配词除silicon sensor外,还可能有:silicon integrated sensor, silicon image sensor, silicon-based
fabricated and demonstrated. A vacuum magnetic sensor(VMS) using a silicon field emitter tip was
(3) 截词符 不同算符的比较其结果如表下所示。
的部分可放在括号内。中,字段不限,词序不限。 两个词由不同的算符组成不同的检索式,其检索结果显然不同,也 以上所有算符的书写用大小写均可。算符执行的优先顺序是按检词之间的关系紧密程度确定的,越紧的关系越先执行。一般将需要先执行的算符其检索结果中的记录一定比用关系较松的来得少。以下用 除了"逻辑非"和"逻辑与"不能确定外,这些算符按关系的松紧排序,其检索结果、命中记录的数量也是有序的。就是说检索策略的变化将影响检索的结果。比如同样两个词用关系较紧electron和device 两词为例,在Dialog 8号文档Ei Compendex数据库检索, F是Field 的缩写。(F)表示其连接的两个检索词必须出现在同一字段
截词符(truncation operator),也称统配符(wild card), 用来对检索词(干)进行扩展。在Dialog系统中用 ? 号表示。?号加在不完整的词或词干之后,或是插在一个词的中间来表示词后或词中可添加的随机字符。其作用是减少检索词的输入而保证相关检索概念的涵盖,同时也方便解决语言文字拼写方面的差异(如美式英语和英式英语),避免漏检。截词有:非限定性截词、限定性截词和中间截词等。 中间截词 中间截词(embedded truncation), 是在一词中间出现若干个?号,表示可插入若干个字符。 如:ioni?ation将对ionisation和ionization进行检索。 如:cent??line将对centerline和centreline进行检索。
限定性截词
限定性截词(limited truncation), 是在一个词尾加有限个 ?号,n个
号表示其后可添加的字符数少于等于n个。 如:smok??将对smoke, smoky, smoked, smoker, smokes等进行检索。对于最多允许添加一个字符的情况, 则用 ? ? 的形式表示。 如;smok? ?将只对 smoke, smoky进行检索。
非限定性截词 截词符(truncation operator),是在一个词尾加一个 ? 号,表示在其后可添加任意多个字符,这些字符都被作为检索词进行检索。 如:smok?将对若干词进行检索,包括:smoke, smoky, smoked, smoker,
smokes, smokers, smoking, smokeless等等。
2024年3月7日发(作者:漆雕书易)
表和图说明。(2) 位置算符(1) 逻辑算符 (W)与(nW)算符
三种逻辑关系(阴影部分为命中)
AND, OR,最可靠的办法是将需先执行的部分放在括号内。
、逻辑或(or)两个检索词之间的逻辑关系,常用的有三种:逻辑与(and)
逻辑算符(logical operator), 也称布尔算符(Boolean operator),用来表示和逻辑非(not)。这里用A和B分别代表两个检索词,它们的逻辑关系由下 位置算符(proximation operator),表示其连接的两个检索词之间的位置关系,常用的有(W), (nW), (N), (nN), (L), (S), (F)等。 如果一个检索式中包含若干逻辑关系,则其执行优先顺序为: NOT,
现,中间不允许插词,只能有一空格或标点、符号。W是with的缩写。(W)或用( )表示其连接的两个检索词必须按序出
high-class。sensor等。 (S)算符段不限,词序不限。 如:silicon(S)sensor 命中记录出现的匹配情况如:字段中。子字段是指字段中的一部分,如一句句子,一个词组、短语。字 S是Subfield的缩写。(S)表示其连接的两个检索词必须出现在同一子 如:high(W)class 命中的记录中出现的匹配词可能有:high class 或 (F)算符 (N)与(nN)算符词间不允许插词。(nN)中的n表示允许插词量少于或等于n个。 (nW)与(W)类似, 只是它允许插词,插词量小于或等于n个。 如:internet(N)accessing 命中记录中出现的匹配词可能有: internet accessing, accessing internet。 如:internet(1N)accessing 命中记录中除上例的外,还会可能有:能会有:silicon angular rate sensor, silicon-based chemical sensor等等。 N是near的缩写。(N)表示其连接的两个检索词的顺序可以互易,但两 如:silicon(2W)sensor 命中的记录中出现的匹配词除上例的外,还可accessing internet, accessing the internet, internet /intranet accessing等。 如:silicon(1W)sensor 命中的记录中出现的匹配词除silicon sensor外,还可能有:silicon integrated sensor, silicon image sensor, silicon-based
fabricated and demonstrated. A vacuum magnetic sensor(VMS) using a silicon field emitter tip was
(3) 截词符 不同算符的比较其结果如表下所示。
的部分可放在括号内。中,字段不限,词序不限。 两个词由不同的算符组成不同的检索式,其检索结果显然不同,也 以上所有算符的书写用大小写均可。算符执行的优先顺序是按检词之间的关系紧密程度确定的,越紧的关系越先执行。一般将需要先执行的算符其检索结果中的记录一定比用关系较松的来得少。以下用 除了"逻辑非"和"逻辑与"不能确定外,这些算符按关系的松紧排序,其检索结果、命中记录的数量也是有序的。就是说检索策略的变化将影响检索的结果。比如同样两个词用关系较紧electron和device 两词为例,在Dialog 8号文档Ei Compendex数据库检索, F是Field 的缩写。(F)表示其连接的两个检索词必须出现在同一字段
截词符(truncation operator),也称统配符(wild card), 用来对检索词(干)进行扩展。在Dialog系统中用 ? 号表示。?号加在不完整的词或词干之后,或是插在一个词的中间来表示词后或词中可添加的随机字符。其作用是减少检索词的输入而保证相关检索概念的涵盖,同时也方便解决语言文字拼写方面的差异(如美式英语和英式英语),避免漏检。截词有:非限定性截词、限定性截词和中间截词等。 中间截词 中间截词(embedded truncation), 是在一词中间出现若干个?号,表示可插入若干个字符。 如:ioni?ation将对ionisation和ionization进行检索。 如:cent??line将对centerline和centreline进行检索。
限定性截词
限定性截词(limited truncation), 是在一个词尾加有限个 ?号,n个
号表示其后可添加的字符数少于等于n个。 如:smok??将对smoke, smoky, smoked, smoker, smokes等进行检索。对于最多允许添加一个字符的情况, 则用 ? ? 的形式表示。 如;smok? ?将只对 smoke, smoky进行检索。
非限定性截词 截词符(truncation operator),是在一个词尾加一个 ? 号,表示在其后可添加任意多个字符,这些字符都被作为检索词进行检索。 如:smok?将对若干词进行检索,包括:smoke, smoky, smoked, smoker,
smokes, smokers, smoking, smokeless等等。