我需要一个选择,它将返回这样的结果。
SELECT * FROM MyTable WHERE Column1 CONTAINS 'word1 word2 word3'
我需要所有的结果,也就是说,这包括带有'word2 word3 word1'或'word1 word3 word2'或三者的任何其他组合的字符串。
所有的词都需要在结果中出现。
比较慢,但工作方法是包括***的单词。
SELECT * FROM mytable
WHERE column1 LIKE '%word1%'
OR column1 LIKE '%word2%'
OR column1 LIKE '%word3%'
如果你需要***所有的词都出现,就用这个。
SELECT * FROM mytable
WHERE column1 LIKE '%word1%'
AND column1 LIKE '%word2%'
AND column1 LIKE '%word3%'
如果你想要更快的话,你需要研究一下全文搜索,这对每个数据库类型来说都是非常具体的。
请注意,如果你使用LIKE
来确定一个字符串是否是另一个字符串的子串,你必须在你的搜索字符串中转义匹配模式的字符。
如果你的 SQL 方言支持 CHARINDEX
,那么使用它就容易多了。
SELECT * FROM MyTable
WHERE CHARINDEX('word1', Column1) > 0
AND CHARINDEX('word2', Column1) > 0
AND CHARINDEX('word3', Column1) > 0
另外,请记住,这个和接受答案中的方法只涵盖了子串匹配而不是单词匹配。
所以,例如,字符串'word1word2word3'
仍然会匹配。
CREATE FUNCTION [dbo].[fnSplit] ( @sep CHAR(1), @str VARCHAR(512) )
RETURNS TABLE AS
RETURN (
WITH Pieces(pn, start, stop) AS (
SELECT 1, 1, CHARINDEX(@sep, @str)
UNION ALL
SELECT pn + 1, stop + 1, CHARINDEX(@sep, @str, stop + 1)
FROM Pieces
WHERE stop > 0
)
SELECT
pn AS Id,
SUBSTRING(@str, start, CASE WHEN stop > 0 THEN stop - start ELSE 512 END) AS Data
FROM
Pieces
)
DECLARE @FilterTable TABLE (Data VARCHAR(512))
INSERT INTO @FilterTable (Data)
SELECT DISTINCT S.Data
FROM fnSplit(' ', 'word1 word2 word3') S -- Contains words
SELECT DISTINCT
T.*
FROM
MyTable T
INNER JOIN @FilterTable F1 ON T.Column1 LIKE '%' + F1.Data + '%'
LEFT JOIN @FilterTable F2 ON T.Column1 NOT LIKE '%' + F2.Data + '%'
WHERE
F2.Data IS NULL
而不是SELECT * FROM MyTable WHERE Column1 CONTAINS 'word1 word2 word3'
。
在这些词之间加上And,比如
SELECT * FROM MyTable WHERE Column1 CONTAINS 'word1 And word2 And word3'
详情请看这里 https://msdn.microsoft.com/en-us/library/ms187787.aspx
更新
选择短语时,使用双引号,如。
SELECT * FROM MyTable WHERE Column1 CONTAINS '"Phrase one" And word2 And "Phrase Two"'
*p.s.在使用包含关键字之前,你必须首先启用表格的全文搜索。 更多详情,请看这里 https://docs.microsoft.com/en-us/sql/relational-databases/search/get-started-with-full-text-search
如果你使用的是Oracle数据库,那么你可以使用contains查询来实现。 Contains查询的速度比like查询快。
如果你需要所有的词
SELECT * FROM MyTable WHERE CONTAINS(Column1,'word1 and word2 and word3', 1) > 0
如果你需要任何字
SELECT * FROM MyTable WHERE CONTAINS(Column1,'word1 or word2 or word3', 1) > 0
包含在您的列上的CONTEXT类型的需求索引。
CREATE INDEX SEARCH_IDX ON MyTable(Column) INDEXTYPE IS CTXSYS.CONTEXT
如果你只是想找一个合适的。
SELECT * FROM MyTable WHERE INSTR('word1 word2 word3',Column1)<>0
SQL Server :
CHARINDEX(Column1, 'word1 word2 word3', 1)<>0
要获得精确的匹配。
例(';a;ab;ac;',';b;')
不会得到匹配。
SELECT * FROM MyTable WHERE INSTR(';word1;word2;word3;',';'||Column1||';')<>0
如果使用sql server全文搜索的话,这应该是理想的做法。 然而,如果你不能在你的DB上因为某些原因而无法工作,这里有一个性能密集型的解决方案:-。
-- 搜索的表格
创建表dbo.myTable。
(
myTableId int NOT NULL IDENTITY(1,1)。
代码 varchar(200) NOT NULL,
description varchar(200) NOT NULL -- 这一列包含了我们要搜索的值。
)上的[主要]。
去
-- 将空格分隔的搜索字符串分割成单个单词的功能
创建函数[dbo].[fnSplit](@StringInput nvarchar(max),
@Delimiter nvarchar(1))
返回 @OutputTable TABLE (
id nvarchar(1000)
)
AS
BEGIN
DECLARE @String nvarchar(100);
WHILE LEN(@StringInput) >
BEGIN
SET @String = LEFT(@StringInput, ISNULL(NULLIF(CHARINDEX(@Delimiter, @StringInput) - 1, -1),
LEN(@StringInput))。
SET @StringInput = SUBSTRING(@StringInput, ISNULL(NULLIF(CHARINDEX)
(
@Delimiter, @StringInput
),
),LEN
(
@StringInput)
)
+ 1, LEN(@StringInput))。
INSERT INTO @OutputTable (id)
VALUES(@String)。
END.RETURN; (@String)
RETURN;
END;
去
-- 这是搜索脚本,可以选择转换为存储程序/函数。
declare @search varchar(max) = '急性上呼吸道感染';
-- 在这里输入您的搜索字符串
-- 上面搜索的字符串应该给出包含以下内容的行数。
-- -- 上腹部感染,伴有急性泌尿道感染;
-- 上牙急性感染;
-- 急性泌尿道疼痛
if (len(trim(@search)) = 0) -- 如果搜索字符串为空,只需返回按字母顺序排列的记录。
开始
从myTable中选择1作为优先级,myTableid,代码,描述,按描述排序。
返回。
结束
声明 @splitTable Table(
wordRank int Identity(1,1), -- 单个词的优先级排序(按出现的顺序/位置)。
字词 varchar(200)
)
从搜索
id varchar(200)
)
插入到@nonWordTable值
('的')。
('与')。
('在')。
('中')。
('为')。
('上')。
('由')。
('喜欢')。
('上')。
('关')。
('附近')。
('是')。
('是')。
(','),
(':'),
(';')
插入到@splitTable中
select id from dbo.fnSplit(@search,'
');
-- 这个函数给你一个包含所有空格分隔的搜索词的表格,比如,输出将是 -- -- -- -- -- -- -- -- -- -- -- -- -- 。
-- 同上
-------------
-- 感染
-- 上层
-- 急症
-- 基尼托
从@splitTable s中删除s join @nonWordTable n on s.word = n.id;
-- 在这里删去非字表
声明 @countOfSearchStrings int = (select count(word) from @splitTable);
-- 用于搜索的空格隔开的词的数量
声明 @highestPriority int = POWER(@countOfSearchStrings,3)。
用 plainMatches 作为
(
select myTableid, @highestPriority as Priority from myTable where Description like @search -- exact matches have highest priority.
联盟
select myTableid, @highestPriority-1 as Priority from myTable where Description like @search + '%'
-- 然后在最后加上一些内容
联盟
select myTableid, @highestPriority-2 as Priority from myTable where Description like '%'
+ @search -- 然后在开头加上一些内容。
联盟
select myTableid, @highestPriority-3 as Priority from myTable where Description like '%'
+ @search + '%'。
-- 如果这个词介于两者之间
),
splitWordMatches as(--根据每个搜索词在搜索字符串中的位置,给它一个排名。
-- 并在要搜索的字段中计算其字符索引。
选择 myTable.myTableid, (@countOfSearchStrings - s.wordRank) 为 Priority, s.word,
wordIndex = CHARINDEX(s.word, myTable.Description) from myTable join @splitTable s on myTable.Description like '%'+ s.word + '%'
-- 并且不存在(select myTableid from plainMatches p where p.myTableId = myTable.myTableId) -- 不需要查看已经在 plainmatches 中找到的 myTable,因为它们是最高级别的。
),
matchingRowsWithAllWords为(
从 splitWordMatches 中选择 myTableid, count(myTableid) 作为 myTableCount group by(myTableid) having count(myTableid) = @countOfSearchStrings。
)
,--如果你不关心优先考虑的词的顺序,就把这里的CTE删掉。
wordIndexRatings as(--将上面重新检索的char indexs倒过来,使前面出现的词有更高的权重。
-- 然后将它们归一化为连续的数值。
选择s.myTableid, Priority, word, ROW_NUMBER() over (partition by s.myTableid order by wordindex desc) as comparativeWordIndex。
从 splitWordMatches s join matchingRowsWithAllWords m on s.myTableId = m.myTableId。
)
,
wordIndexSequenceRatings为(--需要做到这一点,以确保在两行中找到搜索字符串中的同一组单词。
-- 它们在字段值中的顺序被考虑为更高的优先级。
选择w.myTableid, w.word, (w.Priority + w.comparativeWordIndex + coalesce(sequncedPriority ,0))作为优先级。
从wordIndexRatings w左起加入
(
选择 w1.myTableid, w1.priority, w1.word, w1.comparativeWordIndex, count(w1.myTableid) 作为 sequncedPriority。
from wordIndexRatings w1 join wordIndexRatings w2 on w1.myTableId = w2.myTableId and w1.Priority >
w2.Priority and w1.comparativeWordIndex>w2.comparativeWordIndex。
按w1.myTableid, w1.priority,w1.word, w1.comparativeWordIndex分组。
)
sequencedPriority on w.myTableId = sequencedPriority.myTableId and w.Priority = sequencedPriority.Priority。
),
prioritizedSplitWordMatches作为( -- 这将计算一个字段值的累积优先级。
select w1.myTableId, sum(w1.Priority) as OverallPriority from wordIndexSequenceRatings w1 join wordIndexSequenceRatings w2 on w1.myTableId = w2.myTableId。
其中w1.word <>.w2.word按w1.myTableid分组。
w2.word 按w1.myTableid分组。
),
作为(
从plainMatches中选择myTableid, priority -- 得到排名最高的plain matches。
联盟
从prioritizedSplitWordMatches中选择myTableid, OverallPriority作为优先级 -- 获得有排名的分割词匹配(根据搜索字符串和序列中的词排名来排序)。
),
maximizedCompleteSet as( -- 设置字段值的优先级=该字段值的最大优先级。
选择myTableid, max(priority) as Priority from completeSet group by myTableId。
)
select priority, myTable.myTableid , code, Description from maximizedCompleteSet m join myTable on m.myTableId = myTable.myTableId。
按优先级降序排列,描述 -- 按优先级降序排列,将评分最高的项目排在最前面。
--偏移0行,只取下50行 -- 可选分页
为什么不使用"in"。 而不是用"in"?
Select *
from table
where columnname in (word1, word2, word3)
实现问题中提到的最简单的方法之一是使用CONTAINS与NEAR或'~'。 例如,下面的查询将给我们提供所有具体包括word1、word2和word3的列。
SELECT * FROM MyTable WHERE CONTAINS(Column1, 'word1 NEAR word2 NEAR word3')
SELECT * FROM MyTable WHERE CONTAINS(Column1, 'word1 ~ word2 ~ word3')
此外,CONTAINSTABLE还根据"word1"、"word2".和"word3"的相近程度为每个文档返回一个排名。 和 "word3"。 例如,如果一个文档包含句子,"word1是word2和word3,"。 其排名就会很高,因为这些词比其他文档中的词更接近。
我还想补充的一点是,我们还可以使用proximity_term来查找列词之间在列词组内特定距离内的列词。
1:
DECLARE @SearchStr nvarchar(100)
SET @SearchStr = ' '
CREATE TABLE #Results (ColumnName nvarchar(370), ColumnValue nvarchar(3630))
SET NOCOUNT ON
DECLARE @TableName nvarchar(256), @ColumnName nvarchar(128), @SearchStr2 nvarchar(110)
SET @TableName = ''
SET @SearchStr2 = QUOTENAME('%' + @SearchStr + '%','''')
WHILE @TableName IS NOT NULL
BEGIN
SET @ColumnName = ''
SET @TableName =
(
SELECT MIN(QUOTENAME(TABLE_SCHEMA) + '.' + QUOTENAME(TABLE_NAME))
FROM INFORMATION_SCHEMA.TABLES
WHERE TABLE_TYPE = 'BASE TABLE'
AND QUOTENAME(TABLE_SCHEMA) + '.' + QUOTENAME(TABLE_NAME) > @TableName
AND OBJECTPROPERTY(
OBJECT_ID(
QUOTENAME(TABLE_SCHEMA) + '.' + QUOTENAME(TABLE_NAME)
), 'IsMSShipped'
) = 0
)
WHILE (@TableName IS NOT NULL) AND (@ColumnName IS NOT NULL)
BEGIN
SET @ColumnName =
(
SELECT MIN(QUOTENAME(COLUMN_NAME))
FROM INFORMATION_SCHEMA.COLUMNS
WHERE TABLE_SCHEMA = PARSENAME(@TableName, 2)
AND TABLE_NAME = PARSENAME(@TableName, 1)
AND DATA_TYPE IN ('char', 'varchar', 'nchar', 'nvarchar', 'int', 'decimal')
AND QUOTENAME(COLUMN_NAME) > @ColumnName
)
IF @ColumnName IS NOT NULL
BEGIN
INSERT INTO #Results
EXEC
(
'SELECT ''' + @TableName + '.' + @ColumnName + ''', LEFT(' + @ColumnName + ', 3630) FROM ' + @TableName + ' (NOLOCK) ' +
' WHERE ' + @ColumnName + ' LIKE ' + @SearchStr2
)
END
END
END
SELECT ColumnName, ColumnValue FROM #Results
DROP TABLE #Results