T Sql Indexing Inequality

Entendendo `Testes de Desigualdade no T-SQL`: Explorando `AND NOT`, `!=` e `<>`

Testar desigualdades é um aspecto essencial na consulta a bancos de dados, e o T-SQL oferece várias maneiras de alcançar isso. Se você já se perguntou se deve usar AND NOT (t.id = @id), AND t.id != @id ou AND t.id <> @id, você não está sozinho. Neste post do blog, iremos nos aprofundar nessas diferentes abordagens, discutir suas implicações de desempenho e ajudar a esclarecer as melhores práticas para testes de igualdade no T-SQL.

As Opções de Desigualdade no T-SQL

Ao construir consultas em T-SQL, você pode se deparar com três expressões comuns de desigualdade:

Usando AND NOT:
```
AND NOT (t.id = @id)
```
Usando !=:
```
AND t.id != @id
```
Usando <>:
```
AND t.id <> @id
```

À primeira vista, essas expressões podem parecer intercambiáveis, mas vamos analisar como elas se comparam e discutir quaisquer diferenças de desempenho.

Planos de Execução

Quando você analisa os planos de execução para essas expressões, você encontrará que elas, essencialmente, produzem o mesmo resultado. Por exemplo, considere as seguintes instruções SQL:

DECLARE @id VARCHAR(40)
SELECT @id = '172-32-1176'

SELECT * FROM authors
WHERE au_id <> @id

SELECT * FROM authors
WHERE au_id != @id

SELECT * FROM authors
WHERE NOT (au_id = @id)

Em cada um desses casos, o plano de execução gerado será idêntico. Isso significa que, independentemente da sintaxe escolhida, o desempenho será bastante semelhante.

Considerações de Indexação

Embora os conjuntos de resultados e os planos de execução permaneçam consistentes entre essas expressões, o impacto potencial na indexação é crucial a ser considerado. Usar tanto != quanto <> pode, de fato, impedir o uso efetivo de índices:

Uso de Índice: A utilização de != ou <> pode, de fato, atrapalhar qualquer chance de utilização eficaz de índices. O mecanismo do SQL Server pode enfrentar dificuldades em otimizar o desempenho da consulta quando esses operadores estão envolvidos.
Usando AND NOT: Assim como != e <>, a cláusula AND NOT também sofre dessa limitação, já que a comparação subjacente (t.id = @id) ainda resulta em uma condição não indexável.

Seletividade do Índice

É importante notar que a eficácia de qualquer índice também dependerá de sua seletividade. Seletividade refere-se a quão únicos os valores indexados são em uma coluna:

Alta Seletividade: Se os valores na coluna de índice são, em sua maioria, únicos, usar <> ou != ainda pode resultar em consultas de desempenho satisfatório.
Baixa Seletividade: Por outro lado, se os valores não são distintos, a escolha do operador se torna menos relevante, uma vez que o mecanismo provavelmente escaneará mais da tabela, independentemente.

Melhores Práticas

Após considerar a mecânica desses operadores de desigualdade, aqui estão algumas melhores práticas:

Prefira <>: Muitos desenvolvedores T-SQL preferem usar <> pela clareza e aderência ao padrão, tornando-o imediatamente reconhecível como um operador de desigualdade.
Evite !=: Embora != também seja um operador válido, <> é o padrão ANSI SQL e é tipicamente favorecido para compatibilidade entre bancos de dados.
Use AND NOT Com Moderação: Empregue AND NOT quando a lógica exigir, mas fique atento ao seu impacto potencial no índice, assim como os outros operadores.