Usando o IRIS como um banco de dados vetorial
As capacidades integradas de busca vetorial do InterSystems IRIS nos permitem pesquisar dados não estruturados e semiestruturados. Os dados são convertidos em vetores (também chamados de ‘embeddings’) e, em seguida, armazenados e indexados no InterSystems IRIS para busca semântica, geração aumentada de recuperação (RAG), análise de texto, motores de recomendação e outros casos de uso.
Esta é uma demonstração simples do IRIS sendo usado como um banco de dados vetorial e de busca por similaridade no IRIS.
Pré-requisitos:
- Python
- InterSystems IRIS for Health – que será utilizado como o banco de dados vetorial
Repositório: https://github.com/piyushisc/vectorsearchusingiris
Passos a seguir:
- Clone o repositório.
- Abra o VS Code, conecte-se à instância e ao namespace desejados do IRIS e compile as classes.
- Abra o Terminal do IRIS e execute o comando
do ##class(vectors.vectorstore).InsertEmbeddings(), que lê o texto do arquivotext.txt, gera os embeddings e os armazena no IRIS. - Execute o comando
do ##class(vectors.vectorstore).VectorSearch("termos_de_busca")com as palavras desejadas para realizar a busca por similaridade. O IRIS retornará as três correspondências mais próximas.
Ir para o posto original escrito por @Piyush Adhikari
Discussão (0)1
