Artigo
· Maio 27 4min de leitura

Studio IRIS AI Studio: Playground para explorar as capacidades RAG sobre as incorporações de vetores da IRIS DB

No artigo anterior, vimos detalhes a respeito dos conectores, que permitem que o usuário carregue o arquivo, o converta para incorporações e armazene na IRIS DB. Nesse artigo, vamos explorar opções diferentes de recuperações que o Studio IRIS AI oferece: Semantic Search (pesquisa semântica), Chat (conversa), Recommender (recomendação) e Similarity (similaridade).

Novas atualizações  ⛴️ 

  • Adicionada instalação pelo Docker. Rode `./build.sh` após clonagem para ter a aplicação e a instância IRIS rodando na sua máquina local.
  • Conecte via InterSystems Extension no vsCode - Graças ao @Evgeny Shvarov 
  • Adicionado FAQ's na página principal que cobre a informação básica para novos usuários.

Semantic Search - Pesquisa semântica

Semantic Search é um método para recuperar dados que busca entender a intenção do usuário e o contexto da consulta ao invés de  somente palavras chave que combinam. Ele considera a relações entre palavras e conceitos, indo além de uma simples combinação de palavras chave.

A construção através da criação de índice e carregamento de dados na IRIS DB foi coberta no artigo anterior, no código de Connectors, e agora começamos com o índice e rodamos a máquina de consulta:

Ref. a `query_llama.py`

query_engine = index.as_query_engine()
response = query_engine.query(query)

 

Chat Engine - Máquina de Chat

A Chat Engine - máquina de chat aumenta o conteúdo carregado e age como uma versão de estados da máquina de consult "query_engine" anterior. Ela mantém o rastreio do histórico da conversa e pode responder perguntas com esse contexto passado em "mente".

Ref. a `chat_llama.py`

chat_engine = index.as_chat_engine(chat_mode='condense_question')
response = chat_engine.chat(user_message)

 

Recommender - Recomendador

O Recommender - Recomendador é similar aos sistemas de recomendação usados nos sites de e-commerce, onde produtos similares são exibidos abaixo do produto que procuramos. O Recommender and Similarity RAG (Retrieval-augmented generation) - RAG (Geração aumentada de recuperação) de Recomendação e Similaridade também cai em aspectos similares, mas no Recommender, você pode escolher o modelo de rankeamento LLM (Large Language Model - Grande Modelo de Linguagem) a ser usado.

Ref. to `reco_llama.py`

if reco_type == 'cohere_rerank':
    cohere_rerank = CohereRerank(api_key=cohere_api_key, top_n=results_count)
    query_engine = index.as_query_engine(
        similarity_top_k=10,
        node_postprocessors=[cohere_rerank],
    )
    response = query_engine.query(query)

elif reco_type == 'openai_rerank':
    rankgpt_rerank = RankGPTRerank(
        llm=OpenAI(
            model="gpt-3.5-turbo-16k",
            temperature=0.0,
            api_key=openai_api_key,
        ),
        top_n=results_count,
        verbose=True,
    )
    query_engine = index.as_query_engine(
        similarity_top_k=10,
        node_postprocessors=[rankgpt_rerank],
    )
    response = query_engine.query(query)

Similarity - Similaridade

O recurso Similarity - Similaridade retorna uma pontuação de similaridade, que ajuda a avaliar a qualidade do sistema de respostas via similaridade semântica. Você pode filtrar os resultados baseados em um mínimo de pontuação de similaridade e o número de intens similares para retornar da base DB (Database - Base de Dados)

Ref. a `similarity_llama.py`

retriever = index.as_retriever(similarity_top_k=top_k)
nodes = retriever.retrieve(query)

 

Ao nivelar essas diferentes opções de recuperação de dados no Stuio IRIS AI, incluindo Semantic Search, Chat Engine, Recommender e Similarity, os usuários podem explorar o potencial dos seus dados. Esses atributos permitem recuperação avançada de informações, respostas a perguntas de contexto, recomendações pessoais e análises de similaridade semântica, empoderando usuários a obter percepções valiosas e fazer decisões baseadas nos dados (ao menos para construir similares no seu domínio).

By leveraging these different retrieval options at IRIS AI Studio, including Semantic Search, Chat Engine, Recommender, and Similarity, users can explore the potential of their data. These features enable advanced information retrieval, contextual question answering, personalized recommendations, and semantic similarity analysis, empowering users to derive valuable insights and make data-driven decisions (at least to build similar ones in their domain).

🚀 Vote por essa aplicação na competição de Vector Search, GenAI and ML, se acreditar que ela tem futuro!

Fique à vontade para compartilhar qualquer feedabck ou entradas que tiver. Obrigado.

Discussão (0)1
Entre ou crie uma conta para continuar