Inovando por uma Elegância Generativa

Artigo

Heloisa Paiva · Jul. 27 4min de leitura

Open Exchange

#Artificial Intelligence (AI) #Generative AI (GenAI) #Machine Learning (ML) #Natural Language Processing #InterSystems IRIS

Público

Aqueles interessados em explorar novos casos de uso da IA Generativa

Compartilha ideias e a lógica por trás do treinamento de IA generativa para reconhecimento de padrões.

Desafio 1 - Simples, mas não simplista

Um desenvolvedor aspira a conceber uma solução elegante para requisitos. O reconhecimento de padrões (como expressões regulares) pode ser resolvido de várias maneiras. Qual delas é a melhor solução de código?

Uma IA pode postular uma solução elegante de reconhecimento de padrões para uma variedade de amostras de dados, do simples ao complexo?

Considere os três valores de string:

"AA"
"BB"
"CC"

A expressão: "2 caracteres alfabéticos" corresponde a todos esses valores e a outros valores intuitivamente semelhantes de forma geral e flexível.

Alternativamente, a expressão: "AA" ou "BB" ou "CC" seria uma forma muito específica de corresponder apenas a estes valores:

Outra forma de resolver seria: "A" ou "B" ou "C", duas vezes.

Desafio 2 - Amostra incompleta

Os problemas de padrões raramente têm todos os exemplos especificados. Uma IA performática precisa aceitar uma amostra limitada e incompleta de linhas de dados e postular uma expressão de reconhecimento de padrões razoável.

Um objetivo de Turing seria atingir a paridade com a inferência humana para um padrão de dados representativos, mas incompletos.

Uma melhor qualidade de processamento de amostras é uma prioridade maior do que expandir a janela de tokens para amostras maiores.

Desafio 3 - Aproveitando sequências repetidas

Estendendo o exemplo anterior, para incluir também valores de um único caractere.

Isso parece mais elegante do que especificar TODOS os valores possíveis por extenso.

 if test?1(1"A",1"B",1"C",1"AA",1"BB",1"CC")

Desafio 4 - Vício em dados delimitados

Uma necessidade comum, além de padrões generalizados, é resolver dados delimitados. Por exemplo, um formato de número de telefone aleatório:

213-5729-57986

Poderia ser resolvido pela expressão:
3 numéricos, traço, 4 numéricos, traço, 4 numéricos

 if test?3N1"-"4N1"-"4N

Isso pode ser normalizado com a sequência de repetição para:

 if test?3N2(1"-"4)

Essencialmente, isso significa ter uma preferência por especificar explicitamente um delimitador, por exemplo "-", em vez de generalizar os delimitadores como caracteres de pontuação. Assim, a saída gerada deve preferir evitar a supergeneralização, por exemplo:

 if test?3N1P4N1P4N

Desafio 5 - Sequências repetidas

Considere números formatados com códigos de prefixo comuns.

O modelo de IA detecta três sequências comuns nos valores e direciona a solução para refletir um interesse nesse recurso:

Nesta ocasião, a IA decidiu gerar uma correspondência de string "13" supérflua.

No entanto, conforme indicado pela ferramenta, o padrão corresponderá a todos os valores fornecidos.

O padrão pode ser facilmente ajustado na descrição de texto livre e regenerado.

Velocidade de inferência

A assistência da Workbench AI com sucesso parcial qualificado pode ser um acelerador para a implementação.

Acima de um certo limite de complexidade, um assistente de IA pode deduzir propostas mais rapidamente do que a análise manual.

Considere a seguinte tentativa de inferência de IA com sucesso parcial qualificado:

O assistente de IA usa o maior número de linhas de dados que consegue encaixar em sua janela de contexto de tokens para processamento, pulando o excesso de linhas de dados.

O número de linhas é quantificado na saída gerada, mostrando como os dados foram truncados para a inferência.

Isso pode ser útil para elevar as linhas de dados preferidas de volta à janela de contexto para um reprocessamento refinado.

Esforço de treinamento

ndo como alvo a GPU Nvidia Cuda A10 no Huggingface.

Treinamento de modelo supervisionado.

Estágio	Treinamento contínuo da GPU
Protótipo do conjunto de dados de base	4 dias
Conjunto de dados principal	13 dias
Segundo conjunto de dados refinado	2 dias

Conclusão

A inferência generativa de disparo único com tamanho de token limitado pode abordar de forma útil a elegância da solução de código discreto na ausência de processamento "chain-of-thought", selecionando o viés do especialista no assunto nos dados de treinamento de base.

Os assistentes de IA podem participar em fluxos de trabalho de solução iterativos.

Saiba mais

Experimente a demonstração de tecnologia atualmente hospedada via Huggingface. O símbolo de engrenagem nos botões da demonstração indica onde a geração de IA está sendo empregada.

Demonstração escrita para o público de inglês, francês e espanhol.

Confira o aplicativo relacionado no InterSystems Open Exchange

Ir para o posto original escrito por @Alex Woodhead