Big Data | Portuguese InterSystems Developer Community

Artigo

Danusa Calixto · jan 26, 2024 3min de leitura

Leia um arquivo parquet para um arquivo JSON e carregue no seu repositório do IRIS

De acordo com o Databricks, Apache Parquet é um formato de dados de código aberto orientado por colunas que é projetado para o armazenamento e recuperação de dados eficiente. Ele fornece esquemas eficientes de compactação e codificação de dados com um desempenho aprimorado para lidar com dados complexos em massa. O Apache Parquet foi criado para ser um formato de troca comum para ambas as cargas de trabalho em lote e interativas. É semelhante a outros formatos de arquivo de armazenamento colunar disponíveis no Hadoop, especificamente, RCFile e ORC.

#Big Data #HealthShare #InterSystems IRIS #InterSystems IRIS for Health

Open Exchange app

0 0

0 338

Artigo

Daniel Noronha ... · Jun. 9, 2023 2min de leitura

Como a InterSystems IRIS pode gerenciar grandes volumes de dados em real time?

Pesquisando sobre InterSystems IRIS e como ela pode transformar o negócio de uma organização me deparei com uma possibilidade: Como uma grande empresa pode melhorar sua eficiência operacional e oferecer uma experiência de compra mais personalizada para seus clientes?

#Big Data #Concurso #Dados não estruturados #InterSystems API Manager (IAM) #Machine Learning (ML) #Soluções de Negócio e Arquiteturas #InterSystems IRIS

0 0

0 85

Artigo

Marcelo Jerônim... · Maio 13, 2023 1min de leitura

Como a InterSystems revolucionou a estratégia de negocio da empresa Fresh Market

A plataforma InterSystems IRIS solucionou um problema importante em um plano de negócio da empresa de distribuição de alimentos Fresh Market. A empresa estava enfrentando um problema de estoque, que muitas vezes levava à perda de vendas e insatisfação do cliente. A empresa estava sofrendo com a falta de informações precisas e atualizadas em seu sistema de gerenciamento de estoque, o que levava a erros na previsão de demanda.

#Big Data #InterSystems IRIS BI (DeepSee)

1 0

0 58

Artigo

Larissa Prussak · Out. 21, 2021 2min de leitura

Usando SQL (Apache Hive) em repositórios de Big Data do Hadoop

Olá comunidade,

O InterSystems IRIS tem um bom conector para fazer Hadoop usando Spark. Mas o mercado oferece outra alternativa excelente para o acesso ao Big Data Hadoop, o Apache Hive. Veja as diferenças:

#Big Data #Interoperabilidade #InterSystems IRIS #InterSystems IRIS for Health

Open Exchange app

0 0

0 259

Artigo

Alexey Maslov · Fev. 1, 2021 12min de leitura

Processamento Paralelo de Dados Multimodelos no InterSystems IRIS e Caché

Como todos nós sabemos, o InterSystems IRIS possui uma ampla gama de ferramentas para melhorar a escalabilidade dos sistemas de aplicação. Em particular, muito foi feito para facilitar o processamento paralelo de dados, incluindo o uso de paralelismo no processamento de consultas SQL e o recurso mais chamativo do IRIS: o sharding. No entanto, muitos desenvolvimentos maduros que começaram no Caché e foram transportados para o IRIS usam ativamente os recursos de multimodelos deste DBMS, que são entendidos como permitindo a coexistência de diferentes modelos de dados dentro de um único banco de dados. Por exemplo, o banco de dados HIS qMS contém modelos de dados semânticos relacionais (registros médicos eletrônicos), relacionais tradicionais (interação com PACS) e hierárquicos (dados de laboratório e integração com outros sistemas). A maioria dos modelos listados é implementada usando a ferramenta qWORD do SP.ARM (um mini-DBMS que é baseado no acesso direto a globais). Portanto, infelizmente, não é possível usar os novos recursos de processamento de consulta paralela para escalonamento, uma vez que essas consultas não usam o acesso IRIS SQL.

Enquanto isso, conforme o tamanho do banco de dados cresce, a maioria dos problemas inerentes a grandes bancos de dados relacionais tornam-se adequados para os não relacionais. Portanto, esse é o principal motivo pelo qual estamos interessados no processamento paralelo de dados como uma das ferramentas que podem ser usadas para escalonamento.

Neste artigo, gostaria de discutir os aspectos do processamento paralelo de dados com os quais tenho lidado ao longo dos anos ao resolver tarefas que raramente são mencionadas em discussões sobre Big Data. Vou me concentrar na transformação tecnológica de bancos de dados, ou melhor, em tecnologias de transformação de bancos de dados.

#Big Data #DevOps #Caché #InterSystems IRIS

1 0

0 140