De acordo com o Databricks, Apache Parquet é um formato de dados de código aberto orientado por colunas que é projetado para o armazenamento e recuperação de dados eficiente. Ele fornece esquemas eficientes de compactação e codificação de dados com um desempenho aprimorado para lidar com dados complexos em massa. O Apache Parquet foi criado para ser um formato de troca comum para ambas as cargas de trabalho em lote e interativas. É semelhante a outros formatos de arquivo de armazenamento colunar disponíveis no Hadoop, especificamente, RCFile e ORC.
InterSystems Developer Community é uma comunidade de 21,177 desenvolvedores incríveis
Somos um local onde os programadores do InterSystems IRIS aprendem e compartilham, permanecem atualizados, crescem juntos e se divertem!