En este articulo voy a mostrar como se pueden manipular documentos extensos, es decir de tamaño superior a 3.6 MB en una interfaz REST y con JSON. La interfaz permite:
- Enviar un documento PDF para grabarlo en un servidor IRIS
- Pedir un documento PDF para descargarlo de IRIS.
El articulo cubre los siguientes temas:
- Ejemplo de desarrollo de API REST con paradigma SPEC first. Se define primero la interfaz rest y se implementan despues el cliente y servidor
- Gestión de JSON con cadenas largas y Streams en ambos sentidos:
- Lectura de un Stream contenido en un objeto JSON %DynamicObject.
- Generación de un Stream JSON que contiene una propiedad larga de tipo Stream
- Conversión de Streams a Base64
- Base64Encode para Streams
- Base64Decode para Streams
Los Detalles de implementación de este articulo se pueden encontar en:
https://github.com/es-comunidad-intersystems/documentservice.git
API Rest
Para la la definición de la API Rest, uso el Swagger Editor para escribir una definición en formato OpenAPI 2.0. Se tiene que exportar a una definición en fichero formato JSON para importalo en IRIS con la herramienta do ^%REST.
La Definición tiene 2 métodos:
- Un POST, que permite enviar un documento en base64. Se envían el nombre y contenido base64 del documento. El POST devuelve una referencia del documento para su posterior lectura.
- Un GET, que permite descargar un documento especifico.
El POST /document simplificado
/document:
post:
operationId: PostDocument
consumes:
- application/json
produces:
- application/json
parameters:
- name: body
in: body
required: true
schema:
type: object
properties:
fileName:
type: string
content:
type: string
El GET /document simplificado
/document/{reference}:
get:
operationId: GetDocument
consumes:
- application/json
produces:
- application/json
parameters:
- name: reference
in: path
required: true
type: string
responses:
'200':
schema:
type: object
properties:
content:
type: string
Una vez La Definición de OpenAPI 2.0 importada en IRIS, es necesario implementar la clase de implementación.
Implementación y manipulación de JSON
PostDocument: extraer una propiedad de más de 3.6MB de un JSON
Para la cargar de documento en la función PostDocument, el framework de REST nos proporciona esta definición del método:
ClassMethod PostDocument(body As %DynamicObject) As %DynamicObject {}
El body contiene 2 propiedades: fileName y content. Pero el %DyamicObject no permite acceder a la propiedad "content" con la sintaxis habitual body.content si contiene mas de 3.6MB, el limite de tamaño de los %String en IRIS 2024.
La documentación de IRIS ( https://docs.intersystems.com/iris20243/csp/docbook/DocBook.UI.Page.cls?... ) proporciona soluciones cuando el "body" contiene mas de 3.6MB de datos, pero las propiedades individuales caben en %String, lo cual no es el caso aquí.
La Solución para extraer la propiedad contenido consiste en usar una nueva clase de sistema %Stream.DynamicBinary, que ofrece acceso de solo lectura al Stream. El Stream se extrae con la siguiente sintaxis:
set tBase64=body.%Get("content","","stream")
Este Stream se puede despues copiar fácilmente, para convertirlo de base64 hacia binario y grabarlo en un fichero binario en el servidor. El metodo completo se puede ver en gitHub.
GetDocument: generar un JSON con una propiedad de más de 3.6MB
En base a la definición de OpenAPI 2.0, el framework de REST ha proporcionado esta definición para el método de implementación
ClassMethod GetDocument(reference As %String) As %DynamicObject
Para Generar un %DynamicObject que contenga una propiedad "content" con un Stream de más de 3.6GB, la interfaz de %DynamicObject no proporciona ninguna utilidad, ya que la clase %Stream.DynamicBinary no se puede instanciar desde otro Stream ni permite escrituras.
El Framework de la aplicación REST definida permite que la función GetDocument devuelva un %Stream en vez de un %DynamicObject. Para no definir el contenido del Stream manualmente, es posible usar una clase que defina el contenido a devolver y el %JSON.Adaptor:
Class documentservice.data.document Extends (%RegisteredObject, %JSON.Adaptor)
{
Property content As %Stream.TmpBinary
}
En GetDocument, simplemente se copian los datos a la propiedad "content" y se exporta todo a un %Stream mediante la interfaz %JSON.Adaptor:%JSONExportToStream:
Una peculiaridad de las interfaces Web de IRIS (CSP, Servicios SOAP, Servicios REST) es que las propiedades de tipo %Binary y %Stream.Binary ya se codifican/decodifican de manera automática en base64 al enviarse/recibirse, por lo cual esta operación se ha comentado en el codigo de ejemplo.
set tOut=##class(documentservice.data.document).%New()
set tOut.content=##class(%Stream.TmpBinary).%New()
do tOut.content.CopyFrom(tInFile)
do tOut.%JSONExportToStream(.binStream)
return binStream
A notar que la superclase %JSON.Adapter nos permite también instanciar objetos complejos de IRIS a partir de Streams que contienen un formato JSON, incluso cuando estos contienen cadenas largas. Se podría haber usado una subclase de %JSON.Adapter y el método .%JSONImport(<stream>) para leer el Stream de PostDocument e instancia el objeto, pero la Interfaz de REST nos proporciona ya un %DynamicObject en vez de Stream de REST original (esto es por la definición del objeto de entrada que se ha puesto en OpenAPI).
Cliente de Prueba
Las Herramientas tradicionales como PostMan o SOAPUI no son muy practicas para probar este servicio REST de envio y recepción de fichero largo. Un método conveniente es usar scripts de python para hacer el POST de un fichero PDF y el GET del mismo documento ( y así poder validar si se recibe un fichero PDF valido). Python ayuda también en hacer las conversiones hacia base64 al enviar y recibir el documento.
Inicializar el entorno python (venv)
cd client
setup_env.bat
Carga del fichero
cd client
runpost.bat
Resultado:
Descarga del fichero
cd client
runget.bat
Resultado:
Anexo: Manipulación Base64 para Streams
InterSystems IRIS contiene funciones para codificar y decodificar cadenas de caracteres (%String) hacia y desde base64. Son las funciones
set base64=$SYSTEM.Encryption.Base64Encode(cadena)
set cadena2=$SYSTEM.Encryption.Base64Decode(base64)
Sin embargo, no hay funcionalidad para trabajar con Streams en IRIS. La Funcionalidad ha sido implementada en un paquete de IRIS for Health, de dónde se recupera la implementación ya probada y validada. Esta implementación separa el %Stream en %Strings más cortos para , y debe tener en cuenta, para el "Decode", de la longitud variable que puede tener la representación de un carácter en base64.
Base64Encode
ClassMethod Base64Encode(pInput = "", ByRef pOutput As %Stream.GlobalCharacter = "") As %Status
{
Set tSC=$$$OK
Try {
If '$IsObject(pOutput) Set pOutput=##class(%Stream.GlobalCharacter).%New()
#
#
#
Set tMax=$$$MaxLocalLength*.5\1
Set tMax=tMax-(tMax#57)
If $IsObject(pInput) {
Set tCurrLineLen=0
While 'pInput.AtEnd {
Set tData=pInput.Read(tMax)
Set tValue=$SYSTEM.Encryption.Base64Encode(tData)
Do pOutput.Write(tValue)
If 'pInput.AtEnd Do pOutput.Write(pOutput.LineTerminator)
}
} Else {
Set tPos=1
While tPos<$l(pInput) {
Set tEnd=tPos+tMax-1
Set tValue=$e(pInput,tPos,tEnd)
Set tValue=$SYSTEM.Encryption.Base64Encode(pInput)
Do pOutput.Write(tValue)
Set tPos=tEnd+1
If tPos<$l(pInput) Do pOutput.Write(pOutput.LineTerminator)
}
}
Do pOutput.Rewind()
} Catch ex { Set tSC=ex.AsStatus() }
Quit tSC
}
Base64Decode
ClassMethod Base64Decode(pInput = "", ByRef pOutput As %Stream.GlobalBinary = "") As %Status
{
Set tSC=$$$OK
Try {
If '$IsObject(pOutput) Set pOutput=##class(%Stream.GlobalBinary).%New()
#
#
If $IsObject(pInput) {
Set tLeftOver=""
While 'pInput.AtEnd {
Set tValue=pInput.Read($$$MaxLocalLength-4)
Set tValue=tLeftOver_$TR(tValue,$C(13,10))
Set tPos=$L(tValue)-($L(tValue)#4)
Set tLeftOver=$e(tValue,tPos+1,*)
Set tValue=$e(tValue,1,tPos)
Do pOutput.Write($SYSTEM.Encryption.Base64Decode(tValue))
}
} Else {
Do pOutput.Write($SYSTEM.Encryption.Base64Decode(pInput))
}
Do pOutput.Rewind()
} Catch ex { Set tSC=ex.AsStatus() }
Quit tSC
}