Monitoramento em diários#

O monitoramento em diários é o processo pelo qual se acompanha automaticamente publicações em diários oficiais, judiciais e não-judiciais, para detectar informações relevantes, como processos, distribuições e termos específicos.

Esse processo pode ser realizado de duas formas, dependendo do tipo de conteúdo que está sendo monitorado:

  • Recortes: Pequenos trechos detalhados, presentes apenas em diários judiciais, que contêm metadados adicionais como número do processo, nome do advogado e seção.

  • Páginas Inteiras: Publicações completas, usadas tanto em diários judiciais quanto não-judiciais, onde não há estrutura definida para trechos específicos, e o monitoramento é feito por meio da detecção de palavras ou termos-chave.

Existem três módulos principais de monitoramento, cada uma especializada em um tipo de conteúdo:

  • Monitoramento de Processos: Acompanha processos judiciais e suas atualizações. O retorno consiste em recortes judiciais, com detalhes estruturados como partes envolvidas, número do processo e seção do diário.

  • Monitoramento de Distribuições: Focado no monitoramento de novas distribuições de processos. O resultado também são recortes judiciais, contendo informações relevantes da distribuição.

  • Monitoramento de Termos: Realizado em páginas inteiras, detecta palavras ou expressões específicas. O retorno é um trecho do termo geral encontrado no diário.

Essa divisão garante que o monitoramento seja preciso e eficiente, adaptando-se tanto aos diários estruturados, como os judiciais, quanto aos diários com menos organização, como os não-judiciais.

Nota

O monitoramento de distribuições e processos em diários oficiais é realizado nas suas respectivas seções, passando o parâmetro is_monitored_diario=true na chamada dos serviços de monitoramento. Para mais informações, consulte a documentação específica de cada serviço acessando os links acima.

Recorte#

Os recortes em Diários Oficiais são trechos extraídos e estruturados de publicações judiciais, executivas e administrativas. Estes recortes fornecem informações detalhadas e organizadas, como:

  • Processo: Identificação do processo judicial.

  • Partes: Nome das partes envolvidas no processo.

  • Seção: Seção do Diário Oficial onde o recorte foi encontrado.

  • Assunto Normalizado: Classificação e descrição do assunto tratado.

Esses recortes são gerados como resultado do monitoramento de processos ou partes nos Diários Oficiais, permitindo a detecção de atualizações relevantes nessas publicações.

O módulo permite que você acesse a lista de diários que disponibilizam esses recortes, proporcionando uma maneira eficiente de trabalhar com dados estruturados extraídos de documentos oficiais.

Para encontrar quais Diários Oficiais oferecem recortes judiciais, você pode usar o seguinte endpoint:

cURL

curl -X GET \
    'https://op.digesto.com.br/api/diarios-oficiais/fontes_recortes' \
    -H 'Content-Type: application/json' \
    -H 'Host: op.digesto.com.br' \
    -H 'Accept: application/json' \
    -H 'Authorization: Bearer <token>'

Resposta

HTTP/1.1 200 OK
Content-Type: application/json

{
    "1": "TRF - 1ª Reg.",
    "18": "SP - TJ-cad.2-2ª Inst",
    "19": "SP - TJ-cad.3-1ª Inst-Cap.",
    "20": "SP - TJ-cad.4-1ª Inst-Int.-P.1",
    "21": "SP - TJ-cad.4-1ª Inst-Int.-P.2",
    "22": "SP - TJ-cad.4-1ª Inst-Int.-P.3",
    "23": "SP - TJ-cad.5-Editais e Leilões",
    "24": "SP - TJ-cad.1-Administrativo",
    "25": "Nacional - STF",
    "26": "Nacional - TST",
    "30": "AC - TRE",
    "31": "AL - TRE"
}

Detalhes de publicações judiciais#

As publicações judiciais detectadas para processos judiciais são enviadas como objetos JSON, com os campos abaixo.

Aqueles marcados com optional podem vir com o valor (string) null.

Parâmetro

Tipo

Descrição

doc_id

int, optional

Identificador interno do documento de diário oficial onde houve a publicação. Para ser usado no módulo de Diários Oficiais.

snippet

string, required, até 20.000 chars

Texto completo do recorte. Ex.: “Duplicata - Adar Industria - Requerido para contestar…”. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Sempre é enviado.

detected_at

datetime object

Data em que a ocorrência foi detectada. Data em formato inteiro (JSON). Ver Formato de datas.

advs

string, optional, até 20.000 chars

Advogados. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Nem sempre é enviado.

assunto

string, optional, até 812 chars

Assunto do processo ou recorte, conforme descrito pelo tribunal. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Nem sempre é enviado. Ex: Execucao de Titulo Extrajudicial.

proc

string, required, até 256 chars

Número do processo. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Ex.: 0113708-39.2011.8.26.0100.

proc_alt

string, optional, até 256 chars

Número alternativo do processo. Normalmente para processos antigos, anteriores à numeração CNJ. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Nem sempre é enviado. Ex.: 583.00.2011.113708.

proc_apens

string, optional, até 256 chars

Número do processo apensado. Normalmente traz o processo originário de instância anterior. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Nem sempre é enviado.

texto

string, optional, até 10.000 chars

Corpo de texto do recorte. É o snippet, porém sem o trecho indicando advogado, parte e número do processo. Nem sempre é enviado. Pode ser igual ao campo snippet.

source_id

number (DEPRECADO)

ID da fonte (jornal/diário) que publicou este documento. A lista completa com descrição de cada fonte está disponível em “Detalhes de uma fonte”.

published_at

datetime object

Data oficial de publicação, usado para contagens de prazos. Quando o diário ou site do tribunal não deixa clara a data da publicação, este campo tem o valor da data em que o caderno foi disponibilizado e obtido no site do tribunal. Ver Formato de datas.

docurl

string, optional, até 2500 chars

Endereço original, nem sempre disponível pois algumas fontes não têm endereço fixo para suas páginas/cadernos de diários oficiais. Ex.: “http://diariooficial.imprensaoficial.com.br/doflash/prototipo/2014/Fevereiro/04/jucesp/pdf/pg_0059.pdf”.

cached_docurl

string, optional, até 2500 chars

Endereço de cópia para download de uma cópia do diário, hospedada pelo Digesto.

partes

string, optional, até 8.000 chars

Nome das partes mencionadas no recorte. Varia de diário para diário.

available_at

datetime object

Data em que o diário foi disponibilizado publicamente. Data em formato inteiro (JSON). Ver Formato de datas.

assunto_norm

lista de tuplas

Classificação automática pelo Digesto da publicação, quando disponível. Cada tupla dessa lista representa um assunto mencionado na movimentação. Quando não disponível, o valor é uma lista vazia. Veja Tipos padronizados Digesto para andamentos e publicações processuais.

recorte_id

int, required

Identificador único deste recorte.

periodico_diario_slug

string, até 256 chars

Nome do diário (ex. “dje-tjgo”).

periodico_orgao_slug

string, até 256 chars

Nome do órgão que publica este diário (ex. “tjsp”, “trf1”).

periodico_caderno_slug

string, até 256 chars

Nome do caderno deste diário onde a publicação foi encontrada. Ex.: ii-suplemento.

secao_diario

string, optional, até 256 chars

Nome da seção ou capítulo dentro do diário onde o recorte foi encontrado.

num_pag_original

int ou null

Número (sequencial começando de 1) da página do diário onde o recorte foi encontrado.

periodico_id

int

Identificador interno da Digesto para o diário onde o recorte foi encontrado.

processo_id

int, optional

Identificador interno da Digesto para o processo ao qual o recorte se refere.

custom_type

int, optional

Identificador do tipo de publicação, customizado para o cliente.

sections

lista

Lista de cabeçalhos da seção e/ou sub-seções onde este recorte foi encontrado no Diário. Exemplo

Exemplo de Retorno do Webhook: Monitoramento de Processos e Partes#

O exemplo abaixo traz uma chamada contendo uma publicação detectada envolvendo o processo monitorado de id 684 (numeração CNJ 1040985-29.2016.8.26.0100).

Informação semelhante é enviada quando a publicação se refere a uma monitored_person. A diferença é que o campo source_url mencionará o endereço da pessoa monitorada na API.

No campo data há uma lista de publicações, onde cada publicação pode conter os campos descritos em recorte.

HTTP/1.1 200 OK
Content-Type: application/json

[
    {
        "target_url": "https://op.digesto.com.br/api/monitoramento/proc_recorte/132312",
        "source_user_custom": null,
        "created_at": "2016-05-25T08:38:32.941264",
        "source_url": [
            "https://op.digesto.com.br/api/monitoramento/proc/684"
        ],
        "target_number": "0204832-87.2012.8.04.0001",
        "evt_type": 2,
        "id": 127886752,
        "data": [
            {
                "periodico_caderno": "II - Suplemento",
                "processo_id": 1,
                "texto": "NR.PROCESSO : 5157525-43.2021.8.09.0051\nCLASSE PROCESSUAL : PROCESSO CÍVEL E DO TRABALHO -> Processo de Conhecimento ->\nProcedimento de Conhecimento -> Procedimentos Especiais",
                "periodico_orgao_slug": "tjgo",
                "published_at": {
                    "$date": 1624406400000
                },
                "partes": null,
                "proc_alt": null,
                "detected_at": {
                    "$date": 1624464679000
                },
                "secoes_texto_completo": "INTIMAÇÃO EFETIVADA REF. À MOV. Intimação Efetivada a Ser Publicada No Diário\nEletrônico Nos Próximos 2 (Dois) Dias Úteis - Data da Movimentação 22/06/2021\n18:29:37\nLOCAL : GOIÂNIA - 8ª VARA CÍVEL",
                "proc_apens": null,
                "snippet": "NR.PROCESSO : 5157525-43.2021.8.09.0051\nCLASSE PROCESSUAL : PROCESSO CÍVEL E DO TRABALHO -> Processo de Conhecimento ->\nProcedimento de Conhecimento -> Procedimentos Especiais -> Procedimentos...",
                "entities": [
                    [
                        "cnj",
                        {
                            "prefixo": null,
                            "cnj": "5157525-43.2021.8.09.0051",
                            "sufixo": null
                        }
                    ]
                ],
                "sections": [
                    {
                        "secao_titulo": "INTIMAÇÃO EFETIVADA REF. À MOV. Intimação Efetivada a Ser Publicada No Diário",
                        "secao_id": 15309658,
                        "secao_texto": "INTIMAÇÃO EFETIVADA REF. À MOV. Intimação Efetivada a Ser Publicada No Diário\nEletrônico Nos Próximos 2 (Dois) Dias Úteis - Data da Movimentação 22/06/2021\n18:29:37\nLOCAL : GOIÂNIA - 8ª VARA CÍVEL\n",
                        "secao_nivel": 3
                    }
                ],
                "available_at": {
                    "$date": 1624406400000
                },
                "periodico_diario_slug": "dje-tjgo",
                "recorte_id": 4550307464893370000,
                "assunto": null,
                "secao_diario": "INTIMAÇÃO EFETIVADA REF. À MOV. Intimação Efetivada a Ser Publicada No Diário",
                "docurl": "http://tjdocs.tjgo.jus.br/documentos/585205/download",
                "num_pag_original": 7623,
                "periodico_orgao": "TJGO",
                "periodico_diario": "DJe-TJGO",
                "periodico_caderno_slug": "ii-suplemento",
                "periodico_id": 135,
                "advs": null,
                "proc": "5157525-43.2021.8.09.0051",
                "source_id": 611,
                "cached_docurl": "https://storage.googleapis.com/dg-diario-split/split-diario-oficial-dje-tjgo-tjgo-ii-suplemento-3257-2021-06-23-7623.pdf",
                "doc_id": 1
            }
        ]
    }
]

Termo geral#

Monitoramento de termos#

Para monitorar expressões específicas em publicações de diários oficiais, você pode enviar um HTTP POST para o recurso da API monitored_term, incluindo os detalhes da entidade desejada. Esse módulo permite registrar termos que você deseja acompanhar, como nomes, marcas, produtos ou projetos de lei.

O resultado deste monitoramento não vem estruturado como recorte (indicando qual o processo, qual o texto da movimentacao, quais as partes etc). Ele seria mais usado para monitorar nomes/marcas/produtos, projetos de lei etc em diários executivos. Os resultados diários do monitoramento são enviados conforme os Dados de um evento, proporcionando uma visão geral das ocorrências encontradas.

Exemplo de uso: Imagine que você deseja monitorar menções a um novo projeto de lei em publicações oficiais. Para isso, você registra o termo “Projeto de Lei XYZ” no módulo monitored_term. Diariamente, o serviço verifica os diários oficiais e retorna um resumo das publicações que contêm o termo “Projeto de Lei XYZ”. Assim, você pode rapidamente identificar e revisar qualquer menção ao projeto sem precisar vasculhar manualmente todos os documentos.


Registrando palavras para monitoramento em Diários Oficiais#

O exemplo abaixo registra a expressão “Projeto de Lei XYZ” para monitoramento contínuo nos diários oficiais de id 1, 2 e 3. E retorna a entidade monitored_term recém criada.

cURL

curl -X POST 'https://op.digesto.com.br/api/monitoramento/monitored_term' \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer <token>" \
    -d '{
    "term": "Projeto de Lei XYZ",
    "source_ids": [1, 2, 3]
    }'

Resposta

HTTP/1.1 200 OK
Vary: Accept
Content-Type: application/json

{
    "$uri": "/api/monitoramento/monitored_term/4",
    "archived_at": null,
    "created_at": {
        "$date": 1486228120000
    },
    "is_active": true,
    "is_reviewed": true,
    "nrex": null,
    "percolator_id": null,
    "rex": "Termo procurado",
    "sources": [
        1,
        2,
        3
    ],
    "term": "Termo procurado",
    "user_company": {
        "$ref": "/api/admin/user_company/1"
    },
    "user_creator": {
        "$ref": "/api/admin/user/1"
    },
    "user_creator_id": 1,
    "user_custom": null
}

Detalhes de uma expressão monitorada


Resultado de um monitoramento de termo#

Os resultados diários do monitoramento são enviados conforme Dados de um evento.

Cada resultado é um objeto JSON, com os campos:

Parâmetro

Tipo

Descrição

monitored_term

referência

Referência ao termo monitorado.

doc_id

int

Identificador interno do documento de diário oficial onde houve a publicação. Para ser usado na API Diários Oficiais.

snippet

string

Texto completo da página de diário oficial onde o termo monitorado foi encontrado. Ex.: “Duplicata - Adar Industria - Requerido para contestar…”. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Sempre é enviado.

source_id

number

ID da fonte (jornal/diário) que publicou este documento. A lista completa com descrição de cada fonte está disponível em Detalhes de uma fonte. Para garantir um bom desempenho, os nomes das fontes associados a cada ID de fonte devem ser cacheados do lado do cliente.

published_at

date

Data oficial de publicação, usada para contagens de prazos etc. Data em formato inteiro (JSON).

detected_at

date

Data em que a publicação foi obtida pela Digesto. Mesmo formato de published_at.

docurl

string

Endereço original, nem sempre disponível, pois algumas fontes não têm endereço fixo para suas páginas/cadernos de diários oficiais. Ex.: “http://diariooficial.imprensaoficial.com.br/doflash/prototipo/2014/Fevereiro/04/jucesp/pdf/pg_0059.pdf”.

cached_docurl

string

Endereço de cópia para download de uma cópia do diário, hospedada pelo Digesto apenas por 30 dias. Disponibilizamos a URL de anexos para fins de transferência dos dados. Estas URLs não devem ser disponibilizadas para clientes finais. Usuários da API Digesto precisam fazer uma cópia e hospedar para os clientes finais.