Monitoramento em diários#
O monitoramento em diários é o processo pelo qual se acompanha automaticamente publicações em diários oficiais, judiciais e não-judiciais, para detectar informações relevantes, como processos, distribuições e termos específicos.
Esse processo pode ser realizado de duas formas, dependendo do tipo de conteúdo que está sendo monitorado:
Recortes: Pequenos trechos detalhados, presentes apenas em diários judiciais, que contêm metadados adicionais como número do processo, nome do advogado e seção.
Páginas Inteiras: Publicações completas, usadas tanto em diários judiciais quanto não-judiciais, onde não há estrutura definida para trechos específicos, e o monitoramento é feito por meio da detecção de palavras ou termos-chave.
Existem três módulos principais de monitoramento, cada uma especializada em um tipo de conteúdo:
Monitoramento de Processos: Acompanha processos judiciais e suas atualizações. O retorno consiste em recortes judiciais, com detalhes estruturados como partes envolvidas, número do processo e seção do diário.
Monitoramento de Distribuições: Focado no monitoramento de novas distribuições de processos. O resultado também são recortes judiciais, contendo informações relevantes da distribuição.
Monitoramento de Termos: Realizado em páginas inteiras, detecta palavras ou expressões específicas. O retorno é um trecho do termo geral encontrado no diário.
Essa divisão garante que o monitoramento seja preciso e eficiente, adaptando-se tanto aos diários estruturados, como os judiciais, quanto aos diários com menos organização, como os não-judiciais.
Nota
O monitoramento de distribuições e processos em diários oficiais é realizado nas suas respectivas
seções, passando o parâmetro is_monitored_diario=true
na chamada dos serviços de monitoramento. Para
mais informações, consulte a documentação específica de cada serviço acessando os links acima.
Recorte#
Os recortes em Diários Oficiais são trechos extraídos e estruturados de publicações judiciais, executivas e administrativas. Estes recortes fornecem informações detalhadas e organizadas, como:
Processo: Identificação do processo judicial.
Partes: Nome das partes envolvidas no processo.
Seção: Seção do Diário Oficial onde o recorte foi encontrado.
Assunto Normalizado: Classificação e descrição do assunto tratado.
Esses recortes são gerados como resultado do monitoramento de processos ou partes nos Diários Oficiais, permitindo a detecção de atualizações relevantes nessas publicações.
O módulo permite que você acesse a lista de diários que disponibilizam esses recortes, proporcionando uma maneira eficiente de trabalhar com dados estruturados extraídos de documentos oficiais.
Para encontrar quais Diários Oficiais oferecem recortes judiciais, você pode usar o seguinte endpoint:
cURL
curl -X GET \
'https://op.digesto.com.br/api/diarios-oficiais/fontes_recortes' \
-H 'Content-Type: application/json' \
-H 'Host: op.digesto.com.br' \
-H 'Accept: application/json' \
-H 'Authorization: Bearer <token>'
Resposta
HTTP/1.1 200 OK
Content-Type: application/json
{
"1": "TRF - 1ª Reg.",
"18": "SP - TJ-cad.2-2ª Inst",
"19": "SP - TJ-cad.3-1ª Inst-Cap.",
"20": "SP - TJ-cad.4-1ª Inst-Int.-P.1",
"21": "SP - TJ-cad.4-1ª Inst-Int.-P.2",
"22": "SP - TJ-cad.4-1ª Inst-Int.-P.3",
"23": "SP - TJ-cad.5-Editais e Leilões",
"24": "SP - TJ-cad.1-Administrativo",
"25": "Nacional - STF",
"26": "Nacional - TST",
"30": "AC - TRE",
"31": "AL - TRE"
}
Detalhes de publicações judiciais#
As publicações judiciais detectadas para processos judiciais são enviadas como objetos JSON, com os campos abaixo.
Aqueles marcados com optional podem vir com o valor (string) null.
Parâmetro |
Tipo |
Descrição |
---|---|---|
doc_id |
int, optional |
Identificador interno do documento de diário oficial onde houve a publicação. Para ser usado no módulo de Diários Oficiais. |
snippet |
string, required, até 20.000 chars |
Texto completo do recorte. Ex.: “Duplicata - Adar Industria - Requerido para contestar…”. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Sempre é enviado. |
detected_at |
datetime object |
Data em que a ocorrência foi detectada. Data em formato inteiro (JSON). Ver Formato de datas. |
advs |
string, optional, até 20.000 chars |
Advogados. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Nem sempre é enviado. |
assunto |
string, optional, até 812 chars |
Assunto do processo ou recorte, conforme descrito pelo tribunal. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Nem sempre é enviado. Ex: Execucao de Titulo Extrajudicial. |
proc |
string, required, até 256 chars |
Número do processo. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Ex.: 0113708-39.2011.8.26.0100. |
proc_alt |
string, optional, até 256 chars |
Número alternativo do processo. Normalmente para processos antigos, anteriores à numeração CNJ. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Nem sempre é enviado. Ex.: 583.00.2011.113708. |
proc_apens |
string, optional, até 256 chars |
Número do processo apensado. Normalmente traz o processo originário de instância anterior. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Nem sempre é enviado. |
texto |
string, optional, até 10.000 chars |
Corpo de texto do recorte. É o |
source_id |
number (DEPRECADO) |
ID da fonte (jornal/diário) que publicou este documento. A lista completa com descrição de cada fonte está disponível em “Detalhes de uma fonte”. |
published_at |
datetime object |
Data oficial de publicação, usado para contagens de prazos. Quando o diário ou site do tribunal não deixa clara a data da publicação, este campo tem o valor da data em que o caderno foi disponibilizado e obtido no site do tribunal. Ver Formato de datas. |
docurl |
string, optional, até 2500 chars |
Endereço original, nem sempre disponível pois algumas fontes não têm endereço fixo para suas páginas/cadernos de diários oficiais. Ex.: “http://diariooficial.imprensaoficial.com.br/doflash/prototipo/2014/Fevereiro/04/jucesp/pdf/pg_0059.pdf”. |
cached_docurl |
string, optional, até 2500 chars |
Endereço de cópia para download de uma cópia do diário, hospedada pelo Digesto. |
partes |
string, optional, até 8.000 chars |
Nome das partes mencionadas no recorte. Varia de diário para diário. |
available_at |
datetime object |
Data em que o diário foi disponibilizado publicamente. Data em formato inteiro (JSON). Ver Formato de datas. |
assunto_norm |
lista de tuplas |
Classificação automática pelo Digesto da publicação, quando disponível. Cada tupla dessa lista representa um assunto mencionado na movimentação. Quando não disponível, o valor é uma lista vazia. Veja Tipos padronizados Digesto para andamentos e publicações processuais. |
recorte_id |
int, required |
Identificador único deste recorte. |
periodico_diario_slug |
string, até 256 chars |
Nome do diário (ex. “dje-tjgo”). |
periodico_orgao_slug |
string, até 256 chars |
Nome do órgão que publica este diário (ex. “tjsp”, “trf1”). |
periodico_caderno_slug |
string, até 256 chars |
Nome do caderno deste diário onde a publicação foi encontrada. Ex.: |
secao_diario |
string, optional, até 256 chars |
Nome da seção ou capítulo dentro do diário onde o recorte foi encontrado. |
num_pag_original |
int ou null |
Número (sequencial começando de 1) da página do diário onde o recorte foi encontrado. |
periodico_id |
int |
Identificador interno da Digesto para o diário onde o recorte foi encontrado. |
processo_id |
int, optional |
Identificador interno da Digesto para o processo ao qual o recorte se refere. |
custom_type |
int, optional |
Identificador do tipo de publicação, customizado para o cliente. |
sections |
lista |
Lista de cabeçalhos da seção e/ou sub-seções onde este recorte foi encontrado no Diário. Exemplo |
Exemplo de Retorno do Webhook: Monitoramento de Processos e Partes#
O exemplo abaixo traz uma chamada contendo uma publicação detectada envolvendo o processo monitorado de id 684
(numeração CNJ 1040985-29.2016.8.26.0100
).
Informação semelhante é enviada quando a publicação se refere a uma monitored_person
. A diferença é que o campo source_url
mencionará o endereço da pessoa monitorada na API.
No campo data
há uma lista de publicações, onde cada publicação pode conter os campos descritos em recorte.
HTTP/1.1 200 OK
Content-Type: application/json
[
{
"target_url": "https://op.digesto.com.br/api/monitoramento/proc_recorte/132312",
"source_user_custom": null,
"created_at": "2016-05-25T08:38:32.941264",
"source_url": [
"https://op.digesto.com.br/api/monitoramento/proc/684"
],
"target_number": "0204832-87.2012.8.04.0001",
"evt_type": 2,
"id": 127886752,
"data": [
{
"periodico_caderno": "II - Suplemento",
"processo_id": 1,
"texto": "NR.PROCESSO : 5157525-43.2021.8.09.0051\nCLASSE PROCESSUAL : PROCESSO CÍVEL E DO TRABALHO -> Processo de Conhecimento ->\nProcedimento de Conhecimento -> Procedimentos Especiais",
"periodico_orgao_slug": "tjgo",
"published_at": {
"$date": 1624406400000
},
"partes": null,
"proc_alt": null,
"detected_at": {
"$date": 1624464679000
},
"secoes_texto_completo": "INTIMAÇÃO EFETIVADA REF. À MOV. Intimação Efetivada a Ser Publicada No Diário\nEletrônico Nos Próximos 2 (Dois) Dias Úteis - Data da Movimentação 22/06/2021\n18:29:37\nLOCAL : GOIÂNIA - 8ª VARA CÍVEL",
"proc_apens": null,
"snippet": "NR.PROCESSO : 5157525-43.2021.8.09.0051\nCLASSE PROCESSUAL : PROCESSO CÍVEL E DO TRABALHO -> Processo de Conhecimento ->\nProcedimento de Conhecimento -> Procedimentos Especiais -> Procedimentos...",
"entities": [
[
"cnj",
{
"prefixo": null,
"cnj": "5157525-43.2021.8.09.0051",
"sufixo": null
}
]
],
"sections": [
{
"secao_titulo": "INTIMAÇÃO EFETIVADA REF. À MOV. Intimação Efetivada a Ser Publicada No Diário",
"secao_id": 15309658,
"secao_texto": "INTIMAÇÃO EFETIVADA REF. À MOV. Intimação Efetivada a Ser Publicada No Diário\nEletrônico Nos Próximos 2 (Dois) Dias Úteis - Data da Movimentação 22/06/2021\n18:29:37\nLOCAL : GOIÂNIA - 8ª VARA CÍVEL\n",
"secao_nivel": 3
}
],
"available_at": {
"$date": 1624406400000
},
"periodico_diario_slug": "dje-tjgo",
"recorte_id": 4550307464893370000,
"assunto": null,
"secao_diario": "INTIMAÇÃO EFETIVADA REF. À MOV. Intimação Efetivada a Ser Publicada No Diário",
"docurl": "http://tjdocs.tjgo.jus.br/documentos/585205/download",
"num_pag_original": 7623,
"periodico_orgao": "TJGO",
"periodico_diario": "DJe-TJGO",
"periodico_caderno_slug": "ii-suplemento",
"periodico_id": 135,
"advs": null,
"proc": "5157525-43.2021.8.09.0051",
"source_id": 611,
"cached_docurl": "https://storage.googleapis.com/dg-diario-split/split-diario-oficial-dje-tjgo-tjgo-ii-suplemento-3257-2021-06-23-7623.pdf",
"doc_id": 1
}
]
}
]
Termo geral#
Monitoramento de termos#
Para monitorar expressões específicas em publicações de diários oficiais, você pode enviar um
HTTP POST
para o recurso da API monitored_term
, incluindo os detalhes da entidade desejada. Esse
módulo permite registrar termos que você deseja acompanhar, como nomes, marcas, produtos ou
projetos de lei.
O resultado deste monitoramento não vem estruturado como recorte (indicando qual o processo, qual o texto da movimentacao, quais as partes etc). Ele seria mais usado para monitorar nomes/marcas/produtos, projetos de lei etc em diários executivos. Os resultados diários do monitoramento são enviados conforme os Dados de um evento, proporcionando uma visão geral das ocorrências encontradas.
Exemplo de uso: Imagine que você deseja monitorar menções a um novo projeto de lei em publicações
oficiais. Para isso, você registra o termo “Projeto de Lei XYZ” no módulo monitored_term
. Diariamente,
o serviço verifica os diários oficiais e retorna um resumo das publicações que contêm o termo
“Projeto de Lei XYZ”. Assim, você pode rapidamente identificar e revisar qualquer menção ao projeto
sem precisar vasculhar manualmente todos os documentos.
Registrando palavras para monitoramento em Diários Oficiais#
O exemplo abaixo registra a expressão “Projeto de Lei XYZ” para monitoramento contínuo nos diários
oficiais de id 1, 2 e 3. E retorna a entidade monitored_term
recém criada.
cURL
curl -X POST 'https://op.digesto.com.br/api/monitoramento/monitored_term' \
-H "Content-Type: application/json" \
-H "Authorization: Bearer <token>" \
-d '{
"term": "Projeto de Lei XYZ",
"source_ids": [1, 2, 3]
}'
Resposta
HTTP/1.1 200 OK
Vary: Accept
Content-Type: application/json
{
"$uri": "/api/monitoramento/monitored_term/4",
"archived_at": null,
"created_at": {
"$date": 1486228120000
},
"is_active": true,
"is_reviewed": true,
"nrex": null,
"percolator_id": null,
"rex": "Termo procurado",
"sources": [
1,
2,
3
],
"term": "Termo procurado",
"user_company": {
"$ref": "/api/admin/user_company/1"
},
"user_creator": {
"$ref": "/api/admin/user/1"
},
"user_creator_id": 1,
"user_custom": null
}
Resultado de um monitoramento de termo#
Os resultados diários do monitoramento são enviados conforme Dados de um evento.
Cada resultado é um objeto JSON, com os campos:
Parâmetro |
Tipo |
Descrição |
---|---|---|
monitored_term |
referência |
Referência ao termo monitorado. |
doc_id |
int |
Identificador interno do documento de diário oficial onde houve a publicação. Para ser usado na API Diários Oficiais. |
snippet |
string |
Texto completo da página de diário oficial onde o termo monitorado foi encontrado. Ex.: “Duplicata - Adar Industria - Requerido para contestar…”. Enviado apenas nos resultados de diários judiciais, quando o resultado se refere a um processo. Sempre é enviado. |
source_id |
number |
ID da fonte (jornal/diário) que publicou este documento. A lista completa com descrição de cada fonte está disponível em Detalhes de uma fonte. Para garantir um bom desempenho, os nomes das fontes associados a cada ID de fonte devem ser cacheados do lado do cliente. |
published_at |
date |
Data oficial de publicação, usada para contagens de prazos etc. Data em formato inteiro (JSON). |
detected_at |
date |
Data em que a publicação foi obtida pela Digesto. Mesmo formato de |
docurl |
string |
Endereço original, nem sempre disponível, pois algumas fontes não têm endereço fixo para suas páginas/cadernos de diários oficiais. Ex.: “http://diariooficial.imprensaoficial.com.br/doflash/prototipo/2014/Fevereiro/04/jucesp/pdf/pg_0059.pdf”. |
cached_docurl |
string |
Endereço de cópia para download de uma cópia do diário, hospedada pelo Digesto apenas por 30 dias. Disponibilizamos a URL de anexos para fins de transferência dos dados. Estas URLs não devem ser disponibilizadas para clientes finais. Usuários da API Digesto precisam fazer uma cópia e hospedar para os clientes finais. |