Modelo de inteligência artificial vence prêmio internacional da 67th ASH Meeting 2025

Trabalho desenvolveu um modelo XGBoost baseado em hemograma para prever mortalidade precoce que ocorre depois da quimioterapia de indução intensiva em Leucemia Mieloide Aguda (LMA)

O abstract “Xgboost model using diagnostic CBC to predict early mortality in newly diagnosed AML patients” foi contemplado com o ASH Abstract Achievement Award 2025, reconhecimento concedido a trainees com abstracts de alta pontuação apresentados no encontro anual da American Society of Hematology (ASH) — o maior evento da especialidade no mundo, que reuniu mais de 30.000 inscritos neste ano, realizado de 6 a 9 de dezembro de 2025, em Orlando, na Flórida. O prêmio inclui apoio financeiro e destaca a relevância científica do trabalho entre milhares de submissões globais avaliadas para o 67th ASH Annual Meeting.

A pesquisa publicada como abstract na revista Blood (2025;146:4348. DOI: 10.1182/blood-2025-4348), conduziu um estudo de coorte retrospectivo que incluiu 230 adultos recém-diagnosticados com LMA e atendidos em um centro público brasileiro (banco de dados recém criado de todas as leucemias agudas da Unifesp) entre 2014 e 2025, focando nos 101 pacientes que receberam quimioterapia intensiva com o padrão “3+7” (Citarabina 100 mg/m² e Daunorrubicina 60 mg/m²). O objetivo foi prever mortalidade precoce, definida como óbito em até 30 dias após o início da quimioterapia.  Regressão Logística e Árvore de Decisão foram usadas para identificar preditores relevantes para mortalidade precoce. Foram testados vários modelos de Árvore de Decisão usando diferentes combinações de variáveis demográficas, clínicas e laboratoriais. As análises revelaram os parâmetros do hemograma completo como os preditores mais influentes.

Definidos os preditores, o grupo usou os modelos de machine learning, incluindo Support Vector Machine (SVM), Árvore de Decisão e XGBoost, aplicando técnicas como Synthetic Minority Over-sampling Technique (SMOTE) e Random Undersampling para lidar com desbalanceamento de classes. O modelo XGBoost apresentou o melhor desempenho, com área sob a curva ROC (AUCROC) de 0,823, sensibilidade de 74% e especificidade de 74%, com uma diferença de AUROC <9% entre os conjuntos de treinamento e de teste. O desempenho foi consistente entre diferentes faixas de sexo, idade e raça/etnia, evidenciando a imparcialidade do modelo.

Impacto clínico e inovação

A análise com SHAP do modelo XGBoost mostrou que hemoglobina, contagem de monócitos e de basófilos foram os três parâmetros do hemograma completo mais influentes na previsão de mortalidade precoce. Esses parâmetros são advindos a partir de um exame simples, rápido e de baixo custo. Em cenários de recursos limitados, como grande parte da rede pública, um modelo baseado em hemograma pode apoiar decisões sobre intensificação de monitorização, escolha de esquemas menos intensivos e estratégias de seguimento mais próximas.

Os autores enfatizam que se trata de um estudo preliminar de centro único e que o próximo passo é validar o modelo em coortes multicêntricas maiores, reduzindo o risco de overfitting e aumentando a robustez e a generalização da ferramenta. Atualmente, encontra-se em andamento o processo de ampliação do conjunto de dados para validação multicêntrica no Brasil e em outros países da América Latina . A proposta alinha-se à tendência internacional de incorporar inteligência artificial à hematologia, explorando dados rotineiros para estratificar risco e personalizar tratamentos.

Participação do DIS/EPM 

O trabalho é fruto da colaboração entre o grupo de Leucemias da Escola Paulista de Medicina (EPM/UNIFESP) e o Departamento de Informática em Saúde (DIS/EPM) da Universidade Federal de São Paulo. Integram o estudo os autores Pedro Perez (autor principal - Residente em Hematologia e Hemoterapia), André Shimaoka (DIS/EPM), Antonio da Silva-Junior (DIS/EPM), José Marcio Duarte (DIS/EPM), Renata Queiroz, André Américo, Maria Luíza Dourado, Vinicius de Molla, Gabriel Cunha, Prof. Celso Arrais-Rodrigues, Prof. Fabio Kerbauy, Prof. Paulo Paiva (vice-chefe do DIS/EPM) e Prof. Alex Sandes (Orientador do projeto).​ A presença de pesquisadores do DIS/EPM foi decisiva para o desenho metodológico, implementação dos modelos de machine learning e interpretação dos resultados, fortalecendo a integração entre clínica e ciência de dados em saúde. 

“ É uma grande satisfação e honra representar a Unifesp/EPM no ASH 2025, um dos eventos mais relevantes do mundo da nossa área! Agradeço a todos os pacientes envolvidos no estudo, todos do departamento e a colaboração dos colegas do DIS/EPM que possibilitou a realização deste projeto. Modelos como esse podem ser uma solução inteligente e eficaz para diversos problemas clínicos. ”, afirma Pedro.