Ces dernières années, la recherche en apprentissage automatique tabulaire a connu une croissance rapide, mais elle présente encore des défis importants. Les benchmarks académiques disponibles ne reflètent pas toujours les complexités des applications industrielles réelles, manquant souvent de métadonnées temporelles nécessaires ou de pipelines d’acquisition de données et d’ingénierie des fonctionnalités aussi complets que ceux de l’industrie.
Pour combler ces lacunes, des chercheurs de Yandex et de la HSE University ont introduit TabReD, un nouveau benchmark conçu pour être plus représentatif des applications industrielles. TabReD rassemble huit ensembles de données issus de domaines tels que la finance, la livraison de nourriture et l’immobilier.
Les ensembles de données de TabReD comprennent des informations cruciales souvent absentes des benchmarks académiques, comme des découpages basés sur des horodatages et une ingénierie des fonctionnalités plus poussée. Les tests ont montré que les stratégies de découpage temporel sont essentielles pour une évaluation précise, avec des modèles comme MLP avec des embeddings se révélant efficaces, contrairement à des modèles plus avancés dans ce contexte. TabReD ouvre de nouvelles perspectives de recherche pour améliorer l’implémentation des modèles ML dans des environnements de production réels.