Auteurs:
(1) Prerak Gandhi, Département d'informatique et d'ingénierie, Institut indien de technologie de Bombay, Mumbai, prerakgandhi@cse.iitb.ac.in, et ces auteurs ont contribué à parts égales à ce travail ;
(2) Vishal Pramanik, Département d'informatique et d'ingénierie, Institut indien de technologie de Bombay, Mumbai, vishalpramanik, pb@cse.iitb.ac.in, et ces auteurs ont contribué à parts égales à ce travail ;
(3) Pushpak Bhattacharyya, Département d'informatique et d'ingénierie, Institut indien de technologie de Bombay, Mumbai.
Dans cet article, nous avons rapporté un travail unique en son genre sur la génération automatique d'intrigues et de scripts à partir d'invites. L'évaluation automatique, l'évaluation humaine à l'aide de l'échelle de Likert et les observations qualitatives réalisées par des scénaristes professionnels de notre partenaire industriel (une grande plateforme médiatique réputée) justifient toutes la puissance de notre riche ensemble de données et de GPT3 dans la génération de scripts. Nous espérons que notre travail aidera les scénaristes d’émissions de télévision, les scénaristes de jeux télévisés, etc.
Il existe plusieurs orientations futures : (i) le déséquilibre dans l’ensemble de données sur les parcelles de Bollywood doit être rectifié ; (ii) il existe de nombreuses variations dans l'écriture indienne en raison du multilinguisme, un problème qui doit être abordé ; (iii) la faiblesse la plus évidente du GPT-3 est son incapacité à gérer des données factuelles et des chiffres, ce qui provoque des hallucinations et empêche la génération automatique de documentaires et de biographies. La détection et la résolution des hallucinations constituent de toute façon un besoin croissant de modèles de langage.
Cet article est disponible sur arxiv sous licence CC 4.0 DEED.