paint-brush
Une méthode de synthèse puis de recherche pour répondre à des questions vidéo longues : exemples d'invitespar@kinetograph

Une méthode de synthèse puis de recherche pour répondre à des questions vidéo longues : exemples d'invites

Trop long; Pour lire

Dans cet article, les chercheurs explorent le contrôle qualité des vidéos sans prise de vue à l'aide de GPT-3, surpassant les modèles supervisés, en tirant parti des résumés narratifs et de la correspondance visuelle.
featured image - Une méthode de synthèse puis de recherche pour répondre à des questions vidéo longues : exemples d'invites
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

Cet article est disponible sur arxiv sous licence CC 4.0.

Auteurs:

(1) Jiwan Chung, MIR Lab Yonsei University ( https://jiwanchung.github.io/ ) ;

(2) Youngjae Yu, MIR Lab Yonsei University ( https://jiwanchung.github.io/ ).

Tableau des liens

B. Échantillons rapides

Nous utilisons les invites suivantes pour chaque étape de Long Story Short. Nous cassons les lignes pour plus de visibilité et désignons les sauts de ligne réels par \n. De plus, les éléments répertoriés dans les invites sont abrégés à l’aide de points de suspension (...).


Scénario à tracer.


Je suis un robot narrateur très intelligent.

Si vous me donnez un script, je le donnerai

vous le court résumé en détail.\n\n

[Scénario généré]\n\n

Synopsis:


Recherche d’index de tracé.


Terrain :\n

(1) [Tracé1]\n

(2) [Tracé2]\n

...\n

(N) [TracéN]\n\n

Je suis un robot répondant aux questions très intelligent.

Si vous me posez une question, je vous répondrai

un index du tracé que vous devez rechercher pour le résoudre.\n

Q : [Question]\n

Index des 1 premières parcelles : (

Terrain :\n

(1) [Tracé1]\n

(2) [Tracé2]\n

...\n

(N) [TracéN]\n\n

[Scénario généré]\n\n

Je suis un robot très intelligent qui répond aux questions d'intrigue.

Si vous me posez une question et des candidats, je vous donnerai

l'index de réponse.\n

Q : [Question]\n

Candidats :\n

(1) : [Réponse1]\n

...\n

(5) : [Réponse5]\n

UN: (