Même s’il s’agit d’un organisme à but non lucratif, TED reste une entreprise avec des investisseurs qui veulent voir des retours sur les chiffres, notamment par rapport au nombre de visualisations sur Youtube, et les revenus conséquents des publicités.

Ce projet vise à prédire cette popularité grâce un certain nombre de variables.

QU’EST CE QUE TED TALKS ?

TED (technology, entertainment and design), des idées qui méritent d’être démocratisées.

La conférence TED est fondée en 1984 par Richard Saul Wurman et Harry Marques et se déroule tous les ans à partir de 1990.
L’événement est dirigé depuis par Chris Anderson et appartient à son organisme à but non lucratif The Sapling Foundation, consacrée à « la puissance des idées pour changer le monde ».

La conférence TED définit sa mission comme « propagateur d’idées », et met gratuitement à la disposition du public les meilleures conférences sur son site Web. Les exposés couvrent un large éventail de sujets, tels que la science, les arts, la politique, les questions mondiales, l’architecture, la musique et plusieurs autres sphères de compétences.

LES QUESTIONS DES INVESTISSEURS

Même s’il s’agit d’un organisme à but non lucratif, TED reste une entreprise avec des investisseurs qui veulent voir des retours sur les chiffres, notamment par rapport au nombre de visualisations sur Youtube, et les revenus conséquents des publicités.

Ce que l’on remarque est que désormais les TED Talks sont devenus des évènements « Hype » : faire une TED signifie être une personnalité innovante et porteuse de grandes idées.
La tonalité de la voix, les power pauses et les anecdotes personnelles font désormais partie du « style TED ».

Un pattern se dessine :  anecdotes personnelles, humour – de moins en moins pertinent par rapport au sujet de la conférence.

La question est donc la suivante : est-ce que les investisseurs financent plutôt l’ego des speakers ?

Malheureusement l’ego n’est pas quelque chose que l’on peut mesurer. Par contre nous pouvons mesurer la durée des conférences et observer si elle peut influencer le nombre des visionnages.

IN MEDIO STAT VIRTUS

Le premier step a été de faire une première visualisation de mon dataset – téléchargé de kaggle.com –  en croisent le nombre de visualisations et la durée des conférences.
On peut voir à travers le graphique ci-dessous qu’il y a une progression de visualisations entre les 15 et les 20 minutes, peut-être dû au fait que la majorité des conférences ont cette durée.
On observe que cette agrégation se situe au milieu du graphique (carré jaune). Vraisemblablement les organisateurs ou les speakers se sont rendus compte que c’est la durée idéale.

IN GOD WE TRUST, OTHERS MUST BRING DATA

Afin de savoir s’il y a réellement une corrélation entre les visualisations et la durée (à savoir si les visualisations sont dépendantes de la durée) il faut construire en machine learning un modèle de régression linéaire simple (en ayant juste 2 variables) qui prend en compte comme variable indépendante la durée (x) et comme variable dépendante (y) les visualisations.
On va apprendre à la machine comment mettre en relation les deux variables afin de ressortir comme résultat un graphique qui montrera s’il existe une corrélation ou pas.

LE RÉSULTAT

En observent les résultats obtenus, il y a aucune corrélation entre la durée et les visualisations, donc ce n’est pas la durée d’une conférence qu’influera sur le nombre des visualisations.

Le conseil à donner à TED sera donc plutôt de couper les speakers afin de faire sortir plus de vidéos et en conséquence d’avoir plus de visualisations et de revenus sur les spots.