Talk:Main Page

From Tournesol
Jump to navigation Jump to search

Page Principale

Bienvenue sur le Wiki Tournesol

Ce wiki vise à soutenir l'application Tournesol.app 🌻 et à compléter le Livre blanc de Tournesol, en répertoriant et en organisant les références et les explications. Le wiki poursuit trois objectifs principaux :

  1. Clarifier le contexte scientifique et sociétal du projet, pour aider à clarifier les motivations de Tournesol.
  2. Expliquer les caractéristiques sociales et techniques de Tournesol, en particulier les algorithmes utilisés par la plate-forme.
  3. Accueillir et favoriser les propositions et les débats sur l'avenir de Tournesol.

Notez que certaines vidéos pour présenter Tournesol🌻 sont disponibles sur YouTube ProtocolLabs-21, AgoraENSAE-12-20, ainsi que deux articles universitaires publiés qui soulignent la nécessité de Tournesol🌻 Hoang-20, HoangFE-21.

Si vous avez une expertise ou des idées pertinentes sur les objectifs mentionnés ci-dessus, n'hésitez pas à contribuer au Wiki.

Le contexte scientifique et sociétal

Les algorithmes actuels reposent souvent sur le machine learning ou l'apprentissage machine, dont les récents développements ont permis des avancées impressionnantes en matière d'intelligence artificielle (IA). Toutefois, leur déploiement à grande échelle sur les réseaux sociaux pour traiter des quantités massives d'informations fait émerger de nombreux risques et défis à l'IA. Notamment au sujet de la sécurité et l'éthique de l'IA, surtout en raison des effets secondaires indésirables de la maximisation de l'attention par des algorithmes de recommandation personnalisés.

Les menaces importantes sont la désinformation, la mésinformation, la radicalisation, la manipulation, la cyber-intimidation, la haine, l'addiction, la capacité d'attention, la solitude, la dépression, les suicides, les préjugés, la vie privée, la transparence, le boycott/déplatformisation/amégaphonisation et l'augmentation des risques existentiels.

D'un autre côté, les algorithmes de recommandation alignés pourraient contribuer grandement à la communication scientifique, à la culture scientifique, à la curiosité scientifique, à la pensée probabiliste, au raisonnement contrefactuel, à la santé publique, à la santé mentale, au changement climatique, à la souffrance animale, à la justice sociale, à la philanthropie et au débat public.

Les domaines de la science pertinents pour la mise au point d'algorithmes robustement bénéfiques incluent des études sur les choix sociaux, la volonté/volition, le bayésianisme, la théorie de la complexité, les modèles de langage, l'apprentissage par renforcement, le reward hacking/le hacking de la récompense, la loi de Goodhart, les attaques contradictoires, les statistiques robustes, la sur-interprétation, les biais algorithmiques, l'interprétabilité, la convergence instrumentale, distributional shift/le déplacement distributionnel, la théorie de la décision, l'apprentissage et l'alignement des préférences, mais aussi l'étude des biais cognitifs, la réactance, la pédagogie, les incitations, la modération, la gouvernance de l'IA, le crowdsourcing/production participative, la pression sociale, la réglementation et la superintelligence.

La plateforme Tournesol

La motivation principale de Tournesol🌻, surtout à court et moyen termes, est de créer une base de données à grande échelle, fiable et sécurisée des préférences humaines. Ceci est essentiel pour la sécurité des algorithmes car, en raison du machine learning/apprentissage machine, les données manipulent les algorithmes.

Le code source de Tournesol🌻 est disponible sur GitHub (https://github.com/tournesol-app), et ouvert aux contributions.

Ce wiki vise à décrire l'architecture du code de Tournesol, et en particulier l'interface de Tournesol, afin de faciliter les futures contributions externes pour la programmation. Tournesol🌻 est axé sur le jugement humain concernant la qualité de vidéos en évaluant différents critères. Ces critères sont divisés en deux catégories. Les critères par défaut sont : fiables et non tendancieux, importants et applicables, engageants et stimulants. Les critères optionnels sont les suivants : encourager de meilleures pratiques, clair et pédagogique, accessible au grand public, diversité et inclusivité, résistance aux retours de bâton. La formulation et les définitions précises de ces critères font encore l'objet de débat. N'hésitez pas à nous faire part de votre opinion sur la page au sujet de ces critères de qualité.

Les contributeurs de Tournesol sont filtrés par leur capacité à valider les courriels provenant de domaines de confiance. La motivation principale est de protéger Tournesol🌻 contre les attaques réputationnelles par de faux comptes. Tournesol🌻 essaie également de faciliter l'expérience des contributeurs en s'appuyant sur une liste d'attente à évaluer et sur l'apprentissage actif pour l'évaluation de la sélection de vidéos sur la page de classement. Tournesol🌻 permet également aux contributeurs de sélectionner les paramètres de confidentialité concernant leurs évaluations.

Tournesol🌻 espère in fine constituer une grande base de données. La base de données principale de Tournesol recueille les contributions successives sur la plateforme. D'autres tables stockent des données brutes concernant les renseignements des contributeurs, les commentaires, les signalements, les métadonnées des vidéos et les paramètres utilisateurs. Tournesol gère également des bases de données secondaires sur les notes actualisées des contributeurs, leurs scores et les scores Tournesol.

Le modèle de Tournesol pour les scores informatiques s'appuie sur le modèle Bradley-Terry, l'apprentissage byzantin, strategyproof learning, score uncertainty and coordinate-wise binary convex optimization. Il accorde également une grande importance à l'interprétabilité et à la corrigibilité de nos données, algorithmes et résultats, via la partie sur les désaccords fréquents et la page relevant les incohérences. Tournesol propose également un suivi de notation pour faciliter l'étude de la volition/volonté.

La marche à suivre

Des recherches importantes doivent relever le défi de l'estimation des droits de vote appropriés, à la fois pour valoriser l'expertise et pour corriger les biais d'échantillonnage et les déplacements de la distribution. De nombreux développements futurs soulèvent un ensemble de dilemmes éthiques difficiles, qu'il est prévu de résoudre en construisant un méta-Tournesol. À long terme, la décentralisation de Tournesol est également envisagée, afin d'éviter de futures contraintes potentielles sur la direction de Tournesol, bien que cela soulève de nombreux défis importants en matière de recherche.