Le réseau social Reddit, l'une des plus grandes archives de conversations humaines, donne accès à ses contenus à OpenAI [X-post !actualite@lemmy.world]
Tu as surement raison dans l'absolu, mais je suis un vieux désabusé qui pense que si tu laisses entrevoir une opportunité de profit à la plus belle des causes, tu as de grandes chances de corrompre l'idée originale à cause du facteur humain.
Mais c'est vrai aussi que ce n'est pas forcément systématique.
Perso de mon temps. J'essaye de faire plus de publication que ce à quoi pousse mon caractère parce que j'ai vraiment envie de voir cette communauté se développer et mes données perso aussi parce que j'ai jamais autant raconté ma vie dans tous le reste d'internet.
Il y a plusieurs années que OpenAI a déjà consommé tout les contenus publiques de Reddit sans leur permission. Les GPT 2 et 1 ont été utilisé sur les subreddits "subredditsimulator"
Je crois que le TLDR bot original n'utilisait pas GPT. Il simplement identifiait les phrases dans l'article qui etaient les plus "importants" (qui est décidé par quelque algorithme)
Le but n'est pas pour OpenAI d'accéder à ces données qu'ils ont déjà aspiré, c'est de rendre impossible la même chose par des groupes open source en prétendant que c'est illégal de le faire sans verser quelques millions à reddit.
On rappelle que certains textes, comme des articles de presse, ont interdit leur usage par l'IA. Il ne faut surtout pas recopier ces textes là dans ses messages reddit, ca serait illégal 🙃
Après, est-ce qu'on recopiant ses textes, on ne devient pas receleur? Je ne suis pas un expert en droit, mais ça peut être dangereux si on veut le faire systématiquement pour essayer que les IA soient poursuivies, on risque de se faire poursuivre dans la foulée 😅