Deepseek est-il sûr? Voici ce qui ne partage pas avec l'IA chinois

Publié: 2025-01-28

Les attributs assez bon marché et efficaces sont deux attributs assez convaincants et attirent les amateurs d'IA intrigués du monde entier pour essayer le modèle d'IA génératif open source Deepseek .

Ironiquement, l'entreprise appartenant à des Chinois bénéficie d'un boom massif des clients, car le gouvernement américain met en garde contre les problèmes de sécurité nationale potentiels qui pourraient s'accompagner d'un service numérique chinois.

Mais, AI LLMS a besoin de données sur lesquelles se former, alors quelles données clients sont-elles en profondeur de collecte et d'envoi en Chine? Et que ne devriez-vous pas partager avec la plate-forme d'IA?

Quelles données sont la collecte de Deepseek?

Deepseek a un guide anglais en ligne sur les données qu'il recueille. C'est tout à fait une liste. Il comprend votre date de naissance; Adresse e-mail, numéro de téléphone et mot de passe que vous avez configuré. C'est assez standard. De plus, c'est une excellente occasion de vous rappeler que votre mot de passe devrait être différent sur chaque plate-forme que vous utilisez!

Cependant, comme il s'agit d'un modèle d'IA, vous remettrez également votre «entrée de texte ou audio, invite, fichiers téléchargés, commentaires, historique de chat ou tout autre contenu que vous fournissez à notre modèle et aux services».

À propos de Tech.co Vidéo miniature montrant l'écrivain principal Conor Cawley souriant à côté du logo Tech.co C'est juste dedans! Voir
les meilleures offres de technologie commerciale pour 2025 👨‍💻
Voir le bouton de liste

Les termes ajoutent également que si vous, en tant que client, contactez la chinois-venture, ils demanderont «une preuve d'identité ou de l'âge», et ces données qu'ils conserveront.

Plus de données que Deepseek recueille

Votre adresse IP, vos identifiants d'appareils uniques et vos cookies seront également automatiquement partagés lorsque vous utilisez Deepseek. Les identifiants incluent «votre modèle de périphérique, votre système d'exploitation, les modèles ou les rythmes de frappe, l'adresse IP et le langage système». Les rapports de crash et les journaux de performances sont également collectés.

Si vous payez des services de Deepseek, vos coordonnées de paiement seront également enregistrées et pour «Services à la clientèle» et «support après-vente». Jusqu'à présent, encore une fois, assez standard.

La dernière catégorie est «les informations provenant d'autres sources». Par exemple, si vous vous connectez à Deepseek à l'aide d'une connexion Apple ou Google, la société en recevra des informations. Et il y a aussi une note sur les annonceurs qui partagent des informations avec Deepseek, y compris «les produits ou services que vous avez achetés, en ligne ou en personne» en dehors du service.

Wired a examiné cette «activité sous-jacente» et dit que Deepseek partage des données avec le «géant chinois de la technologie Baidu, potentiellement à des fins d'analyse Web, ainsi que Volces, une entreprise chinoise d'infrastructure».

Devriez-vous vous préoccuper de Deepseek?

La grande différence entre Openai et Deepseek n'est pas les données que les entreprises collectent - en fait, elles font des choses similaires - mais où ces données se terminent. Deepseek envoie les données qu'elle recueille en Chine et est complètement ouverte à ce sujet. Il déclare: «Nous stockons les informations que nous collectons dans des serveurs sécurisés situés dans la République populaire de Chine.»

Il ajoute la terminologie légale assez standard selon laquelle elle partagera des données pour «se conformer à [ses] obligations légales», mais dans ce cas, cela signifie que les données peuvent être partagées à tout moment avec les responsables du gouvernement chinois. Cela signifie que les données de Deepseek peuvent être utilisées conformément à une loi de 2017, déclarant que les organisations doivent «coopérer avec les efforts nationaux de renseignement».

Le gouvernement chinois a le droit d'accéder aux données recueillies auprès des utilisateurs de Deepseek et peut les utiliser à des fins prétendument néfastes. Ceux-ci pourraient inclure la poussée de la propagande chinoise, qui est une accusation qui a été nivelée à Tiktok . En fait, certains utilisateurs de Deepseek rapportent déjà que certaines réponses aux rendements de l'IA ressemblent à de la propagande et certaines questions relatives aux sujets jugés sensibles par le gouvernement chinois - par exemple le massacre de Tiananmen Square - renvoient des blancs.

Que ne pas partager sur Deepseek

La grande question est de savoir si vous pensez que le fait que toutes ces données vont en Chine est un problème pour vous. Vous avez probablement tout entendu auparavant, mais il y a déjà des avertissements concernant la façon dont cette date peut être manipulée au profit du bénéfice chinois du régime chinois. Ceux-ci incluent des prédictions désastreuses sur les cyber-menaces qui ciblent directement l'Occident, utilisent l'ingénierie sociale et exploitent de grandes quantités de données sensibles.

Le fait que Tiktok comptait environ 170 millions d'utilisateurs mensuels actifs américains suggèrent que de nombreuses personnes ne sont pas trop préoccupées par ces menaces, malgré les avertissements répétés du gouvernement. Cela a absolument été supporté par l'explosion dans l'utilisation d'une autre plate-forme de médias sociaux chinois, RedNote , alors que l'interdiction de Tiktok se profile.

Si ce n'est pas une préoccupation pour vous - et que vous êtes également conscient des données que les modèles d'IA capturent en standard - alors prenez simplement des précautions raisonnables.

  • Si vous êtes un créateur, comme nous l'avons prévenu avec Chatgpt, si vous partagez vos œuvres originales, préparez-vous à être partagée avec un autre utilisateur
  • Ne saisissez aucune information sensible ou personnelle dans l'assistant d'IA, de telles données de santé ou personnelles
  • Ne l'utilisez pas pour stocker vos noms d'utilisateur / mots de passe
  • Sachez que vous pouvez également supprimer votre historique de chat dans Deepseek via l'option Paramètres
  • N'utilisez pas les modèles AI si vous utilisez un réseau de travail
  • Ne téléchargez pas de documents sensibles à l'entreprise ou d'informations sur les clients

Il convient également de noter que l'installation de l'application sur votre ordinateur permet un plus grand niveau de contrôle de la confidentialité, mais si vous n'êtes pas sûr de cela en premier lieu, il est peu probable que l'application s'asseoir sur votre PC fasse appel.

En fin de compte, si le sort de Tiktok est quelque chose à passer, le gouvernement américain est très susceptible de prendre des mesures contre les données américaines qui coulent librement vers la Chine. Les serveurs de données de Tiktok pour les clients américains n'étaient pas, après tout, en Chine, mais il était toujours considéré comme une menace à interdire.

Bien que les nouvelles offres d'IA soient amusantes - en particulier à faible coût et avec des capacités impressionnantes - les utilisateurs américains pourraient bientôt être obligés de revenir à des options «plus sûres» - même avec leurs tendances de saisie des données . Et ce n'est pas le moindre parce que Openai et Anthropic ont de l'argent américain sérieux derrière eux et que Deepseek ne le fait pas.