O que é Deepseek? A nova IA da China agora é de código aberto

Publicados: 2025-01-28

Deepseek é a mais recente IA multimodal.

Tecnicamente, a Deepseek é o nome da empresa chinesa que libera os modelos. Os próprios modelos atuais são chamados de "R1" e "V1". Ambos estão agitando maciçamente toda a indústria da IA ​​após o lançamento de 20 de janeiro do R1 nos EUA.

Por que? Ele vem com custos de desenvolvimento muito baixos, é de código aberto para uso comercial e prejudica os rivais como o OpenAI -no momento em que o governo dos EUA apostou mais do que nunca em seus próprios avanços de IA caseiros .

O que eu preciso saber sobre o DeepSeek?

O Deepseek oferece alguns modelos diferentes - R1 e V3 - além de um gerador de imagens. A principal coisa a saber é que eles são mais baratos, mais eficientes e mais gratuitos do que os principais concorrentes, o que significa que o ChatGPT da OpenAI pode ter perdido a coroa como a abelha rainha dos modelos de IA.

Aqui está o que saber sobre todos eles.

Deepseek R1

O modelo Deepseek que todo mundo está usando agora é R1.

Sobre Tech.co Video Miniatria mostrando o escritor principal Conor Cawley sorrindo ao lado do Tech.co Logoty Isso só em! Visualizar
as principais ofertas de tecnologia de negócios para 2025 👨‍💻
Veja o botão da lista

Está no topo da App Store -vencendo o ChatGPT-e é a versão que está atualmente disponível na web e em código aberto, com uma API disponível gratuitamente. Ao contrário de outros modelos baseados na China, com o objetivo de competir com o ChatGPT, os especialistas da IA ​​ficam impressionados com a capacidade que o R1 oferece.

Como o influente investidor de tecnologia Marc Andreessen colocou alguns dias atrás: "Deepseek R1 é um dos avanços mais incríveis e impressionantes que eu já vi - e como código aberto, um presente profundo para o mundo".

É muito mais barato de operar do que o chatgpt também: possivelmente de 20 a 50 vezes mais barato.

Há alguma escuridão em torno do tipo de chip usado para treinar os modelos da Deepseek, com algumas reivindicações sem fundamento afirmando que a empresa usava chips A100, que atualmente são proibidos da exportação dos EUA para a China.

Deepseek v3

No entanto, o outro grande modelo da empresa é o que está assustando o Vale do Silício: Deepseek V3.

O modelo V3 era barato para treinar, muito mais barato do que muitos especialistas da IA ​​pensaram possível: de acordo com a Deepseek, o treinamento levou apenas 2.788 mil horas de GPU H800, o que aumenta apenas US $ 5,576 milhões , assumindo um custo de US $ 2 por GPU por hora.

A V3 é um modelo mais eficiente, pois opera em uma arquitetura MOE de 671b-parâmetros com 37B parâmetros ativados por token-reduzindo a sobrecarga computacional exigida pelo ChatGPT e seu design de 1,8t-parâmetro .

Geração de texto para imagem: Janus Pro

Além disso, há Janus Pro , o gerador de texto para imagem da empresa.

A Deepseek relatou que seu modelo AI Janus-Pro-7b superou o Dall-E 3 do OpenAI e a difusão estável da AI , de acordo com um ranking de tabela de classificação para geração de imagens usando solicitações de texto.

Segundo a empresa, esse modelo foi treinado em "72 milhões de imagens sintéticas de alta qualidade".

Deepseek pode correr localmente

Uma última coisa a saber: o DeepSeek pode ser executado localmente , sem a necessidade de uma conexão com a Internet. Isso é parte integrante com o lançamento de código aberto do modelo: como o código está disponível no GitHub, ele pode ser baixado.

Isso marca outra melhoria em relação aos modelos populares de IA como o OpenAI e-pelo menos para aqueles que escolheram executar a IA localmente-significa que não há possibilidade de a empresa com sede na China acessar dados do usuário.

Em resposta, as ações da Nvidia são muito, muito abaixo

A Deepseek marca uma grande abrância para a abordagem popular da tecnologia de IA nos EUA: os modelos de IA da empresa chinesa foram construídos com uma fração dos recursos, mas entregaram as mercadorias e são de código aberto. A resposta inicial foi uma grande queda nos preços das ações para as maiores empresas de IA baseadas nos EUA.

A empresa de chips da AI Nvidia viu a maior queda de ações em sua história, perdendo quase US $ 600 bilhões em valor do mercado de ações quando as ações caíram 16,86% em resposta às notícias da Deepseek.

Quão ruim é isso? Bem, é mais do que o dobro do que qualquer outra empresa americana já apareceu em apenas um dia . Em outras palavras, não é ótimo.

A resposta da empresa até agora: admitiu que o modelo R1 da Deepseek é "um excelente avanço da IA".

Outras ações dos EUA também caíram

As ações também caíram em outros fabricantes de chips, como a empresa holandesa ASML, enquanto o S&P 500 caiu mais de 2% e a Nasdaq caiu 3,5%.

Muitos especialistas estão prevendo que a volatilidade do mercado de ações se acalma em breve. No entanto, pode marcar o fim de uma era para a constante tendência ascendente para empresas como a Nvidia, que haviam visto um crescimento incrivelmente alto desde o início de 2023.

Mas isso é uma boa notícia para alguns gigantes da tecnologia

Então, como a paisagem da IA ​​muda se o Deepseek é o próximo modelo da América?

A Meta é provavelmente um grande vencedor aqui: a empresa precisa de modelos de IA baratos para ter sucesso e agora o próximo avanço que economiza dinheiro está aqui.

A Microsoft também economizará dinheiro em data centers, enquanto a Amazon pode aproveitar os recém -disponíveis modelos de código aberto.

O Google, por outro lado, teria representado o máximo de dinheiro com todos esses data centers. Algo nos diz que a enorme gigante da tecnologia permanecerá à tona, no entanto. A longo prazo, a IA de código aberto barato ainda é bom para empresas de tecnologia em geral, mesmo que não seja ótimo para os EUA em geral.

Como os US $ 500 bilhões do Stargate Program fator de US $ 500 bilhões?

A interrupção Deepseek ocorre apenas alguns dias após um grande anúncio do presidente Trump: o governo dos EUA estará afundando US $ 500 bilhões em "Stargate", um empreendimento conjunto de IA com o Openai, Softbank e Oracle que visa solidificar os EUA como líder mundial em AI.

Entre os planos da iniciativa estão a construção de 20 data centers nos EUA , bem como a criação de "centenas de milhares" de empregos, embora a última afirmação pareça duvidosa, com base no resultado de reivindicações anteriores semelhantes .

Com esse investimento em dar água nos olhos, o governo dos EUA certamente parece estar jogando seu peso por trás de uma estratégia de excesso: despejar bilhões na solução de seus problemas de IA, sob a suposição de que pagar mais do que qualquer outro país oferecerá melhor IA do que qualquer outro país.

Agora, a Deepseek surgiu para cutucar um buraco nessa tese. Se o Deepseek puder obter os mesmos resultados em menos de um décimo do orçamento de desenvolvimento, todos esses bilhões não parecem uma aposta tão certa.

O mercado de ações - por enquanto, pelo menos - parece concordar.