 鲜花( 61)  鸡蛋( 0)
|
周一(1月27日),美国三大股指开盘后大幅下跌,英伟达、微软、谷歌母公司Alphabet、Meta等主要科技股遭遇重挫。从华尔街到硅谷,一片惊慌。+ F( {7 p9 J# f9 g0 H7 B
8 m! t; l; k( O7 f' i4 g9 {
而这一切,均来自一家中国仅成立一年多的人工智能初创公司——深度求索(DeepSeek)。6 F: f" R# e( _+ l' j6 j% }
. x7 Y9 b9 c' G" f0 Q. K3 u' [6 J, U8 C2 ]* H% Q
01
" H M; Y7 U8 B# ^# y8 A7 ~* g1 q
. b9 Y5 Q8 z) G- Q) Z一夜之间,科技巨头们丢了多少钱?; S2 q6 ~+ R9 b- K; \
2 x. o6 p0 {. @, [5 l' _4 S
上周,深度求索公司DeepSeek展示了一款类似ChatGPT 的人工智能模型,名为:DeepSeek-R1。
7 L* I* ]2 q; {! \6 I# X3 g1 r, k+ t
这件事本来说大也不大,因为市面上很多公司都在做类似的人工智能模型。但DeepSeek的特殊之处在于:该模型的研发只用了两个月、成本不到600万美元,就训练出了与GPT-4不相上下的顶尖模型。
$ t' Q& ^$ {& u3 N ^& J6 C: V3 S" R
要知道OpenAI训练ChatGPT-4的成本高达7800万美元,甚至可能达到1亿美元。0 d/ u9 S& {' Z' y; p* ]
. J7 R) q. C8 x: Q+ ?' E& H1 v( B
Freedom Capital Markets的全球首席战略师杰伊·伍兹(Jay Woods)表示:“这项技术被认为比美国的模型更省电、更具成本效益,这让美国的科技投资者非常担忧。”+ D" `$ R+ T# v% |, M& b( U
' C( T2 M# t9 q简单来说就是,中国的这款模型研发时间短、成本低、功能性强、对AI芯片的依赖低。这些优点放在一起简直就是绝杀!
5 y! @. Y. o8 p: t7 x3 T" ]' D! S1 t/ ]8 O) F- }+ @
Deepseek在苹果中国和美国地区的应用商店免费APP下载排行榜上均登顶,直接超越了ChatGPT。' g9 E, x7 s9 i7 p) ]2 m1 \
: [. G; p& q1 c. }一夜之间,美国最具影响力的几家科技巨头都饱受重创。0 u' a, T: M9 [' ?% a5 X, w
3 y" {* [- T5 Q1 V5 i首当其冲就是英伟达,在过去的一年半里,英伟达依靠人工智能的推波助澜,股票一路上涨。但就在昨日,英伟达的股价暴跌17%,市值蒸发了6000亿美元,创下了股市历史上单日最大损失。1 y6 g/ Y; X& k
- F0 |* m) I& \: w+ w& j9 N与此同时,半导体设备制造公司ASML的股价下降了6%,Broadcom股价也下跌了17%。
- U. W7 K6 v+ ~; p- s/ z2 j! p# K) b; \6 C% W# P( s
谷歌的母公司Alphabet下跌超过4%,投资OpenAI的微软下跌近3%。
* ]6 f* B9 G6 _6 i
( y! z' I9 X C" W- {; k其次是一些能源类公司的股票,投资者担心新技术可能需要更少的能源来运行,从而减少科技行业对能源的需求。生产风力和燃气涡轮机的GE Vernova公司股价暴跌21%,电力公司Vistra下跌了28%。- ^" |2 J! @: j% f, I! w
$ E5 R" A4 K# ^# U3 L: C G' {以科技股为主的纳斯达克指数下跌了3%,跌幅达612点;标准普尔500指数下跌了1.5%;仅道琼斯工业平均指数则上涨了0.7%。
: U2 d! `5 u& Q' |: R. b* X) k0 j. X3 r+ v' ]6 S% v
就昨天一天,美国股市亏损了1万亿美元,直到今天都回弹无力。
7 j) |3 `3 q$ \' p5 C K8 P9 {2 o. k; P& a' w& i$ b
% |! B) T% i& e, t+ Z" L0 A白宫人工智能和加密货币负责人David Sacks在X上表示,DeepSeek的出现表明人工智能领域的竞争将变得非常激烈,“我对美国的未来充满信心,但我们不能因此而自满。”
% D) g$ M+ g& [: [: G* ?0 K2 b- I ^0 p2 P( U
- F9 n, s1 l- g$ y' ?
02
& `0 `: _; ]+ x' f/ n
8 L, |1 O' {6 J0 T$ J) k为什么DeepSeek会引发如此大的恐慌?# F1 H1 {/ V* s* P4 P8 P1 {
$ x) Y, @" N x- ?首先,Deepseek人工智能的高性价比正在冲击美国大模型的垄断地位。它的训练成本仅为同性能模型的5%到10%。这种新型的训练方法大幅度降低了大模型行业的入门门槛,使得大规模预训练不再是科技巨头的专利。
6 W/ S1 ?8 S2 s" q
% k5 V5 g1 b' V7 y2 V. q, _5 BDeepSeek推出的新模型DeepSeek-R1,价格为2.2美元/百万词元,而同性能的OpenAI模型费用为60美元/百万词元,DeepSeek的价格仅为OpenAI的三十分之一。这一“低成本”标志着推理大模型的调用进入了平价时代。
% k5 _& s9 F! \4 s( z# \- S% f
- d- i1 a5 e: {& f& Z% G因此,无论从基础研究角度还是从商业层面来看,DeepSeek在训练和推理方面的优势,对美国一些大模型公司既有模式造成了较大的冲击。
: ~ r u$ ^) u3 y+ P: e5 j/ n
; M- m/ W$ c% s其次,DeepSeek公司的模式创新引发美国高新技术人员的恐慌。DeepSeek通过采用不同于美国大模型的训练模式,大幅降低了开发成本。' J" J3 E) v; f. d2 B9 \. v* P
: V* ^6 W1 r* E$ r5 t
与OpenAI依靠大量算力和海量数据提升性能的“人海战术”不同,DeepSeek通过算法对数据进行总结、分类并选择性处理后输入大模型。这种方法优化了算力使用,降低了成本,同时提升了模型性能。% i# }0 y! g$ \' @* e, p- h5 v
2 W% H2 {0 Y$ n* {) o# u; s; M% }' ~! BMeta公司为训练Llama投入了大量资金,但效果却不如成本极低的DeepSeek。Meta高层已经开始思考,是否公司资金被浪费在了效果不佳的技术上。9 [- [" t. D* D6 M& t+ Z. [
6 q: g1 T# P0 }4 z5 E
这种反思引发了许多企业技术人员的恐慌,如果公司开始质疑他们的技术能力和创新性,自己可能会因此失去工作。
! ~! }/ G" N# t6 u6 j% |- z- I
# T. N! o! a1 W9 m; T) S9 [5 g8 V o. ?& J
03
6 @7 K( b! [) \& n$ Q3 \: N. S1 j# t
Deepseek被“挤”到宕机4 Y0 j2 V( V( {( G r4 x
' g- `/ ~0 k- L& g
DeepSeek旗下AI服务在上线后的24小时内多次发生宕机。1月27日:
/ Z! K2 `0 F0 Y上午10点55分:第一次大规模宕机,DeepSeek的API服务完全不可用。: l3 p6 s5 M* P# H: B
11点32分:DeepSeek-R1 API服务恢复正常,紧接着在14点21分,DeepSeek-V3 API服务也恢复了。: W* p; \ r4 i& Y2 ^; k
14点37分:第二次大规模宕机发生,导致DeepSeek的网页和API服务再次无法使用,问题在16点43分才得到解决。( q9 h# Z& {' ^/ T
20点16分:DeepSeek出现无法登录和注册的问题,直到21点32分才恢复正常。
1 u/ T3 K% z [ s; V- {; o21点33分:DeepSeek网页和API再次出现性能问题,影响了API服务和网页对话服务。
) X& S; W% N+ J& n# S9 R: i( j: C7 G9 E7 i2 M9 f
DeepSeek随后回应称,“近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。”
6 G/ D" x3 X2 N+ W8 K
8 G6 D. o7 c$ u9 G3 V$ B+ O# e
$ N6 u6 p/ F7 A: C对于DeepSeek这匹“黑马”,你怎么看?
6 S, @) y4 z- U' J4 e9 g! m0 D4 Z; U' m! ]- V& m4 s
它会取代GPT的地位吗?
: M* d) H1 I! H) D6 N0 B3 z$ d; C# v3 c3 `' V# U
欢迎给我们留言 |
|