电竞比分网-中国电竞赛事及体育赛事平台

分享

免費的谷歌,正在暗中發(fā)力

 kibcat 2025-05-10 發(fā)布于美國

周三,美股傳來消息,蘋果高管 Eddy Cue 在美國司法部的聽證會上宣稱,用戶使用內置在iPhone里的搜索功能進行的搜索次數,首度下降。

消息一出,谷歌股票應聲下跌,最高達 9%,是當日美股科技七巨頭中跌幅最大的一支。

谷歌這幾年步履蹣跚,主線搜索業(yè)務群狼環(huán)伺,似乎下一步就會被 AI 搜索取而代之。就在一年多前,谷歌在 AI 圖片生成上的探索還遭到群嘲。當時,已經整合 Bard 并采用新名字的 Gemini,在用戶生成歷史人物時“過度多元化”,將美國開國元勛,教皇,甚至納粹士兵渲染成深膚色人物。

馬斯克在 2 月 27 日發(fā)推,批評谷歌存在“種族與性別偏見”。

谷歌現任 CEO 皮查伊 在內部備忘錄中稱此事“令人反感且不可接受”,要求公司在技術和流程上做結構性的改進。

這不是谷歌第一次在 AI 探索上遭遇滑鐵盧。2022 年,谷歌大腦團隊公布了 5400 億參數的 PaLM 模型,刷新參數規(guī)模記錄,同時展示谷歌多年在大模型研究上的深厚積累。但在公司內部,對生成式 AI 的態(tài)度依然謹慎。

2022 年 6 月,谷歌研究員布雷克·萊莫伊聲稱 LaMDA 模型具有人格,引發(fā)輿論風波。谷歌否認,隨即將其解雇。

在道德上一直身體力行的谷歌,有了偶像包袱,做事瞻前顧后,事事以“大局為重”。對外界批評格外敏感。

這給了后來者機會。

2022 年 11 月 30 日,名不見經傳的 OpenAI 推出AI 聊天應用 ChatGPT,短短幾天,用戶過百萬。ChatGPT 流暢的對答,廣泛的知識以及創(chuàng)作能力震動了整個科技界。

盡管谷歌在 AI 上的論文堆積成山,卻在這一刻毫無還手之力,只能看著 OpenAI 一騎絕塵。眼光獨到,很早牽手 OpenAI 的微軟,此時心花怒放。bing 終于有救了。

2022 年 12 月,皮查伊打電話給谷歌的兩位創(chuàng)始人求助。已經退居二線 3 年多的佩奇和布林回歸,批準了在谷歌搜索中加入 AI 聊天機器人的計劃。

2023 年,Bard 立項。皮查伊宣布了谷歌歷史上首次大裁員。他砍掉了12000 個崗位,約占谷歌總員工數的 6%。

我想起在谷歌上班的老同學。他的工作狀態(tài)令人羨慕。上午 11 點到公司,查郵件,回復消息,中午在公司吃飯,下午 2 點多下班回家,陪兒子踢球。那時候的谷歌,堪稱最適宜養(yǎng)老的科技公司之一。

我們在蘋果公司對面的餐館里吃飯,杯籌交錯,四周彌漫著一股紙醉金迷的味道。

狼來了,不管你想還是不想。

2023 年 3 月,皮查伊在內部要求團隊“大膽而負責”地加快產品迭代。為了調試 Bark 模型,谷歌幾乎耗盡了一些數據中心的電力冗余,員工加班成為常態(tài)。養(yǎng)老公司成了初創(chuàng)企業(yè)。

2023 年 4 月,皮查伊將谷歌的兩大 AI 團隊Google Brain和 Deepmind 合并,組建新的事業(yè)部:Google DeepMind。新事業(yè)部致力將谷歌送上通用人工智能的發(fā)展軌道。

原 DeepMind 主管,現任 Google Deepmind 主管哈薩比斯提議將項目命名為“Titan”,但董事會覺得名字過于張揚。原 Google Brain 主管,現任 Google Deepmind 首席科學家的迪恩建議改稱“Gemini”(雙子座)。

Google Gemini 于是誕生。

2023 年底,谷歌發(fā)布 Gemini 大模型。Gemini 在標準測試的 32 項任務中,有 30 項任務得分超過 GPT-4。

但 OpenAI 的領先地位依然穩(wěn)固。

為了異軍突起,谷歌為 Gemini 開發(fā)出突破性的超長上下文窗口。工程師通過讓海量 TPU 芯片高速通信并行處理,使大模型可以一次處理成千上萬頁文本或者整部視頻。

Gemini 的上下文窗口是當時 ChatGPT 的幾百倍。

為了突出這一優(yōu)勢,谷歌研究院的曼尼卡有了想法。他想做一個應用,將長論文自動生成音頻講解,幫助用戶“消化每周arXiv上冒出的海量論文”。

產品幾經雕琢,最后成型,它的名字是 Notebooklm。

Notebooklm 的產品理念相當清晰,開發(fā)者只負責建造框架,真正解決問題的能力依靠大模型不斷地演化。

前不久,Notebooklm 的底層模型終于從 Gemini 1.5 升級到了 2.0,文本處理和生成能力得到巨大提升。

我最常用它來對長視頻做筆記,做四維導圖,做內容整理。Notebooklm 的幻覺極低,極少做指定內容來源以外的“聯想”和“推測”。不懂就是不懂。用戶提供的材料里沒有,就是沒有。

本周,Gemini 發(fā)布大模型的新版,gemini 2.5 pro 0506 preview。新模型在各項測試中屠榜,代碼生成能力和網頁設計審美達到新的高峰。

它甚至能夠根據視頻,生成一份網頁版解讀。我把油管視頻發(fā)給它,在一大段思考之后,它給出了結果。

Image

html 代碼下載到本地之后,配圖有缺失,但基本要求能滿足。

不僅如此,gemini 高級版悄悄上線了 Veo2,文本生成視頻功能,可以根據提示詞生成 8 秒長的視頻。

Image

以上功能免費用戶都可以享受,谷歌正在暗中發(fā)力。

回到周三蘋果高管的證詞。他的語境是美國司法部對谷歌涉嫌壟斷的聽證會。這樣的證詞恰好對谷歌在搜索上的壟斷地位做了削弱。如果沒有壟斷,是不是就不制裁了?

在能夠預見的將來,iPhone 里內置的搜索引擎依然會是谷歌。谷歌在 AI 搜索上的進展也遠比外界想象得深入。

這一個月,我用 Gemini 的時間遠超花了錢的 ChatGPT。Gemini 像任勞任怨的老黃牛,又像不放心孩子的老母親,啰嗦又貼心,不偷懶,不耍滑。

已近中年的谷歌,還在慢慢變強。

#谷歌 #人工智能 #AI 

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發(fā)現有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多