爽好舒服快网站视频,亚洲欧美日韩国产高清在线观看

瑜伽常識 /MANUAL

谷歌放大招 AI搜索引擎來了發(fā)布最強AI模型！發(fā)布會現(xiàn)場：總共提了120次AI、視頻模型登場

2024-05-28 02:12:07

瀏覽次數(shù)：次

　　【谷歌放大招 AI搜索引擎來了發(fā)布最強AI模型！發(fā)布會現(xiàn)場：總共提了120次AI、視頻模型登場】雖然被OpenAI搶在前面發(fā)布了重磅新品演示，但谷歌后發(fā)制人，做到了OpenAI還沒能做到的事，率先發(fā)布人工智能（AI）搜索引擎，捍衛(wèi)搜索領(lǐng)域的王者地位，同時對壘OpenAI新發(fā)布的旗艦?zāi)Ｐ虶PT-4o，以升級版的最強大AI模型Gemini迎戰(zhàn)。

　　雖然被OpenAI搶在前面發(fā)布了重磅新品演示，但谷歌后發(fā)制人，做到了OpenAI還沒能做到的事，率先發(fā)布人工智能（AI）搜索引擎，捍衛(wèi)搜索領(lǐng)域的王者地位，同時對壘OpenAI新發(fā)布的旗艦?zāi)Ｐ虶PT-4o，以升級版的最強大AI模型Gemini迎戰(zhàn)。

　　從北京時間5月15日凌晨1點開始，谷歌在山景城總部附近的海岸線圓形劇場，召開了長達(dá)兩個小時的年度I/O開發(fā)者大會Keynote演講。

　　與預(yù)期一致，谷歌的這場發(fā)布會基本都是在談AI、AI、AI、AI和AI。根據(jù)發(fā)布會最后的官方統(tǒng)計，整場Keynote的演講稿里總共提了120次AI。

　　谷歌CEO Sundar Pichai表示，谷歌所有的工作都圍繞生成式AI模型Gemini來做，“我們希望每個人都能從Gemini所做的事中受益。”AI搜索正是Pichai提到的Gemini融入谷歌多種服務(wù)之一。

　　同時谷歌搜索也將具備多步驟推理能力，可以一次性處理帶有多個限制條件的長問題，并支持“拍視頻”搜索解決方案的新搜索形式。

　　另外以上下文窗口“長”聞名的Gemini 1.5 Pro大模型，在今年晚些時候?qū)?00萬Tokens的窗口，進(jìn)一步擴大至200萬Tokens，拓展同步處理多模態(tài)信息的邊界。而對于一些需要快速響應(yīng)的場景，谷歌也推出了Gemini 1.5 Flash模型。今年2月剛剛問世的Gemma開源模型，也將在下個月迎來參數(shù)量更大的Gemma 2。在多模態(tài)領(lǐng)域，谷歌也發(fā)布了文生圖工具Imagen 3、與Youtube&音樂家合作的“AI音樂沙盒”，以及最新的視頻生成模型Veo。而多模態(tài)Gemini Nano模型也將在今年晚些時候登陸Pixel手機，這是在本地運行的機載模型。

　　值得注意的是，谷歌的發(fā)布會上也有一些與昨日OpenAI發(fā)布會“雷同”的地方——實時AI助手。從今年夏天開始，Gemini也將支持語音實時交互，同時今年晚些時候還將上線實時視頻交互。未來幾個月內(nèi)，谷歌也將推出類似于GPTs的自定義AI助手功能，叫做Gems，能夠與整套“谷歌全家桶”聯(lián)動。

　　硬件方面，谷歌宣布了第六代TPU芯片Trillium，并透露能夠在明年初用上英偉達(dá)最新的Blackwell架構(gòu)GPU。另外，液冷、光纜等中國股民可能會感興趣的題材也在發(fā)布會上出現(xiàn)。

　　谷歌稱，推出號稱有史以來最強大AI模型Gemini Advanced三個月內(nèi)。從本周二起，谷歌在Gemini Advanced中加入新模型成員Gemini 1.5 Pro，稱它擁有的上下文窗口在全球消費類聊天機器人中最長，窗口起始就有100萬個token。Gemini 1.5 Pro將向150 多個國家地區(qū)的Gemini Advanced訂閱者提供，支持超過35 種語言。

　　Pichai稱，Gemini 1.5 Pro“提供了迄今為止所有基礎(chǔ)模型中最長的上下文窗口?！?他介紹，Gemini 1.5 Pro將擁有200 萬個token的上下文窗口，是當(dāng)前模型100萬個token窗口的兩倍。

　　谷歌稱，今年夏季將擴展 Gemini 的多模態(tài)功能，包括增加用語音進(jìn)行深入雙向?qū)υ挼哪芰?，該功能被稱為 Live。通過 Gemini Live，用戶可以與 Gemini 交談，并可以從各種自然的聲音中選擇它回應(yīng)的聲音。用戶甚至可以按照自己的節(jié)奏說話，或者在回答過程中打斷并澄清問題，就像在任何人類對話中一樣。

　　谷歌稱，今年夏季，將在Gemini Advanced 中添加新的旅行規(guī)劃功能。借慮時間和空間方面物流的先進(jìn)推理，Gemini將能夠創(chuàng)建個性化的行程，節(jié)省用戶的工作時間。

　　未來幾周，谷歌將在Gemini Advanced中添加新的數(shù)據(jù)分析功能。用戶只需上傳電子表格，Gemini 就可以分析數(shù)據(jù)、制作圖表，并更快地發(fā)掘見解。

　　谷歌將推出被稱為Gem的Gemini的定制版本。Gemini Advanced 訂閱者將很快可以獲得更個性化的體驗，根據(jù)自己的需要創(chuàng)建Gemini，只需描述用戶希望 Gem 做什么以及希望它如何響應(yīng)，就可以讓它化身健身伙伴、主廚幫手、編代碼的拍檔或者創(chuàng)意寫作指南。

　　谷歌官宣推出新的多模態(tài)AI項目Project Astra，它可以為用戶解釋智能手機拍到的東西。在谷歌展示的視頻中，只要將手機攝像頭對準(zhǔn)某個物體，Gemini就可以識別它，比如一個紅蘋果，還可以回答諸如鏡頭中什么東西是可以發(fā)聲的這種問題。

　　谷歌稱，將很快為模型Gemini Nano添加多模式功能。這意味著，用戶的手機可以通過文本、圖像、聲音和口語，按照用戶理解的方式理解世界。

　　谷歌稱，端側(cè)安卓系統(tǒng)手機版的Gemini Nano將更有幫助，更有上下文的意識。今年，安卓手機的用戶將可以將生成的圖像拖放到Google Messages 和 Gmail 中，并可以直接在手機上提出有關(guān)YouTube視頻和 PDF文件的問題，得到解答。

　　谷歌稱，今年晚些時候，Gemini Nano的輔助功能TalkBack將增強。圖像描述將更加清晰和豐富，幫助弱視用戶和盲人用戶通過語音反饋，更好地指示他們的手機。

　　皮查伊表示，現(xiàn)在已經(jīng)有超過150萬開發(fā)者正在使用谷歌的Gemini，今天將展示一系列有關(guān)搜索、圖片、工作套件、安卓系統(tǒng)等等與有關(guān)的案例。

　　皮查伊宣布，能夠總結(jié)谷歌搜索引擎結(jié)果的“AI概覽”（AI Overviews）功能，將于本周在美國推出。

　　---基于Gemini支持，谷歌圖片（Google Photos）將支持用戶存儲圖片的AI搜索，例如“告訴我，我的車牌號碼是多少？”——這個名為Ask Photos的功能將于今年夏天推出。

　　皮查伊宣布，最新版本的Gemini 1.5 Pro（在多項核心功能方面均較最初發(fā)布版本有所提高）現(xiàn)在向全球所有開發(fā)者開放。從今天開始，支持100萬tokens上下文窗口的Gemini 1.5 Pro將在Gemini Advanced功能下向用戶開放，支持35種語言。

　　谷歌同時面向開發(fā)者推出支持200萬tokens的Gemini 1.5 Pro模型的預(yù)覽，并表示最終的目標(biāo)將是“無限上下文”。

　　谷歌AI業(yè)務(wù)總負(fù)責(zé)人、DeepMind的首席執(zhí)行官杰米斯·哈薩比斯登臺，宣布推出Gemini 1.5 Flash大模型。這個模型兼具速度與效率，和多模態(tài)推理能力，以及長達(dá)100萬tokens的上下文窗口。開發(fā)者將能夠申請體驗200萬tokens的上下文窗口的Gemini 1.5 Flash。

　　谷歌展示“未來的人工智能助手”——名為“Astra”的項目。哈薩比斯表示，這樣的AI助手需要像人類一樣理解這個動態(tài)且復(fù)雜的世界。需要記得住它看到的東西，這樣才能理解對話并付諸于行動。同時它也得能積極主動接受教導(dǎo)，以及自然、無延遲地進(jìn)行交流。在演示視頻中，谷歌的AI助手能夠通過攝像頭視頻，識別“什么東西能發(fā)出聲音”、“現(xiàn)在身處何地”等指令。

　　谷歌宣布了一系列與圖像、音樂、視頻有關(guān)的生成式AI工具。包括文生圖工具Imagen 3、與Youtube以及音樂家合作的“AI音樂沙盒”，以及最新的視頻生成模型Veo。

　　其中最受關(guān)注的視頻生成模型Veo，能夠根據(jù)文字、圖片和視頻的提示，生成高質(zhì)量1080p視頻。

　　哈薩比斯離場，皮查伊重回舞臺，發(fā)布第六代TPU芯片Trillium，較上一代芯片的算力表現(xiàn)翻4.7倍，云用戶從今年下半年開始可以用上新芯片。同時谷歌云將在2025年初，用上的最新Blackwell架構(gòu)GPU。

　　皮查伊開始介紹自家的AI超級計算機，比起用戶自己買相同的硬件和芯片，谷歌的架構(gòu)能使得效能翻倍，其中有部分功勞來自于液冷系統(tǒng)。皮查伊表示，谷歌部署液冷系統(tǒng)的數(shù)據(jù)中心已經(jīng)達(dá)到1GW，而且還在不斷增長中。

　　皮查伊表示，谷歌投資了200萬英里的地面和海底光纖，比第二名的云服務(wù)商翻了十倍。液冷、光纜，應(yīng)該都是股民們會感興趣的東西。

　　谷歌搜索業(yè)務(wù)負(fù)責(zé)人Liz Reid開始具體介紹AI Overviews功能。Reid表示，在進(jìn)行搜索時，搜素引擎具備多步驟推理的能力，例如尋找一個瑜伽教室，同時展示新手優(yōu)惠報價，和距離特定位置的步行時間。這個AI搜索引擎助手，還能介紹食譜、安排行程，以及接受視頻形式的提問（例如視頻中的相機怎么使用）。

　　谷歌Gemini總經(jīng)理Sissie Hsiao介紹了Gemini App的更新ayx愛游戲·體育官方網(wǎng)站。與周一的OpenAI一樣，從今年夏天開始，Gemini也將支持語音實時交互，同時今年晚些時候還將上線實時視頻交互功能。未來幾個月內(nèi)，谷歌也將推出類似于GPTs的自定義AI助手功能，叫做Gems。這個AI助手的亮點，將是能與“谷歌全家桶”進(jìn)行交互。

　　Hsiao再次強調(diào)了Gemini的長上下文窗口——能夠一次性處理整整1500頁的文件，或3萬行代碼、1小時視頻。不同的載體也能混同一起提交給聊天。她再次強調(diào)，今年晚些時候上下文窗口將翻倍至200萬Tokens。

　　安卓生態(tài)系統(tǒng)的負(fù)責(zé)人Sameer Samat登臺，他將討論今年安卓系統(tǒng)實現(xiàn)的“三大突破”，分別是“畫圈圈搜索”、Gemini手機AI助手，第三是在手機本地運行的AI。

　　谷歌表示，今年晚些時候，能夠在本地運行的多模態(tài)Gemini Nano模型將登陸Pixel手機，意味著手機將能通過文字、圖片、視頻、音頻，理解用戶的世界。舉例而言，在聽到“幫你把錢轉(zhuǎn)到安全賬戶”這樣的電話時，手機會自動彈出警告。整個過程都是在本地運行，不會引發(fā)隱私泄露。

　　對于在今年二月剛剛推出的輕量級開源模型Gemma，谷歌宣布推出視頻語言模型PaliGemma，并將會在6月推出Gemma 2。相較于第一代模型只有20億和70億的參數(shù)量，第二源Gemma的參數(shù)量能達(dá)到270億。

　　作為發(fā)布會最后的彩蛋，谷歌CEO皮查伊最后用Gemini總結(jié)了今天的發(fā)布會稿子里總共提了多少次AI——120次。當(dāng)然，這并不包括皮查伊問完這個問題后，又喚了幾遍AI。

上一篇：怎樣使用瑜伽輔具？這6種最常見的輔具器材到底怎么用？

下一篇：繼續(xù)閱讀

首頁

關(guān)于愛游戲

新聞中心

產(chǎn)品展示

留言板

瑜伽常識

聯(lián)系愛游戲

瑜伽常識 /MANUAL

谷歌放大招 AI搜索引擎來了發(fā)布最強AI模型！發(fā)布會現(xiàn)場：總共提了120次AI、視頻模型登場

友情鏈接：

聯(lián)系我們

首頁

關(guān)于愛游戲

新聞中心

產(chǎn)品展示

留言板

瑜伽常識

聯(lián)系愛游戲

瑜伽常識 /MANUAL

谷歌放大招 AI搜索引擎來了 發(fā)布最強AI模型！發(fā)布會現(xiàn)場：總共提了120次AI、視頻模型登場

友情鏈接：

聯(lián)系我們

谷歌放大招 AI搜索引擎來了發(fā)布最強AI模型！發(fā)布會現(xiàn)場：總共提了120次AI、視頻模型登場