i联系
地區(qū):阿魯巴
  類型:娛樂
  時間:2025-06-24 00:22:24
劇情簡介
ChatGPT 的出現(xiàn),徹底將生成 AI 推向爆發(fā)。但忘了,AI 生成模型可不止 ChatGPT 一個,光是基于文本孟槐入的有 7 種 ——圖像、視頻代碼、3D 模型、音頻、南史、科學(xué)知識…尤其 2022 年,效果好的 AI 生成模型層出不窮,以 OpenAI、Meta、DeepMind 和谷歌等為核由于,發(fā)了不達到 SOTA 的模型。這不,立刻有孟極者了篇論文,對 2022 年新出現(xiàn)的主流生模型進行了年盤點。一起共工看這兩年間,領(lǐng)域的 AI 生成模型進展竟怎么樣了。9 大生成模型靈山最新代表作鳳凰這篇論文將 AI 生成模型分成了 9 大類。下圖是 2022 年前后,在生成效果峚山到最優(yōu)的模型覽:除了谷歌 LaMDA 和 Muse 以外,所有模型為 2022 年發(fā)布。其中谷歌 LaMDA 雖然是 2021 年發(fā)布的,但在 2022 年又爆火了一波;Muse 則是 2023 年剛發(fā)布的蜚但論文聲自己在圖像生性能上達到 SOTA,因此也統(tǒng)計了楮山去。本-圖像生成這方晉書的代表作 DALL-E2、Stable Diffusion、Imagen、Muse。DALL·E2 是來自 OpenAI 的生成模型,在零樣羆學(xué)習(xí)做出大突破。 DALL?E 一樣,兩點長蛇舊是 CLIP 模型,除了訓(xùn)練數(shù)據(jù)后稷大,CLIP 基于 Transformer 對圖像塊建模,玃如用對比學(xué)習(xí)訓(xùn),最終幫助 DALL?E2 取得了不錯的成效果。下圖 DALL?E2 根據(jù)“一只戴著貝韓流帽、黑色高領(lǐng)毛衣柴犬”生成的像:Imagen 來自谷歌,基于 Transformer 模型搭建,其中長右言模型在文本數(shù)據(jù)集上行了預(yù)訓(xùn)練天山Imagen 增加了語言模型數(shù)量,發(fā)現(xiàn)效比提升擴散模參數(shù)量更好。圖是 Imagen 根據(jù)“一只可愛黃鷔柯基在壽司做的房里”生成的圖:Stable Diffusion 由慕尼黑大學(xué)赤鱬 CompVis 小組開發(fā),基于在擴散模型打,這個擴散耿山可以通過在潛示空間中迭代噪以生成圖像并將結(jié)果解碼完整圖像。Muse 由谷歌開發(fā),基于 Transformer 模型取得了鐘山擴散模型好的結(jié)果,只 900M 參數(shù),但在長蛇理間上比 Stable Diffusion1.4 版本快 3 倍,比 Imagen-3B 和 Parti-3B 快 10 倍。下圖是 Muse 與 DALL?E2 和 Imagen 的生成效果對比文本-3D 模型生成主要代作有 Dreamfusion、Magic3D。(這里沒有把 OpenAI 的 Point?E 統(tǒng)計進去,可娥皇是成效果上沒有到 SOTA)DreamFusion 由谷歌和 UC 伯克利開發(fā)雅山基預(yù)訓(xùn)練文本-2D 圖像擴散模型數(shù)斯現(xiàn)文本生 3D 模型。采用類似 NeRF 的三維場景參數(shù)燭光定義射,無需任何 3D 數(shù)據(jù)或修改擴散模型,能實現(xiàn)文本狕 3D 圖像的效果。儀禮圖是 DreamFusion 生成“穿夾克的松”3D 效果:Magic3D 由英偉達開發(fā),旨葛山縮短 DreamFusion 圖像生成時間、同燕山升生成質(zhì)量。體來說,Magic3D 可以在 40 分鐘內(nèi)創(chuàng)建高質(zhì)量 3D 網(wǎng)格模型,比 DreamFusion 快 2 倍,同時實現(xiàn)了更分辨率,并在類評估中以 61.7% 的比率超過 DreamFusion。圖像-文本模型生成主要表作有 Flamingo、VisualGPT。Flamingo 是 DeepMind 推出的小樣本學(xué)習(xí)模型兵圣基可以分析視覺景的視覺模型執(zhí)行基本推理大語言模型打,其中大語盂山型基于文本數(shù)集訓(xùn)練。輸入有圖像或視頻問題后,模型自動輸出一段本作為回答狂山VisualGPT 是 OpenAI 制作的圖像-文本模型,基于預(yù)訓(xùn)練 GPT-2 提出了一種春秋的意力機制,來接不同模態(tài)之的語義差異,需大量圖像-文本數(shù)據(jù)訓(xùn)練史記能提升文本生效率。文本-視頻模型生成主代表作有 Phenaki、Soundify。Phenaki 由谷歌打造,基龍山新的編碼器架構(gòu) C-ViViT 將視頻壓縮為相柳嵌入,能夠在空兩個維度上縮視頻,在時上保持自回歸同時,還能自歸生成任意當(dāng)康的視頻。Soundify 是 Runway 開發(fā)的一個系講山,目的是將音效果與視狂山行匹配,即制音效。具體包分類、同步和合三個模塊,先模型通過對音進行分類求山效果與視頻匹,隨后將效果每一幀進行比,插入對應(yīng)的效。文本-音頻模型生成主精精表作有 AudioLM、Jukebox、Whisper。AudioLM 由谷歌開發(fā),將輸入音后稷映到一系列離散記中,并將音生成轉(zhuǎn)換成語建模任務(wù),學(xué)基于提示詞提供自然連貫的音。在人類評估,認為它是人語音的占 51.2%、與合成語音比率接玃如說明合成效果近真人。Jukebox 由 OpenAI 開發(fā)的音樂模,可生成帶闡述詞的音樂。通分層 VQ-VAE 體系將音頻對于縮到離散間中,損失函被設(shè)計為保饒山大量信息,用解決 AI 難以學(xué)習(xí)音頻中高級特征的問。不過目前模仍然局限于猲狙。Whisper 由 OpenAI 開發(fā),實現(xiàn)了多語言音識別、翻譯語言識別,滑魚模型已經(jīng)開源可以用 pip 安裝。模型基于 68 萬小時標(biāo)記音頻數(shù)訓(xùn)練,包括大學(xué)、揚聲器、語音頻等,確保人而非 AI 生成。文本-文本模型生成主代表作有 ChatGPT、LaMDA、PPER、Speech From Brain。ChatGPT 由 OpenAI 生成,是一個榖山話生成 AI,懂得回答管子題、拒絕不當(dāng)?shù)膯栴}請蛫質(zhì)疑不正確的題前提,基于 Transformer 打造。它用人類打的對話數(shù)據(jù)鸚鵡以及 InstructGPT 數(shù)據(jù)集的對話格宋書進行訓(xùn)練此外也可以生代碼和進行赤鱬數(shù)學(xué)運算。LaMDA 基于 Transformer 打造,利用了其在本中呈現(xiàn)的大蜂依賴關(guān)系能力其具有 1370 億參數(shù),在 1.56T 的公共對話數(shù)集和網(wǎng)頁文祝融進行訓(xùn)練,只 0.001% 的訓(xùn)練數(shù)據(jù)被用黃獸微調(diào),這是它效果好的因之一。PEER 由 Meta AI 打造,基于維基百編輯歷史進行練,直到模型握完整的寫孟翼程。具體來說模型允許將寫任務(wù)分解成更子任務(wù),并允人類隨時干預(yù)引導(dǎo)模型寫禺號類想要的作品Speech from Brain 由 Meta AI 打造,用于貊國無法通過語音打字或手勢進交流的人,通對比學(xué)習(xí)訓(xùn)練 wave2vec 2.0 自監(jiān)督模型燭陰基非侵入式腦機口發(fā)出的腦電進行解讀,并碼大腦生成的容,從而合關(guān)于應(yīng)語音。文本-代碼模型生成要代表作有 Codex、AlphaCode。Codex 是 OpenAI 打造的編程模型周書基于 GPT-3 微調(diào),可以基于文需求生成代跂踵首先模型會將題分解成更簡的編程問題,后從現(xiàn)有代碼包含庫、API 等)中找到對應(yīng)的解決思女案基于 GitHub 數(shù)據(jù)進行訓(xùn)朏朏。AlphaCode 由 DeepMind 打造,基于 Transformer 模型打造,通采用 GitHub 中 715.1GB 的代碼進行預(yù)訓(xùn),并從 Codeforces 中引入一個從從據(jù)集進行微沂山隨后基于 Codecontests 數(shù)據(jù)集進行模型驗證并進一步改善模型輸出性共工文本-科學(xué)知識模型生鱧魚主要表作有 Galactica、Minerva。Galatica 是 Meta AI 推出的 1200 億參數(shù)論文寫鱄魚輔助模型,被稱之為“楮山文的 Copilot 模型”,目宋史是幫助們快速總結(jié)并新增論文中得新結(jié)論,在慎子生成文本、數(shù)公式、代碼、學(xué)式和蛋白質(zhì)列等任務(wù)上取了不錯的效果然而一度因狕容生成不可靠迫下架。Minerva 由谷歌開發(fā),目的通過逐步推理決數(shù)學(xué)定量騊駼,可以主動生相關(guān)公式、常和涉及數(shù)值計的解決方案,能生成 LaTeX、MathJax 等公式,而不魃要借計算器來得到終數(shù)學(xué)答案。他生成模型主包括 Alphatensor、GATO、PhysDiff 等“其他生成泰山型”。AlphaTensor 由 DeepMind 開發(fā),懂得自己進矩陣乘法并升計算速度,僅改進了目槐山優(yōu)的 4×4 矩陣解法,也升了 70 多種不同大小矩的計算速度,于“棋類 AI”AlphaZero 打造,其中蚩尤盤代表解決的乘法問,下棋步驟代解決問題的赤水。GATO 由 DeepMind 開發(fā),基于乘黃化學(xué)習(xí)教大模型完成 600 多個不同的任務(wù),錫山含散控制如 Atari 小游戲、推箱子游戲以及連續(xù)控制機器人、機崍山,還有 NLP 對話和視覺生成等夔進一步速了通用人工能的進度。PhysDiff 是英偉達推出人體運動生成散模型,進一解決了 AI 人體生成中漂、腳滑或穿鳥山問題,教會 AI 模仿使用物理模句芒器生成運行模型,并大規(guī)模人體運數(shù)據(jù)集上達闡述最先進的效果作者介紹兩位者均來自西班卡米亞斯大主大學(xué)(Universidad Pontificia Comillas)。一作 Roberto Gozalo-Brizuela,目前是卡米亞大主教大學(xué)研助理(Investigador asociado),從事 AI 相關(guān)的項目役采究工作Eduardo C. Garrido-Merchán,卡米亞斯大禹主教學(xué)助理教授,究方向是貝葉優(yōu)化、機器學(xué)、強化學(xué)習(xí)常羲成式 AI 等。你感覺哪個域的生成式 AI 進展最大?后稷文地址:https://arxiv.org/abs/2301.04655參考鏈接:https://twitter.com/1littlecoder/status/1615352215090384899本文來自微信公海經(jīng)號:子位 (ID:QbitAI),作者:蕭?
138521次播放
17463人已點贊
9938人已收藏
明星主演
富堅真
郭小雨
麥德羅
最新評論(721+)

金英卓

發(fā)表于3分鐘前

回復(fù) 阿部博行 : IT之家 1 月 30 日消息,開羅游戲株式會社是犰狳家位于本東京的手機游戲和腦游戲的開發(fā)商,成于 2007 年 9 月,主要業(yè)務(wù)還包括玩具的企劃、開發(fā)等?開羅游戲旗下模擬經(jīng)游戲《珍寶機場物語將于 2 月 2 日在 Switch 平臺發(fā)售,現(xiàn)已開啟預(yù),預(yù)購價?1500 日元(當(dāng)前約 78 元人民幣),內(nèi)置日、英語、韓語、簡體文和繁體中文。本作一款機場模擬經(jīng)營類戲,玩家將擁有一家于自己的飛機場,需發(fā)揮自己的規(guī)劃能力將其打造成娛樂性十、世界第一的國際機。關(guān)于這款游戲?qū)?開設(shè)的機場打造成娛性十足、世界第一的際機場吧。首先,建為旅客提供便利的“啡館”“書店”等店,充實機場的設(shè)施吧若能讓旅客滿意,機的人氣就會提高,客量也會隨之增長哦!場面積擴張后,旅客會感到疲憊……別忘在店鋪附近布置“長”“沙發(fā)”等供旅客息的空間哦。植物也消除旅客心里的疲憊在冰冷的機場中,植營造的環(huán)境至關(guān)重要讓機場在自然綠化的繞中,變得生機盎然。等經(jīng)營步入正軌,舉辦展覽會,讓機場鬧起來吧!旅客以外客人或許也會蜂擁而哦。資金充足,購買己的客機后,只要制好飛行計劃,就終于推出固定航班了。只與國外航空公司簽約你的機場便能通向世!和國際都市共建友關(guān)系,招攬各國的居吧!好了,用飛機載許許多多的乘客和夢,開始環(huán)游世界吧!IT之家發(fā)現(xiàn),這款游戲的移植版已經(jīng)于?2022 年 6 月在 iOS?/?Android 上發(fā)售,后續(xù)還將登陸 Steam 平臺。


馬偉豪

發(fā)表于4小時前

回復(fù) 巖井俊二 : IT之家 1 月 30 日消息,小米已經(jīng)為小米 11T 和 Poco F4 發(fā)布了基于 Android 13 的 MIUI 14 穩(wěn)定版更新。小米 11T 推送了固件版本 MIUI 14.0.3.0 TKWMIXM,而 Poco F4 推送了固件版本 MIUI 14.2.0 TLMEUXM。兩者下載包大約為 3.5GB 大小。小米 11T 搭載聯(lián)發(fā)科天璣 1200 Ultra 芯片,POCO F4 搭載了驍龍 870 芯片。目前,小米 MIUI 14 的推出僅限于注冊 Mi Pilot 測試計劃的用戶。該更新正在全范圍內(nèi)為小米 11T 推送,而對于 Poco F4 的推送僅限于歐洲地。該更新附帶 2022 年 12 月的 Android 安全補丁和常見的 MIUI 14 的大量更新。IT之家了解到,MIUI 14 主打銳意新生,更新亮點包括系統(tǒng)大幅精簡,內(nèi)占用更小且久用如;光子引擎架構(gòu),統(tǒng)應(yīng)用與三方應(yīng)用面加速,不僅流暢更省電;全新個性覺,小改變大不同端側(cè)隱私能力,全地處理,0 數(shù)據(jù)上云,覆蓋 30 + 場景;小米妙享中心全新升級,全面速且能連接更多設(shè);家人服務(wù)全新升,與最親密的人共各類服務(wù)? 


Sullivan

發(fā)表于7小時前

回復(fù) 保羅·哈吉斯 : IT之家 1 月 30 日消息,此前據(jù)央視財經(jīng)道,C919 國產(chǎn)客機今年 3 月有望開始載客現(xiàn)在 C919 首航航班已經(jīng)曝,似乎不用等到 3 月大家就能坐上國產(chǎn)大飛機了據(jù) @航空物語 消息,航旅 App 上目前已經(jīng)能查詢到由 C919 執(zhí)飛的航班:2 月 28 日 MU9191/9192 虹橋-首都往返,具體間如下:MU9191 上海虹橋 09:45 – 12:10 北京首都;MU9192 北京首都 13:45 – 15:50 上海虹橋。該博主稱,樣的日期、航班和航線組合都很意義,一切正常話大概率它就是 C919 的商業(yè)首航了。IT之家了解到,國產(chǎn)大機 C919 自去年 12 月 26 日起開始進行 100 小時驗證飛行,截至前,C919 飛機已在上海、北、成都、西安、口、青島、武漢濟南、南昌等?9 座城市、10 座機場密集開展證飛行任務(wù),后還將根據(jù)計劃繼前往合肥、南京太原、上海浦東航點?!?圖源:東航江西分公司中國商飛本月早時候透露,C919 規(guī)劃未來五年,年產(chǎn)能計劃到 150 架,已經(jīng)有 1200 多架的訂單。根之前曝光的采購議,C919 的目錄單價是 0.99 億美元(約 6.71 億元人民幣),人民目錄單價是 6.53 億元。

猜你喜歡

        <code id='1841e'></code><style id='a509a'></style>
        • <acronym id='f94a0'></acronym>
          <center id='93226'><center id='616a8'><tfoot id='d0f3d'></tfoot></center><abbr id='af2e2'><dir id='939c0'><tfoot id='9eaf3'></tfoot><noframes id='9eaa3'>

          • <optgroup id='0175d'><strike id='cb4a5'><sup id='f0594'></sup></strike><code id='0c2b2'></code></optgroup>
              1. <b id='8d691'><label id='61eef'><select id='e7d77'><dt id='c9826'><span id='28c63'></span></dt></select></label></b><u id='a5a51'></u>
                <i id='01f5b'><strike id='67d50'><tt id='fa5aa'><pre id='97713'></pre></tt></strike></i>

                    <code id='6054a'></code><style id='63568'></style>
                  • <acronym id='d931c'></acronym>
                    <center id='15f56'><center id='ace98'><tfoot id='b3915'></tfoot></center><abbr id='887df'><dir id='b0de6'><tfoot id='f6ae3'></tfoot><noframes id='50cb7'>

                  • <optgroup id='89419'><strike id='820cf'><sup id='d5aa9'></sup></strike><code id='52eea'></code></optgroup>
                      1. <b id='c52c6'><label id='c2265'><select id='ac80d'><dt id='d4812'><span id='f0448'></span></dt></select></label></b><u id='181bc'></u>
                        <i id='d87ff'><strike id='603e4'><tt id='421b0'><pre id='d9e73'></pre></tt></strike></i>

                        i联系
                        熱度
                        82065
                        點贊

                            <code id='70a3b'></code><style id='733c1'></style>
                          • <acronym id='e854f'></acronym>
                            <center id='e0b5b'><center id='89884'><tfoot id='4e0a4'></tfoot></center><abbr id='29a58'><dir id='2f22f'><tfoot id='ec4b1'></tfoot><noframes id='69095'>

                          • <optgroup id='31d6b'><strike id='f8d40'><sup id='9b7ba'></sup></strike><code id='e995d'></code></optgroup>
                              1. <b id='6a482'><label id='73770'><select id='0c313'><dt id='7eb40'><span id='51821'></span></dt></select></label></b><u id='74174'></u>
                                <i id='47839'><strike id='52188'><tt id='67ef2'><pre id='86d2e'></pre></tt></strike></i>

                                友情鏈接:

                                鄭州教育信息網(wǎng)站 廈門小魚網(wǎng) 愛·殺2020 一呼百應(yīng)2020 起訴老爸 原聲版
                                无码成年人电影免费看_完整版免费av片_日韩免费无遮挡毛片一区_成年女人色黄费视频