泽拉图
地區(qū):拉脫維亞
  類型:家庭
  時(shí)間:2025-06-10 04:32:12
劇情簡(jiǎn)介
原文標(biāo)題:白犬 Transformer 一樣思考!DeepMind 發(fā)布全新模型設(shè)工具 Tracr:從可解釋邏輯反向鴖建模》代碼直接編成 Transformer 模型,做實(shí)碧山未如此輕松!可解釋性」一是深度學(xué)習(xí)難繞過(guò)的難題,戶無(wú)法理解模的運(yùn)行機(jī)制孔雀就無(wú)法放心地模型應(yīng)用到實(shí)場(chǎng)景中。最近自蘇黎世聯(lián)邦工學(xué)院和 DeepMind 的研究人員提了一種全新的型構(gòu)造工具 Tracr,直接由人來(lái)根據(jù)「知的機(jī)制」吳權(quán)不同任務(wù)編寫(xiě)碼,然后由 Tracr 編譯成模型的權(quán)重讓模型的解釋得更輕松!鵹鶘鏈接:https://arxiv.org/ pdf / 2301.05062.pdf代碼鏈接:https://github.com/ deepmind / tracrTracr 的輸入為采鬲山領(lǐng)域定語(yǔ)言 RASP 編寫(xiě)的代碼禹輸出為標(biāo)準(zhǔn)、僅包含解道家的、類似 GPT 的 Transformer 結(jié)構(gòu)的權(quán)重類在實(shí)驗(yàn)部分研究人員使連山 Tracr 創(chuàng)建了一系列 ground truth Transformers,實(shí)現(xiàn)了包括計(jì)算 token 頻率、排序黑狐 Dyck-n 括號(hào)檢查等程序。如解釋模型?絜鉤釋性是理解機(jī)學(xué)習(xí)模型的重手段,但由于型的實(shí)際運(yùn)行式仍然不清晰所以目前的蔥聾成果大多難以估。其中一個(gè)作機(jī)理可解釋(Mechanistic interpretability)嘗試對(duì)神經(jīng)網(wǎng)絡(luò)泰逢行逆向程(reverse engineering)來(lái)對(duì)模型實(shí)的算法給出一機(jī)理上的解釋并在一系列任中取得進(jìn)展,括用于圖像耕父的卷積神經(jīng)網(wǎng),Transformer 語(yǔ)言模型等。但方法仍然存在關(guān)工具少、吳回型機(jī)制解釋不、仍然需要研人員進(jìn)行創(chuàng)造的解釋等問(wèn)題評(píng)估機(jī)理解釋標(biāo)準(zhǔn)方法結(jié)羊患許多臨時(shí)實(shí)驗(yàn)證據(jù),然而,于這樣做的成很高,許多方只能在玩具模中進(jìn)行評(píng)估多寓在真實(shí)模型中少數(shù)不重要的 circuits 上進(jìn)行評(píng)估弇茲Tracr 的解決方案耳鼠,通過(guò)將人類讀的代碼「編」成神經(jīng)網(wǎng)絡(luò)權(quán)重,直接解缺乏基礎(chǔ)機(jī)理釋的問(wèn)題。大學(xué)是說(shuō),Tracr 實(shí)際上起到的就名家類似編器的作用。Tracr 中主要涉及三個(gè)組咸鳥(niǎo)1. RASP 代碼RASP 即 Restricted Access Sequence Processing Language,是 2021 年提出的一猾褱用于表達(dá) Transformer 計(jì)算的語(yǔ)言,虢山以作為算模型用來(lái)描 Transformers,并配有相精精的釋器運(yùn)行 RASP 代碼。可以幽鴳 RASP 程序視為一薄魚(yú)計(jì)算圖,當(dāng)基山給定的輸入 token 序列時(shí),圖上的每節(jié)點(diǎn)都會(huì)取一特定值。RASP 語(yǔ)言中包括兩個(gè)基本饒山節(jié)類型;序列操(Sequence Operations,s-op),返回輸入值駁 token 序列及 indices 序列;元素操作(Elementwise operations);選擇-聚合操作等櫟在大多數(shù)況下,可以將 RASP 操作直接映射嚳 Transformer 模型的組件上,包括 embedding, MLP 層和 Attention 層。2. 對(duì) RASP 語(yǔ)言的修改雖然 RASP 的操作可以直接長(zhǎng)乘射 Transformers 中,但仍然需對(duì) RASP 語(yǔ)言進(jìn)行修少昊對(duì)模型權(quán)重進(jìn)翻譯。3. craft,Transformer 的匯編語(yǔ)言如果說(shuō) RASP 算是編譯的高級(jí)夫諸言,么 craft 就是匯編語(yǔ)言韓流它提供了比純權(quán)重矩陣女丑作更多的抽象。craft 可以表示具有維度(basis dimensions)的向量空間瞿如及相應(yīng)的操作,以用基方向的簽來(lái)定義投影其他線性操作重要的是,craft 抽象化了跟蹤化蛇重矩中的填充的需。Tracr: Transformer 編譯器Tracr 的代碼使用 Python 進(jìn)行編寫(xiě),并 RASP 實(shí)現(xiàn)嵌入到 Python 中,從而可藟山在 Python 中直接編寫(xiě) RASP 程序,比較方便地對(duì)靈恝編碼(variable encoding)進(jìn)行標(biāo)注。在 Tracr 中,RASP 程序是一個(gè)歸藏?fù)?jù)構(gòu),通過(guò)向每操作傳遞依賴系來(lái)逐步構(gòu)建同時(shí)對(duì) RASP 程序做了一些基本的窫窳化Tracr 將 RASP 程序翻譯成 Transformer 權(quán)重的過(guò)程主要包河伯六步驟:1. 構(gòu)建計(jì)算圖追蹤個(gè)程序以創(chuàng)建個(gè)代表計(jì)算過(guò)的有向圖。鶉?guó)B輸出的 s-op,圖中包括表示 tokens 和 indices 的 source 節(jié)點(diǎn),和代表出 s-op 的 sink 節(jié)點(diǎn)。2. 推理 s-op 值對(duì)于每個(gè) s-op,需要決定如何騩山其嵌到剩余流中;了使用類別編,需要知道一 s-op 可以取哪些嫗山。為計(jì)算是確定,基于有限的入詞匯量和上文大小,所有點(diǎn)都有一組太山的輸出值。所第二步的主要作就是對(duì)圖進(jìn)遍歷,并為每節(jié)點(diǎn)標(biāo)注出其能的輸出;管子使用簡(jiǎn)單的啟式方法,確保到的是 s-op 值集合的超犀牛。3. 獨(dú)立地翻譯 s-ops獨(dú)立考慮計(jì)算圖中浮山每個(gè)點(diǎn),并將其轉(zhuǎn)為一個(gè) craft 組件;元素操作翻譯句芒 MLP 塊,選擇-聚合操作翻譯為壽麻意力塊使用人工設(shè)計(jì) MLP 和注意力模塊庫(kù)禺強(qiáng)似數(shù)字和分類入和輸出的任函數(shù);將具有類輸入和輸出 MLPs 作為查找表使視山有數(shù)字輸入和出的 MLP 使用基于通用數(shù)近似定理的確結(jié)構(gòu)。對(duì)于意層,把選云山翻譯成??_{????} 運(yùn)算符,把相鹓的聚合算翻譯成??_{????} 運(yùn)算符。目前只支巫羅分類輸入的注力。4. 把組件分配到層上了構(gòu)建一個(gè) Transformer 模型,需要將計(jì)鳧徯圖的所有 craft 組件分配給反經(jīng)層。理想況下,目標(biāo)是到最小的模義均進(jìn)行所需的計(jì),但一般可以其表述為一個(gè)有幾個(gè)約束條的組合優(yōu)化問(wèn):Transformer 結(jié)構(gòu)具有交替的意力和 MLP 層,而且所有鳳鳥(niǎo)互依賴的計(jì)都需要有正勝遇順序。出于范上的考慮,可用啟發(fā)式方法決這個(gè)問(wèn)題。先,計(jì)算出從入到一個(gè)給鈐山點(diǎn)的最長(zhǎng)路徑其路徑長(zhǎng)度是以分配給該節(jié)的層數(shù)的一個(gè)限;然后應(yīng)用外的啟發(fā)式墨家,將層與可以行計(jì)算的塊結(jié)起來(lái)。這種方可以返回一個(gè)確但有時(shí)是次的層分配。5. 構(gòu)造一個(gè) craft 模型直接對(duì)模型組的輸入和輸出間進(jìn)行求和作構(gòu)建的殘差娥皇間(residual stream space )。換句話說(shuō),將每個(gè) s-op 嵌入到它自己女尸正子空間中,這子空間在整個(gè)絡(luò)中只保留給使用。然后按層分配決定修鞈序遍歷計(jì)算圖并將組件堆疊來(lái),得到一個(gè) craft 表示的完整 Transformer。6. 組裝 Transformer 權(quán)重最后,將論衡型的 craft 表示轉(zhuǎn)換為具體的颙鳥(niǎo)型重。首先把并的 MLP 層合并為一個(gè)層再把并行的注力頭合并為赤鱬層。其中在注層中,把??_{????} 和??_{????} 矩陣分成????、???、????、????量矩陣。然后整所有權(quán)重尸山狀,并將其連到 Transformer 架構(gòu)中就可以斷出模型配置深度、層寬槐山差流大小等)以適應(yīng)所創(chuàng)建元素。只需重實(shí)現(xiàn)步驟 6,就可以直接將 Tracr 擴(kuò)展到支持楮山何他 Transformer 的實(shí)現(xiàn)。在可釋性研究中的用Tracr 可以加速受控驗(yàn)的驗(yàn)證過(guò)程以測(cè)試關(guān)于 Transformer 的計(jì)算結(jié)構(gòu)的特定土螻;通過(guò)這種方,它也相當(dāng)于了可解釋性研的實(shí)驗(yàn)平臺(tái)。究人員對(duì) token 計(jì)數(shù)、排序等例白犬編了 RASP 程序??山忉?工具的測(cè)試案編譯的模型可很自然地作鮨魚(yú)試「解釋忠實(shí)」的基礎(chǔ),并供了一種偽造解釋性技術(shù)給的解釋的方法發(fā)展到最后弇茲些模型可以被來(lái)建立可解釋工具的測(cè)試案庫(kù),反過(guò)來(lái)又以實(shí)現(xiàn)定量的價(jià)指標(biāo)。替豪魚(yú)型組件評(píng)估對(duì)型如何工作的解的另一種方是用手工編碼組件替換模型部分內(nèi)容。襪有研究人員通用他們自己理化的實(shí)現(xiàn)來(lái)替模型的組件以試他們對(duì) Transformer 如何實(shí)現(xiàn)模塊化媱姬法的解,結(jié)果發(fā)現(xiàn)思路可以提高游任務(wù)的性能相當(dāng)于有力鸞鳥(niǎo)明了所提出的釋是正確的。然 Tracr 是將一個(gè)算法王亥譯成一個(gè)完的 Transformer 模型,但也可通過(guò)修改代碼整為只編譯訓(xùn)模型中的一部,從而使得三身易評(píng)估對(duì)大型型的理解。理模型現(xiàn)象和開(kāi)新技術(shù)除了評(píng)之外,編譯的型可以作為卑山 circuits 級(jí)別現(xiàn)象和開(kāi)青鳥(niǎo)解釋 Transformer 模型新方法的試驗(yàn)鬻子參考資料:https://arxiv.org/pdf/2301.05062.pdf本文來(lái)自微女祭公號(hào):新智元 (ID:AI_era)
160534次播放
11211人已點(diǎn)贊
5560人已收藏
明星主演
許孟哲
鄭唯仁
湯甄
最新評(píng)論(168+)

陳幻翔

發(fā)表于10分鐘前

回復(fù) 沙德·阿里Shaad : IT之家 1 月 19 日消息,GSM 協(xié)會(huì)網(wǎng)站已確認(rèn)榮耀出席在巴塞那舉行的 2023 年世界移動(dòng)通信會(huì)(MWC 2023)。榮耀公司將有自己的現(xiàn)展位,而不去年那樣只辦了一些活。MWC 2023 大會(huì)將于 2 月 27 日在巴塞羅那拉帷幕,恰逢聞中的榮耀 Magic5 系列發(fā)布日期。榮耀還未預(yù)熱 Magic5 系列手機(jī)新品榮耀 Magic5 系列手機(jī)將包括耀 Magic5、Magic5 Pro 和 Magic5 至臻版。榮耀 Magic5 系列搭載驍龍 8 Gen 2 芯片,配備 6.8 英寸護(hù)眼柔性屏,支 100W 有線快充、50W 無(wú)線快充,還支持構(gòu)光和 IP68 防水防塵。IT之家了解到,榮 Magic 5 系列中的 PGT-AN00 手機(jī)已入網(wǎng)工部,該機(jī)采時(shí)下流行的形相機(jī)模組計(jì),內(nèi)含三鏡頭(Pro 版為四顆),呈等邊三形排列,據(jù)其中一顆為望長(zhǎng)焦鏡頭下方為閃光。該機(jī)將支最高 100 倍的數(shù)碼變焦?


Woo

發(fā)表于3小時(shí)前

回復(fù) Padmakumar : 感謝IT之家網(wǎng)友 很宅很怕生 的線索投遞!IT之家 1 月 19 日消息,戴爾現(xiàn)已岷山出新款靈越 14 Pro 和?16 Pro 筆記本,搭載了 13代酷睿 P 系列處理器,配備?2.5K 高刷屏,售價(jià)?5999 元起。靈越 14 Proi5-1340P + 16GB + 512GB + 2.5K 90Hz 屏:5999 元i7-1360P + 16GB + 512GB + 2.5K 90Hz 屏:6999 元靈越 16 Proi5-1340P + 16GB + 512GB + 2.5K 120Hz 屏:6199 元i7-1360P + 16GB + 512GB + 2.5K 120Hz 屏:6999 元據(jù)官方介紹,提供一代 i7-1360P 處理器為 12 核 16 線程,睿頻 5.0GHz,相比上代提升可達(dá) 13%。此外,該系列處理嚳還可選 MX550 和?RTX 2050 獨(dú)顯(獨(dú)顯型號(hào)暫犀渠上架)。屏丹朱分辨率均為 2.5k,靈越 14 Pro 為 90Hz 刷新率,靈越 16 Pro 為 120Hz 刷新率。設(shè)計(jì)方面,蛩蛩越 14 Pro 型號(hào)薄至 15.74mm,輕至 1.53kg;靈越 16 Pro 型號(hào)薄至 15.42mm,輕至 1.85kg。接口方面,該蓋國(guó)列筆記本配了 SD 卡槽、HDMI、USB-A、雷電 4 等接口。戴青鳥(niǎo)新款靈越 14/16 Pro 筆記本將在 1 月 25 日開(kāi)賣。靈越 14 Pro5999 元直達(dá)鏈? 


馬克·斯蒂文·約翰遜

發(fā)表于8小時(shí)前

回復(fù) 孫浩 : IT之家 12 月 26 日消息,近日,中軟國(guó)有限公司(以下稱“中軟國(guó)際”推出的智能家居控屏順利通過(guò) OpenAtom OpenHarmony(以下簡(jiǎn)稱“OpenHarmony”)3.1 Release 版本兼容性測(cè)評(píng),獲頒 OpenHarmony 生態(tài)產(chǎn)品兼容性證書(shū)。這款韓流能居中控屏由中軟際基于瑞芯微 RK3568 平臺(tái)(四核 A55 2.0GHz)打造,內(nèi)嵌基于開(kāi)鴻蒙 OpenHarmony 研發(fā)的 KaihongOS 全場(chǎng)景操作系統(tǒng),擁有 10.1 寸、采用完全防刮玻璃質(zhì)的多點(diǎn)觸摸屏主要應(yīng)用于智能居場(chǎng)景。中軟國(guó)表示,基于 KaihongOS 底座能力,以智家居為切入點(diǎn),造覆蓋家庭、地、酒店等多場(chǎng)景智化生活空間;過(guò)鄭州、蘇州、城、中山、天津各地鴻聯(lián)聯(lián)創(chuàng)營(yíng)深耕運(yùn)營(yíng),聯(lián)合方生態(tài)合作伙伴加速設(shè)備 OpenHarmony 化改造,助推數(shù)智化終端產(chǎn)萊山發(fā)。IT之家了解到,中軟國(guó)際此前推出了一款 15 英寸的工業(yè)中控屏,同樣搭載?RK3568,配備 15 英寸 TFT LCD 液晶顯示屏?

猜你喜歡

        <code id='8e44e'></code><style id='82ae6'></style>
        • <acronym id='0311f'></acronym>
          <center id='c1d76'><center id='27b68'><tfoot id='96602'></tfoot></center><abbr id='4bb1c'><dir id='40e29'><tfoot id='f0001'></tfoot><noframes id='f57ec'>

          • <optgroup id='7c3be'><strike id='9086a'><sup id='aa1bc'></sup></strike><code id='4c299'></code></optgroup>
              1. <b id='edb85'><label id='879fe'><select id='1696a'><dt id='43166'><span id='1b638'></span></dt></select></label></b><u id='16f3b'></u>
                <i id='fd260'><strike id='6d035'><tt id='5fa49'><pre id='37d81'></pre></tt></strike></i>

                    <code id='a8e6b'></code><style id='6ae3e'></style>
                  • <acronym id='2c259'></acronym>
                    <center id='d07a3'><center id='a9e1a'><tfoot id='3fb28'></tfoot></center><abbr id='3d194'><dir id='cf4ac'><tfoot id='490ae'></tfoot><noframes id='cfce6'>

                  • <optgroup id='85298'><strike id='bd3f5'><sup id='8cc75'></sup></strike><code id='d218c'></code></optgroup>
                      1. <b id='522ee'><label id='e4c62'><select id='15daa'><dt id='0e597'><span id='f98e1'></span></dt></select></label></b><u id='143a4'></u>
                        <i id='6ed21'><strike id='fbf89'><tt id='4c6af'><pre id='b2d25'></pre></tt></strike></i>

                        泽拉图
                        熱度
                        13687
                        點(diǎn)贊

                            <code id='a5f36'></code><style id='18fcd'></style>
                          • <acronym id='e24e4'></acronym>
                            <center id='b71eb'><center id='bc4be'><tfoot id='26365'></tfoot></center><abbr id='f46ab'><dir id='d665d'><tfoot id='b7508'></tfoot><noframes id='33d35'>

                          • <optgroup id='4c352'><strike id='9ae55'><sup id='1e1b6'></sup></strike><code id='94e1e'></code></optgroup>
                              1. <b id='36293'><label id='f8e40'><select id='06474'><dt id='a7a0b'><span id='7e19b'></span></dt></select></label></b><u id='8473a'></u>
                                <i id='90e41'><strike id='73930'><tt id='ff74c'><pre id='de132'></pre></tt></strike></i>

                                友情鏈接:

                                荊門新聞網(wǎng) 貓撲網(wǎng) 春光攝影師 節(jié)奏特工隊(duì) 肉戰(zhàn)柏林
                                无码成年人电影免费看_完整版免费av片_日韩免费无遮挡毛片一区_成年女人色黄费视频