红菊直播官方版-红菊直播免费版app下载-红菊直播永久免费版下载

網(wǎng)站首頁(yè)
手機(jī)版

「機(jī)器學(xué)習(xí)」DVC:面向機(jī)器學(xué)習(xí)項(xiàng)目的開(kāi)源版本控制系統(tǒng)

更新時(shí)間:2024-03-15 17:50作者:小樂(lè)

DVC 跟蹤ML 模型和數(shù)據(jù)集

DVC 旨在使ML 模型可共享和可復(fù)制。它旨在處理大型文件、數(shù)據(jù)集、機(jī)器學(xué)習(xí)模型、指標(biāo)和代碼。

ML 項(xiàng)目版本控制版本控制機(jī)器學(xué)習(xí)模型、數(shù)據(jù)集和中間文件。 DVC 通過(guò)代碼將它們連接起來(lái),并使用Amazon S3、Microsoft Azure Blob Storage、Google Drive、Google Cloud Storage、Aliyun OSS、SSH/SFTP、HDFS、HTTP、網(wǎng)絡(luò)附加存儲(chǔ)或光盤(pán)來(lái)存儲(chǔ)文件內(nèi)容。完整的代碼和數(shù)據(jù)來(lái)源有助于跟蹤每個(gè)機(jī)器學(xué)習(xí)模型的完整演變。這確保了可重復(fù)性,并且可以輕松地在實(shí)驗(yàn)之間來(lái)回切換。

ML 實(shí)驗(yàn)管理利用Git 分支的全部功能來(lái)嘗試不同的想法,而不是在代碼中使用馬虎的文件后綴和注釋。使用自動(dòng)度量跟蹤來(lái)導(dǎo)航,而不是使用紙和筆。 DVC 旨在保持分支像Git 一樣簡(jiǎn)單和快速- 無(wú)論數(shù)據(jù)文件大小如何。除了一流的公民指標(biāo)和機(jī)器學(xué)習(xí)管道之外,這意味著項(xiàng)目具有更清晰的結(jié)構(gòu)。比較想法并選擇最好的一個(gè)很容易。中間工件緩存可以加速迭代。

部署和協(xié)作使用推/拉命令將一致的機(jī)器學(xué)習(xí)模型、數(shù)據(jù)和代碼包移動(dòng)到生產(chǎn)、遠(yuǎn)程計(jì)算機(jī)或同事的計(jì)算機(jī),而不是臨時(shí)腳本。 DVC 引入了輕量級(jí)管道作為Git 中的一級(jí)公民機(jī)制。它們與語(yǔ)言無(wú)關(guān),并將多個(gè)步驟連接到DAG 中。這些管道用于消除將代碼投入生產(chǎn)過(guò)程中的摩擦。

特點(diǎn):Git Compatible DVC 運(yùn)行在任何Git 存儲(chǔ)庫(kù)之上,并且與任何標(biāo)準(zhǔn)Git 服務(wù)器或提供商(GitHub、GitLab 等)兼容。數(shù)據(jù)文件內(nèi)容可以通過(guò)網(wǎng)絡(luò)可訪問(wèn)的存儲(chǔ)或任何支持的云解決方案共享。 DVC 提供了分布式版本控制系統(tǒng)的所有優(yōu)點(diǎn)——無(wú)鎖、本地分支和版本控制。

與存儲(chǔ)無(wú)關(guān)使用Amazon S3、Microsoft Azure Blob Storage、Google Drive、Google Cloud Storage、Aliyun OSS、SSH/SFTP、HDFS、HTTP、網(wǎng)絡(luò)附加存儲(chǔ)或光盤(pán)存儲(chǔ)數(shù)據(jù)。支持的遠(yuǎn)程存儲(chǔ)列表正在不斷擴(kuò)展。

可重現(xiàn)單個(gè)“dvc repro”命令即可端到端地重現(xiàn)實(shí)驗(yàn)。 DVC 通過(guò)一致地維護(hù)最初用于運(yùn)行實(shí)驗(yàn)的輸入數(shù)據(jù)、配置和代碼的組合來(lái)保證可重復(fù)性。

低摩擦分支DVC 完全支持即時(shí)Git 分支,即使對(duì)于大文件也是如此。分支完美地反映了機(jī)器學(xué)習(xí)過(guò)程的非線性結(jié)構(gòu)和高度迭代的本質(zhì)。數(shù)據(jù)不重復(fù)——一個(gè)文件版本可以屬于數(shù)十個(gè)實(shí)驗(yàn)。創(chuàng)建任意數(shù)量的實(shí)驗(yàn),立即來(lái)回切換,并保存所有嘗試的歷史記錄。

指標(biāo)跟蹤指標(biāo)是DVC 的一等公民。 DVC 包含一個(gè)命令,用于列出所有分支以及用于跟蹤進(jìn)度或選擇最佳版本的指標(biāo)。

ML 管道框架DVC 有一種內(nèi)置方法可以將ML 步驟連接到DAG 并端到端運(yùn)行整個(gè)管道。 DVC 處理中間結(jié)果的緩存,如果輸入數(shù)據(jù)或代碼相同,則不會(huì)再次運(yùn)行步驟。

語(yǔ)言與框架無(wú)關(guān)的語(yǔ)言框架無(wú)論使用什么編程語(yǔ)言或庫(kù),或者代碼的結(jié)構(gòu)如何,可再現(xiàn)性和管道都基于輸入和輸出文件或目錄。 Python、R、Julia、Scala Spark、自定義二進(jìn)制文件、筆記本、平面文件/TensorFlow、PyTorch 等均受支持。

HDFS、Hive 和Apache SparkHDFS、Hive 和Apache Spark 將Spark 和Hive 作業(yè)以及本機(jī)ML 建模步驟包含在DVC 數(shù)據(jù)版本控制周期中,或使用DVC 端到端管理Spark 和Hive 作業(yè)。通過(guò)將繁重的集群作業(yè)分解為更小的DVC 管道步驟,可以大大減少反饋循環(huán)。獨(dú)立于依賴(lài)關(guān)系迭代這些步驟。

錯(cuò)誤跟蹤糟糕的想法有時(shí)比成功的想法在同事中激發(fā)出更多的想法。保留失敗嘗試的知識(shí)可以在將來(lái)節(jié)省時(shí)間。 DVC 旨在以可重復(fù)且易于訪問(wèn)的方式跟蹤所有內(nèi)容。

隨時(shí)保存并復(fù)制您的實(shí)驗(yàn),以獲得您或您的同事執(zhí)行的實(shí)驗(yàn)的完整背景。 DVC 確保所有文檔和指標(biāo)保持一致,并且在正確的位置復(fù)制實(shí)驗(yàn)或用作新迭代的基線。

版本控制模型和數(shù)據(jù)DVC 將元文件保存在Git 而不是Google Docs 中來(lái)描述和控制數(shù)據(jù)集和模型的版本。 DVC 支持多種外部存儲(chǔ)類(lèi)型作為大文件的遠(yuǎn)程緩存。

建立部署和協(xié)作工作流程DVC 定義了團(tuán)隊(duì)高效、一致工作的規(guī)則和流程。它充當(dāng)在生產(chǎn)環(huán)境中協(xié)作、共享結(jié)果以及獲取和運(yùn)行完整模型的協(xié)議。本文:http://jiagoushi.pro/dvc-open-source-version-control-system-machine-learning-projects

(此處已添加圈卡,請(qǐng)前往今日頭條客戶(hù)端查看)

為您推薦

高瓴DVC和丹納赫DBS

引言:最近,和一個(gè)老朋友喝茶閑聊互捧,所聊甚廣,包含共事點(diǎn)滴、生活動(dòng)態(tài)、投資狀況甚至美女標(biāo)準(zhǔn),但占比最多的還是各自事業(yè)企業(yè)的動(dòng)態(tài)。高瓴資本最近一段時(shí)間可謂多事之秋,但個(gè)人來(lái)說(shuō)對(duì)其的認(rèn)同一直持續(xù)到現(xiàn)在,思考總結(jié)許久,這里面有三個(gè)重要的原因:出

2024-03-15 17:38

超百人的團(tuán)隊(duì),打造“投后管理3.0版”,“高瓴資本DVC模式”如何值得業(yè)內(nèi)借鑒?

經(jīng)歷了一場(chǎng)疫情,不少企業(yè)猶如穿越了一道“死亡谷”,在逐漸恢復(fù)元?dú)獾耐瑫r(shí),也對(duì)企業(yè)的未來(lái)有了更多的思考。作為企業(yè)背后的投資人,PE/VC機(jī)構(gòu)也更加意識(shí)到“投后管理”的重要性。據(jù)記者了解,從去年以來(lái),國(guó)內(nèi)不少VC機(jī)構(gòu)都將一部分的工作重點(diǎn)轉(zhuǎn)向投后

2024-03-15 17:26

OKCoin:以用戶(hù)為本才能成功(okcoins)

隨著區(qū)塊鏈技術(shù)的發(fā)展,許多個(gè)財(cái)富神話因?yàn)榉€(wěn)定幣而輪番上演,穩(wěn)定幣也漸漸進(jìn)入人們的視野,越來(lái)越多的人開(kāi)始關(guān)注穩(wěn)定幣,那么穩(wěn)定幣是什么 它存在的意義是什么 穩(wěn)定幣就像是加密世界的法幣,幾乎所有的市場(chǎng)交易流通行為都要依賴(lài)穩(wěn)定幣。對(duì)于到處是監(jiān)管限制

2024-03-15 17:15

大數(shù)據(jù)專(zhuān)業(yè)還可以申請(qǐng)這么多專(zhuān)業(yè)和方向!|數(shù)據(jù)科學(xué)DS詳解

本周【答疑云課堂】來(lái)啦!問(wèn)題來(lái)自8月11日答疑會(huì),文末有詳細(xì)領(lǐng)取教程可獲得完整視頻回顧,觀看更多申請(qǐng)問(wèn)題的解答。本科學(xué)的是大數(shù)據(jù)分析專(zhuān)業(yè),目前大一開(kāi)學(xué)升大二,請(qǐng)問(wèn)申請(qǐng)研究生時(shí)可以選擇哪些專(zhuān)業(yè)方向,各專(zhuān)業(yè)方向的申請(qǐng)難度有多大?解答時(shí)間:首先,

2024-03-15 17:05

母公司注資、旗下DS7將上市,渠道合作伙伴堅(jiān)信DS未來(lái)前景 ds7價(jià)格及上市時(shí)間

最近DS利好接二連三,先是旗下全新一代產(chǎn)品DS7再度贏得訪華的馬克龍站臺(tái),后又有長(zhǎng)安和PSA落實(shí)36億注資,無(wú)疑為DS在2018年大展拳腳開(kāi)了個(gè)好頭。沒(méi)有誰(shuí)的一生是一帆風(fēng)順的。這話不僅適合形容人,放在企業(yè)身上同樣適用。伴隨市場(chǎng)競(jìng)爭(zhēng)、消費(fèi)認(rèn)知

2024-03-15 16:53

YYDS!創(chuàng)三年半紀(jì)錄——道達(dá)投資手記(道達(dá)官網(wǎng))

A股市場(chǎng)今天一如既往地強(qiáng)勢(shì),上證指數(shù)收出七連陽(yáng),七連陽(yáng)也創(chuàng)下了三年半以來(lái)的紀(jì)錄,同時(shí)指數(shù)點(diǎn)位也逼近3000點(diǎn)關(guān)口。達(dá)哥和很多股民一樣,就是喜歡市場(chǎng)這種樸實(shí)的拉升。漲幅雖然不大,但屬于穩(wěn)穩(wěn)的幸福。當(dāng)然,外圍市場(chǎng)還有更強(qiáng)的,比如日本長(zhǎng)期在衰退中

2024-03-15 16:42

加載中...