深信服AI創(chuàng)新平臺(tái)全新升級(jí),不斷降低端到端AI應(yīng)用建設(shè)TCO
AI進(jìn)入普惠階段,但AI的全周期建設(shè)未必“普惠”。顯卡資源、模型資源、運(yùn)維管理等,每個(gè)環(huán)節(jié)都存在巨大的成本挑戰(zhàn)。
深信服AI創(chuàng)新平臺(tái)全新升級(jí),為用戶(hù)向上承載各類(lèi)大小模型,向下開(kāi)放兼容,廣泛適配各種硬件設(shè)施,并最終實(shí)現(xiàn)【為用戶(hù)不斷降低端到端AI應(yīng)用建設(shè)TCO】。
一、全模型全場(chǎng)景,低成本起步
對(duì)用戶(hù)來(lái)說(shuō),一旦決定進(jìn)行AI建設(shè),快速起步非常重要。但其實(shí), 低成本起步也同樣重要。 AI建設(shè)起步階段,涉及大小模型部署、模型試用選擇、多種顯卡適配消耗等環(huán)節(jié),想要快速起步,必須找到低門(mén)檻啟動(dòng)的方式。
深信服AI創(chuàng)新平臺(tái)率先發(fā)布 商業(yè) 化 4090D起步運(yùn)行含671B的端到端AI應(yīng)用場(chǎng)景。 也就是說(shuō), 用戶(hù)只需要用8卡的4090D即可運(yùn)行滿(mǎn)血版671B的端到端AI應(yīng)用場(chǎng)景 ,滿(mǎn)足大參數(shù)、小參數(shù)模型在更低硬件和顯卡上的部署,讓用戶(hù)在AI建設(shè)起步階段,能以更低成本體驗(yàn)各類(lèi)模型的效果,選擇出最適合自身的模型。
二、全模型承載,實(shí)現(xiàn)快速部署
在快速部署這件事上,AI創(chuàng)新平臺(tái)也為用戶(hù)提供足夠的資源。AI創(chuàng)新平臺(tái)可 承載DeepSeek、Qwen、LLAMA等各類(lèi)最新大模型及豐富的小模型,支持統(tǒng)一運(yùn)維管理的同時(shí),也支持從外部上傳自定義大小模型服務(wù), 不僅滿(mǎn)足用戶(hù)快速部署、隨時(shí)嘗鮮大模型的需求,也能為用戶(hù)的個(gè)性化選擇提供支撐。
三、顯卡利用率數(shù)倍提升,大幅降低顯卡資源成本
RAG、智能客服、Copilot智能體等應(yīng)用落地伴隨 大量大小模型的混合部署使用 ,尤其小模型的使用更為廣泛。小模型一多,為防止顯卡資源爭(zhēng)搶,不得不按卡進(jìn)行資源模型算力隔離,帶來(lái)嚴(yán)重顯卡資源消耗。
AI創(chuàng)新平臺(tái)的最新版本通過(guò) vGPU支持1%級(jí)別的顯卡切分, 大幅提升顯卡資源利用率。在這種情況下, 用戶(hù)顯卡越高端、模型使用越多,反而更節(jié)省成本。 用戶(hù)在落地AI的過(guò)程中,不必操心用卡成本。
四、多卡兼容,擺脫鎖定,用卡更靈活
而為了滿(mǎn)足用戶(hù)在AI擴(kuò)建過(guò)程中,越來(lái)越多樣的用卡需求,AI創(chuàng)新平臺(tái)不斷 兼容適配國(guó)內(nèi)外顯卡廠商,同時(shí)擺脫單一硬件供應(yīng)商鎖定, 讓用戶(hù)用卡更靈活,持續(xù)用上性?xún)r(jià)比最高的顯卡。
五、起步→生產(chǎn)→規(guī)模化,平滑演進(jìn)
AI創(chuàng)新平臺(tái)為用戶(hù)提供 從異構(gòu)統(tǒng)一管理的低門(mén)檻AI平臺(tái),平滑演進(jìn)到未來(lái)AI算力中心 的完整路徑。
從AI起步階段開(kāi)始,以低門(mén)檻方案落地輕型一體化AI算力平臺(tái);隨著業(yè)務(wù)發(fā)展,更多AI應(yīng)用需要落地,進(jìn)入AI生產(chǎn)階段,搭建中型AI算力平臺(tái);再到AI規(guī)模化應(yīng)用階段,落地中大型AI智算中心。
在逐步演進(jìn)的過(guò)程中,深信服AI創(chuàng)新平臺(tái)可以 對(duì)算力資源實(shí)現(xiàn)多集群、多品牌、多型號(hào)的異構(gòu)管理,同時(shí)不斷豐富更多成本優(yōu)化、穩(wěn)定可靠、簡(jiǎn)單安全的能力, 讓用戶(hù)充分利用持續(xù)積累的AI能力,平滑擴(kuò)展自身AI平臺(tái)。
AI大爆炸時(shí)代,各行業(yè)用戶(hù)遇到的挑戰(zhàn)不盡相同,但如何克服繁雜需求與多樣嘗試帶來(lái)的成本,卻是大多數(shù)用戶(hù)的痛處。新智算時(shí)代,深信服希望為用戶(hù)提供這樣一個(gè)AI基礎(chǔ)設(shè)施,讓用戶(hù)在AI建設(shè)的每一個(gè)階段,都能以更輕松、更高效、更安全的方式落地AI。