驍龍835性能深度解析

驍龍835性能深度解析

對于當(dāng)前的智能手機,SoC的重要性不言而喻。作為當(dāng)前安卓陣營中***的平臺,驍龍835在目前已經(jīng)推出的旗艦機上有著:快且不熱的**體驗。

從許多媒體的評價來看,驍龍835平臺可以稱得上近幾年綜合體驗最為出色的一款處理器。

因此,我們本期的機情觀察室,就來看看驍龍835的深度性能究竟處于怎樣的水平。在驍龍835之前,驍龍?zhí)幚砥鞫急环Q為SoC(系統(tǒng)級芯片),而到了這一代則改名為“Platform”(平臺),其用意在于高通對于移動計算平臺的整個布局,而非單獨的CPU、GPU等電器元件。驍龍835采用三星10nm FinFETLPE工藝,當(dāng)前半導(dǎo)體工藝能達(dá)到量產(chǎn)的**水準(zhǔn),不過此次采用的是LPE工藝,不排除高通會在后續(xù)升級一個LPP工藝的版本,類似驍龍820/821一樣。另外,根據(jù)高通**的說法,驍龍835上采用30億顆晶體管,逼近iPhone7上采用的A10 Fusion 33億的數(shù)量,這也是高通處理器距離iPhone自主設(shè)計的A系列最近的一次。

因此也帶來了良好的使用體驗。 通過這個表格,我們可以看到驍龍835采用Kryo280架構(gòu),八核心設(shè)計,**主頻為2.45GHz,小核為1.9GHz,GPU為Adreno 540,主頻為710GHz,整個芯片封裝尺寸減小35%。而根據(jù)高通公司的數(shù)據(jù),驍龍835功耗降低了25%(比驍龍801降低了50%)。

此外,在驍龍835平臺中,還集成了雙14位Spectra 180 ISP、Hexagon 690 DSP、X16 Modem??梢钥吹?,相比于其它家的SoC,高通在SoC上覆蓋到更多的計算區(qū)域,將處理器打造成智能手機的全面管家,通過“人無我有、人有我優(yōu)”的概念,全面進(jìn)駐到各區(qū)域。在筆者看來,這也是高通在這一代將移動處理器改名為“平臺”的原因。

CPU性能測試: 在驍龍820上,高通首次打造出64位自研的Kryo架構(gòu),其獨特的架構(gòu)對于浮點IPC的運算有著非常不錯的性能,但在整數(shù)IPC的運算方面則還不如ARM**的A57架構(gòu),并且在功耗方面也并不夠**。因此高通在驍龍835上采用全新的Kryo 280架構(gòu),盡管同名為Kryo,但此“Kryo非彼Kryo”,Kryo280并非常規(guī)升級的產(chǎn)物,而是采用全新架構(gòu)。 簡單來說,Kryo280采用八核心類似BigLittle架構(gòu),采用四顆性能大核+四顆效率小核,不過Kryo280**特色的,還是其成為**個采用ARM新架構(gòu)之上重新設(shè)計的架構(gòu),“Built on ARM Cortex Technology”這項技術(shù)允許供應(yīng)商重新根據(jù)自己的需求修改公版架構(gòu),比如廠商可以應(yīng)自己需求去定制指令窗口大小以增加IPC,但類似解碼器寬度或者是執(zhí)行管道這種則超出了修改范圍。

這種半定制設(shè)計可以使得廠商能夠?qū)⒆约旱漠a(chǎn)品與ARM公版區(qū)別開來,同時也可以省去重新開發(fā)的架構(gòu)所需的時間和費用。盡管我們并不知道高通的Kryo280是基于哪個公版進(jìn)行的修改,但兩個CPU集群確實都是采用了半定制設(shè)計。并且高通宣稱,其內(nèi)存控制器也是自己設(shè)計的。 在GeekBench4的單線程整數(shù)跑分測試中,可以看到驍龍835相比前代的821基本上是**開的贏面。

盡管在整數(shù)IPC方面有所長進(jìn),但在Canny(邊緣檢測)、JPGE、PDF渲染方面均輸給了821,有趣的是,在之前我們麒麟960的性能測試中,也是這幾項輸給了驍龍821,而這些整數(shù)測試的成績大多依靠L1、L2緩存,因此ANANDTECH推測,可能Kryo280就是基于ARM A73公版半定制化。另外,驍龍835在GeekBench4其它子項目的成績都與麒麟960比較接近,這也并非是主頻或測試方法可以干預(yù)的。因此說明,即便通過BoC修改的半定制架構(gòu),可修改的幅度也比較有限。 而在GeekBench4單線程整數(shù)運算(加入頻率)測試中,用上表整體整數(shù)除以頻率,可以更直接的比較不同架構(gòu)間的IPC。

可以看到,Kryo280與A73架構(gòu)成績還是比較接近,其整數(shù)IPC比A72高出6%,比A57高出14%,不過與驍龍821相比,則高出22%。 而在浮點運算中,令我們非常意外的是Kryo280的竟然全面落后驍龍821。按筆者的猜測,Kryo的浮點運算一直是其強項,而到了Kryo280,并沒有采用全自主設(shè)計,而BoC可改動的幅度又小,因此才出現(xiàn)了這種情況。不過可以看到,Kryo280與麒麟960的A73成績比較相當(dāng)。

在之前麒麟960測試A73時,考慮到A73的NEON執(zhí)行單元與A72相比并沒有改變,而降低了特殊指令的延遲,當(dāng)時猜測有些測試項目受到A73解碼器寬度的變化。因此,麒麟960的A73與驍龍835的Kryo280都顯示出了相比A72減少了L2緩存的讀/寫帶寬(以及較低的L1寫入帶寬),這也可能對性能造成影響。 而將頻率計算進(jìn)去,Kryo280則悲劇的敗給驍龍821 23%,不知道高通究竟是因為妥協(xié)的結(jié)果還是自己設(shè)計思路上的改變。

兩年前高通在研發(fā)Kryo時,就考慮到未來的新工作所需的變化,因此將更多的工作由GPU或DSP來提高效率,因此也可以接受犧牲一些浮點運算來節(jié)省面積或功耗。 內(nèi)存測試方面,Kryo280、A73、A72和A57內(nèi)核都有2個地址生成單元(AGU),但A72和A57可以使用專門的AGU進(jìn)行加載和儲存操作,Kryo280和A73的每個AGU都進(jìn)行加載和儲存同時進(jìn)行。因此,對于A73架構(gòu),這樣的策略相當(dāng)于減少了內(nèi)存延遲,并且增加內(nèi)存帶寬。

而對于Kryo280來說,相比麒麟960還甚至增加了11%,對比驍龍821和810都有所增加。但并沒有A72到A73升級幅度大,因為在驍龍821的Kryo中,就已經(jīng)可以做到單個AGU同時進(jìn)行加載和儲存,只不過之前的內(nèi)存延遲更高而已。 系統(tǒng)性能測試: ▲總分 直到目前,我們可以初步認(rèn)為驍龍835的Kryo280相當(dāng)于一個BigLittle組合的半定制A53+A73 CPU內(nèi)核,其整數(shù)與浮點運算都接近于麒麟960.而像PCMark這樣系統(tǒng)級的測試,其中就包括了調(diào)用安卓標(biāo)準(zhǔn)的API接口來強調(diào)CPU、GPU、RAM以及NAND儲存的實際工作負(fù)載。但我們都知道,手機系統(tǒng)的體驗不僅僅取決于硬件性能,還取決于廠家對其系統(tǒng)的優(yōu)化,包括程序的優(yōu)先級以及動態(tài)電壓頻率調(diào)整的策略,以控制手機的發(fā)熱等問題。

不過這并不妨礙我們看到驍龍835的原型測試機在PCMark****,超越了Mate9的麒麟960,并且比驍龍821還領(lǐng)先了23%。 ▲網(wǎng)頁測試 網(wǎng)頁測試,驍龍835的原型機表現(xiàn)良好,超過Mate9 10%,并且超過驍龍821 34%。不過尷尬的是采用驍龍820/821的機器全部落后于麒麟960、麒麟950,看起來還是有些悲劇。

▲寫入測試 在寫入操作時(包括對PDF文件的處理和加密),內(nèi)存測試以及將文件讀取和寫入閃存時,會在CPU的大核上有所要求。因此這個測試會產(chǎn)生一些多變的結(jié)果。比如樂Pro3會比S7 Edge快40%,而驍龍835則與Mate9之間差異很小,不過對比驍龍821的產(chǎn)品,還是體現(xiàn)出吊打級的優(yōu)勢。 ▲數(shù)據(jù)操作 數(shù)據(jù)操作測試中,主要測試的是整數(shù)工作負(fù)載,用于測量從多種不同文件類型中分析數(shù)據(jù)所需的時間,然后與動圖表交互記錄幀率。

驍龍835的原型機與Mate9在此相差無幾,不過也是唯二沖上5000分的,對其它821的機器又是一頓吊打。

▲視頻編輯測試 視頻編輯測試:采用OpenGL ES 2.0著色器提供視頻效果進(jìn)行視頻編輯測試,對系統(tǒng)來說屬于比較輕量級的測試。在測試中,我們發(fā)現(xiàn)GPU基本處于空閑狀態(tài),大多數(shù)情況下都由CPU的小核心完成。因此可以看到,基本上每款產(chǎn)品的成績都差不多。 ▲照片編輯測試 。

10納米工藝再進(jìn)一步 驍龍835性能簡析

【IT168 評測】如今在手機圈,一年能發(fā)布各種品牌上千款手機,但手機最核心的處理器、尤其是旗艦處理器,一年也只有那么寥寥數(shù)款。當(dāng)下每代處理器的升級,不僅意味著性能的提升,在一定程度上還代表了未來產(chǎn)品技術(shù)演進(jìn)的方向,并且影響著各品牌期間產(chǎn)品的發(fā)布規(guī)劃。

在2017年CES大會前夕,北京時間1月4日,高通在CES大會前夕正式揭曉了今年最**的處理器:驍龍835,而誰能成為這款芯片的首發(fā)產(chǎn)品也成了時下手機圈的一大趣談。

究竟是怎樣一款芯片能讓各家廠商趨之若鶩,我們今天就來看看此次驍龍835是一款怎樣的產(chǎn)品。

 三星10nm FinFET LPE工藝

此次驍龍835采用三星10nm FinFET LPE工藝,也是目前業(yè)界能量產(chǎn)***的工藝。對于FinFET工藝相信大家并不感到陌生,F(xiàn)inFET工藝主要是通過改造刪欄形態(tài)來降低CPU漏電率,減小芯片功耗。我們都知道,半導(dǎo)體工藝的水準(zhǔn)直接影響著處理器的性能。

簡單來說,更先進(jìn)的工藝能夠提升單位面積下的晶體管數(shù)量,而從運算能力的角度來講,CPU的晶體管數(shù)量取決于CPU尚運算邏輯部件面積的大小。反之,CPU上晶體管數(shù)量越多,運算邏輯部件面積就越大,這也就意味著處理器的單位性能越高,這也就是為什么每代處理器都在不斷的致力于工藝的精進(jìn)。
▲驍龍835體積
從高通發(fā)布的數(shù)據(jù)來看,每顆驍龍835上都集成了30億個晶體管,逼近iPhone7上采用的A10 Fusion 33億的數(shù)量,因而才實現(xiàn)了驍龍835對比驍龍820降低了25%的功耗。

在高通的介紹中,驍龍835采用第二代FinFTF工藝,能將芯片封裝面積進(jìn)一步減小35%,大約為153mm2,與A10 Fusion的125mm2比較接近。不過需要注意的是,驍龍835還集成了基帶,因此驍龍835的封裝面積還是非常不錯的,而進(jìn)一步降低封裝面積,則能夠使廠商在做內(nèi)部結(jié)構(gòu)設(shè)計時更加留有余地。另外,從之前看到的消息,驍龍835采用的是LPE(Low Power Early)工藝,因此筆者推測之后可能還會有一個LPP(Low Power Plus)的升級版。

Kryo 280架構(gòu):

驍龍835仍然延續(xù)kryo 架構(gòu),基于ARMv8設(shè)計,采用八核(4大核+4小核)的設(shè)計。對于現(xiàn)階段的移動處理器,一般分為自研架構(gòu)和公版架構(gòu)(ARM標(biāo)準(zhǔn)架構(gòu)),主要在于對于公版架構(gòu)的二次開發(fā),比如精簡公版指令、增加處理器的各種新特性。而經(jīng)過Scorpion架構(gòu)、Krait架構(gòu)以及驍龍820采用的Kryo架構(gòu),高通對于自研架構(gòu)的技術(shù)已經(jīng)比較得心應(yīng)手,這也是高通對比其它還采用公版架構(gòu)的處理器廠商能夠?qū)崿F(xiàn)差異化競爭的地方。

驍龍835采用4×2.45GHz+4×1.9GHz的八核心設(shè)計,在平時使用中,80%的場景下使用四顆小核工作,而在諸如APP加載、VR場景下時則開啟四顆大核工作。并且根據(jù)**介紹,驍龍835在四顆大核的L2二級緩存設(shè)計為2MB,四顆小核的L2二級緩存為1MB,相比驍龍820整整提升了一倍。我們知道,CPU中緩存的調(diào)用速度比內(nèi)存快得多,而更大的緩存則可以幫助我們在平時使用中可以快速調(diào)用更多的數(shù)據(jù)。
X16 LTE Modem:
關(guān)于高通處理器,一直有一句玩笑話:高通的產(chǎn)品就是買基帶送CPU。

雖是玩笑,但也體現(xiàn)出高通處理器在連接性的地位。驍龍835內(nèi)存X16千兆級LTE調(diào)制解調(diào)器,支持高達(dá)1Gbps的Cat16****,以及150Mbps的Cat13 LTE上傳速度,并且支持802.11ad多千兆比特Wi-Fi,能夠達(dá)到4.6Gbps的峰值速度。而高通在基帶的連接性中,除了速度,還有加入了一些創(chuàng)新性的特性以帶來更好的體驗。

X16 LTE Modem還支持4x20MHz載波聚合以及4×4 MIMO的天線配置。

載波聚合簡單來說,就是同時利用多頻段的資源,把一些不連續(xù)的頻譜碎片聚合到一起,增加系統(tǒng)傳輸帶寬,從而獲得更高的數(shù)據(jù)傳輸速率。我們在日常使用中,當(dāng)遇到一個頻段上用戶太多時,就可以通過利用多頻段載波聚合來達(dá)到提升帶寬的效果,提升使用的網(wǎng)速。除此之外,X16 LTE Modem還是**支持5G藍(lán)牙標(biāo)準(zhǔn)。藍(lán)牙5.0將運用于無線可穿戴、工業(yè)、智能家庭和企業(yè)市場領(lǐng)域,由于藍(lán)牙5.0擁有4倍與上版本的覆蓋面積、2倍的傳輸速度以及8倍的廣播信息容量,其可以顯著加速物聯(lián)網(wǎng)的構(gòu)建。

Adreno 540 GPU與Hexagon DSP:
相比于CPU,GPU在某種程度上顯得更加重要,而Adreno系列則是高通一直引以為豪的產(chǎn)品。驍龍835搭載Adreno 540 GPU,主頻為670MHz,圖形處理性能相比上一代提升25%,并且支持OpenGL ES 3.2、完整的OpenCL 2.0、Vulkan和DX12等各種圖形標(biāo)準(zhǔn)。一直以來,大部分3D游戲都通過OpenGL標(biāo)準(zhǔn)交互,但由于其出生于90年代,如今的OpenGL已經(jīng)顯得廉頗老矣,對于目前市面上多核處理器的利用效率較低,在圖形處理的效率上比較低,而驍龍835支持的Vulkan改善多線程性能,渲染性能更快,擺脫OpenGL依賴CPU運算的方式,使GPU與CPU之間無需事先拷貝數(shù)據(jù),在同樣的內(nèi)存下同時進(jìn)行讀寫,充分發(fā)揮多核處理器的并行計算能力。

而根據(jù)高通**PPT我們可以看到,除了GPU之外,驍龍835依舊保持了從820以來的VPU(視頻處理單元)和DPU(顯示處理單元)。其中DPU支持10-bit 4k@60Fps顯示,Q-Sync以及更寬色域;而VPU則支持4K HEVC 10-bit硬解碼能力,還提供了視覺聚焦區(qū)域渲染。
在此之前,在驍龍820上,高通引入Hexagon 680 DSP處理器,應(yīng)用在對綜合手機上的許多單個傳感器的數(shù)據(jù),進(jìn)行整合分析,完成數(shù)據(jù)集中處理。

而在驍龍835上,升級為支持HVX特性的Hexagon 682 DSP,并且延續(xù)了680 DSP上HVX(向量擴展)以及低功率島的特性。并且Hexagon 682 DSP還包含對Google TensorFlow的支持,包括了對定制神經(jīng)**層的支持,以及對驍龍異構(gòu)核心的功耗與性能的優(yōu)化。

另外,人工智能作為當(dāng)前最火熱的領(lǐng)域,作為手機“大腦”的處理器自然對這方面也有所涉及。在**介紹中,我們驚喜的看到驍龍835還增加對TensorFlow和Halide框架的支持。

TensorFlow是谷歌基于DistBelief進(jìn)行研發(fā)的第二代人工智能學(xué)習(xí)系統(tǒng),主要用于語音和圖像識別等多項機器深度學(xué)習(xí)領(lǐng)域,而Halide則是專門用來簡化圖像處理的程序語言。盡管在當(dāng)前階段在實際應(yīng)用中可能還不明顯,但我們也清楚的可以看到高通在人工智能和VR/AR領(lǐng)域已經(jīng)正式布局。
Quick Charge 4:

如果評選2016年手機圈***的一句廣告語的話,我相信“充電五分鐘,通話兩小時”一定為大家耳熟能詳。

隨著驍龍835的亮相,新一代快充標(biāo)準(zhǔn)QC 4也已經(jīng)與大家見面。相比于QC 3.0,QC 4增加了對USB Type-C和USB-PD的支持,并且包括USB供電。相比于QC 3.0,QC 4的充電速度提升了20%,效率提升30%。我們知道,相比于QC 2.0,QC 3.0采用**電壓智能協(xié)商INOV算法,可以更精細(xì)的調(diào)節(jié)電壓/電流的充電功率,而QC 4則將這一算法升級至第三版,創(chuàng)新性的加入了實時散熱管理,能夠在既定散熱條件下,自主確定并選擇**充電功率。

伴隨QC 4而來的還有高通推出**的電源管理芯片SMB1380和SMB1381,具有低阻抗和95%的峰值轉(zhuǎn)化效率。
在安全方面,QC 4能更準(zhǔn)確的測得充電時的電壓、電流和溫度,保護(hù)電池以及充電器,并且增加了額外保護(hù)層,放置電池充電過度,在每個充電周期調(diào)節(jié)電流。
總結(jié):先講一件有趣的事:處理器對智能手機的重要性不言而喻,但到底有多重要呢?當(dāng)你看到每年CES前后,手機圈都在紛紛猜測和盛傳又有XXX款手機將首發(fā)驍龍?zhí)幚砥?,然后在互?lián)網(wǎng)上引起一陣熱議,或許就能明白對于如今的智能手機,處理器不單單是一個元件,甚至從某個角度成為了一個象征。

而從驍龍835主打的這些功能可以看到,高通整體的策略早已不在是單純地提升運算性能,而是將處理器打造成智能手機的全面管家,覆蓋到各個功能,通過更多差異化的功能來引領(lǐng)整個行業(yè)的發(fā)展。而關(guān)于驍龍835的實際性能表現(xiàn),我們也會在之后繼續(xù)密切關(guān)注。。

高通驍龍835和高通驍龍820有什么區(qū)別?

首先是處理器制作工藝的升級。驍龍820采用的14nm制作工藝,而到了835已經(jīng)開始采用了10nm制作工藝。

制造工藝很大程度上決定著一款芯片的功耗水平,制程越先進(jìn)芯片的功耗越低,毫無疑問采用10nm工藝的驍龍835功耗肯定要比14nm工藝的驍龍820低,也就是更省電。

其次,就是處理器核心數(shù)的百科差異。驍龍835為8核心設(shè)計,驍龍820為4核心。目前多數(shù)安卓手機都采用8核處理器,當(dāng)然核心數(shù)多少并不能和性能強弱劃等號,蘋果的A10 Fusion雖然只有4核,但是它的綜合性能比驍龍835還強。不過核心數(shù)的多少也是影響性能的一個方面,驍龍820在單核性能上非常強悍,但多核性能跟其他旗艦芯片相比就相對比較弱了。

此次驍龍835采用了8核設(shè)計,大核**主頻2.45GHz,彌補了驍龍820多線程弱的短板,可謂完美。
再次,就是對快充的支持標(biāo)準(zhǔn)也是不一樣的?,F(xiàn)在的智能手機,除了iPhone之外,基本上都已經(jīng)支持快充技術(shù)。

高通驍龍820采用的是QC3.0快充,而到了驍龍835則升級到了QC4.0,**宣稱速度提升20%,效率提升30%。

驍龍(英語:Snapdragon)處理器是美國高通公司為移動設(shè)備(智能手機、平板電腦以及SmartBook)所推出的處理器系列平臺名稱,分別覆蓋入門級智能手機乃至高端智能手機、平板電腦以及下一代智能終端。Snapdragon以基于ARM架構(gòu)定制的微處理器內(nèi)核為基礎(chǔ),結(jié)合了業(yè)內(nèi)領(lǐng)先的3G/4G移動寬帶技術(shù)與強大的多媒體功能、3D圖形功能和GPS引擎[1]。

2012年2月20日,美國高通正式將Snapdragon系列處理器的中文名稱定為“驍龍”。