- Ang Axion Arm CPU ng Google ay naghahatid ng higit na pagganap at kahusayan sa cloud nang walang napakalaking rewrite.
- Pinaghalong x86+Arm cluster na may Titanium, Hyperdisk at advanced orchestration na nag-optimize ng mga gastos.
- Nagpapatakbo na ang Google ng mga serbisyo tulad ng BigQuery at Spanner sa Axion at pinapabilis ang paglipat gamit ang AI.
Ang Google ay gumawa ng isang hakbang sa AxionAng pamilya nito ng mga custom na Arm-based na CPU para sa mga data center ay nagkaroon ng malaking epekto, na higit pa sa pagbabago sa silicon: nakakaapekto ito sa pagganap, kahusayan, seguridad, mga gastos, at kung paano inilalagay ang mga application sa laki. Sa isang konteksto kung saan ang AI, data, at microservices ang nagtutulak ng pagbabago, ang diskarte ay hindi lamang teknikal; ito rin ay operational at business-oriented.
Ang kumpanya ay pagsasama ng Axion sa produksyon kasama ng mga x86 serverPag-enable sa mga multi-architecture cluster na magkakasamang umiiral sa mga serbisyong pagmamay-ari (gaya ng BigQuery, Spanner, o YouTube Ads) at sa Google Cloud. Sa mga mapaghangad na numero—hanggang sa 30% na mas mataas na performance kumpara sa maihahambing na Arm instance at hanggang 50% sa x86, bilang karagdagan sa hanggang 60% na pagpapabuti sa kahusayan sa enerhiya—magsisimula ang isang bagong panahon kung saan ang pagpili ng CPU ay naaayon sa workload, gastos, at pagpapanatili.
Ano ang Axion at bakit ngayon?
Ang Axion ay ang Ang unang CPU ng Google para sa data center na idinisenyo sa ArmItinayo sa Arm Neoverse V2 at sa Armv9 na arkitektura, ang layunin nito ay maghatid ng pangkalahatang layunin at mga workload ng data, pati na rin ang mga trabaho sa AI na nakabatay sa CPU, na binabawasan ang pagdepende sa mga tradisyunal na provider at umaangkop sa trend ng industriya patungo sa mga na-optimize na imprastraktura.
Inaangkin iyon ng Google Magiging available ang Axion sa mga customer ng Google Cloud At, sa katunayan, ginagamit na nito ito sa loob ng BigTable, Spanner, BigQuery, Blobstore, Pub/Sub, Google Earth Engine, at ang platform ng advertising sa YouTube. Ang pangunahing pangako ay maaaring ilipat ng mga customer ang mga application sa Arm na may kaunting pagbabago salamat sa mga pamantayan at interoperability na idinisenyo para sa cloud.
Ang isang natatanging piraso ay titanAng isang custom na silicon microcontroller system ay nag-aalis ng mga pagpapatakbo ng platform (network, seguridad) at pagpoproseso ng I/O ng storage sa Hyperdisk. Sa pag-alis ng mga gawaing ito, ang mga Axion CPU ay maaaring maglaan ng higit pang mga mapagkukunan sa pag-compute ng mga workload ng user, pagpapabuti ng latency at throughput.
Ang paglipat ay umaasa sa isang mature na Arm ecosystem sa cloud: Android, Kubernetes, TensorFlow o Go Nakatanggap sila ng mga pag-optimize para sa Arm, at nag-ambag ang Google sa mga pamantayan tulad ng SystemReady VE, na ginagawang mas madali para sa mga karaniwang operating system at package na tumakbo sa mga server ng Arm at virtual machine nang walang alitan.
Arkitektura ng system, seguridad, at disenyo
Sa loob ng disenyo, binanggit iyon ng iba't ibang mga panloob na mapagkukunan Ang Axion ay ginawa sa 5 nm Pinagsasama nito ang mga core na may mataas na pagganap at kahusayan (na may mga reference sa mga configuration na may hanggang 128 na mga core at mga frequency hanggang 3.8 GHz sa mga core ng pagganap), na nakahanay sa roadmap ng Armv9. Ang layunin: i-maximize ang performance sa bawat watt at parallelism sa mga multi-threaded na workload.
Sa vectorization at multimedia/scientific processing, nag-aambag ang Armv9 Mga tagubilin sa SVE2na may flexible SIMD scaling para mapabilis ang ML inference, analytics, at pagpoproseso ng data. Ang mga modernong toolchain (Clang/LLVM, GCC) ay bumubuo ng mga native na binary na ARM64, na binabawasan o inaalis ang pangangailangan para sa container emulation at sa gayo'y pinapabuti ang pagganap sa totoong mundo.
Ang planong pangkaligtasan ng Axion ay isa pang haligi: PAC (Pointer Authentication) at Memory Tagging Extension Tumutulong ang mga ito na mapagaan ang mga uri ng pag-atake gaya ng overflow at paggamit-pagkatapos-libreng pag-atake sa pamamagitan ng pagdaragdag ng mga pagbabawas sa antas ng hardware. Pinagsasama ng platform ang Secure Boot at suporta sa TPM 2.0, pati na rin ang AES-256 encryption sa transit at sa pahinga, na may mga module na sumusunod sa mga pamantayan tulad ng FIPS 140-2.
Ang network at imbakan ay idinisenyo upang maghatid ng magkakaibang mga kumpol na may high-speed backbones (hanggang 400 Gbps)Low-latency switching at ang Colossus distributed filesystem na kumikilos bilang abstraction layer. Sa pagsasagawa, binabawasan ng mga bahaging ito ang overhead sa pagitan ng x86 at Arm node, habang pinapanatili ang pare-pareho at kakayahang magamit.
Pagganap at kahusayan: mga numero at paghahambing
Ayon sa data na ibinahagi ng Google, nakamit ng Axion hanggang sa 30% pang pagganap kumpara sa nangungunang pangkalahatang layunin na Arm instance sa cloud at hanggang sa 50% pang pagganap kaysa sa maihahambing na kasalukuyang-generation x86 instance. Ang lahat ng ito ay may hanggang sa 60% na pagpapabuti sa kahusayan ng enerhiya kumpara sa x86, isang pangunahing pingga para sa mga gastos at layunin sa pagpapanatili.
Sa mga tuntunin ng mga sukatan ng negosyo, binanggit ng mga kamakailang dokumento na ang paglipat ng mga load sa Axion ay maaaring isalin sa Hanggang 65% performance para sa presyo kumpara sa x86 para sa ilang partikular na mga internal na workload, na nagpapaliwanag ng bahagi ng pagtulak na i-migrate ang mga application ng produksyon sa Arm sa loob ng Google.
Upang matukoy ang mga pagkakaiba, nagbibigay ang x86 ecosystem AVX-512 Sa malawak na legacy ng software at mga kakayahan sa vectoring, nag-aalok ang Arm ng SVE2, superyor na kahusayan, at lubos na mapagkumpitensyang multithreaded na pagganap. Ang pagsasama-sama ng mga teknolohiyang ito sa iisang cluster ay nagbibigay-daan para sa pagtatalaga ng mga legacy na trabaho sa x86 at mga moderno o lubos na maihahalintulad na mga workload sa Arm.
Higit pa sa mga sintetikong benchmark, kapansin-pansin ang pagbabago sa real-world general-purpose na mga trabaho (mga web server, microservice), open source database, in-memory cache, data analytics, at mga gawaing AI na nakabatay sa CPU: pag-compile ng code, paunang pagproseso ng data, pagpapatakbo ng mga magaan na inferences, at pag-coordinate ng mga ML pipeline.
Multi-architecture clusters: kung paano magkakasama ang x86 at Arm
Ang malaking paglukso ay hindi lamang ang chip, ito ay ang operasyon. Isinasagawa ng Google mga kumpol na may mga x86 at Arm node Sa ilalim ng pinag-isang control plane na inspirasyon ni Borg (ang pasimula ng Kubernetes), ang scheduler ay naglalaan ng mga workload batay sa gastos, latency, available na CPU, at, siyempre, binary compatibility.
Sa Kubernetes, ang heterogeneity ay nareresolba sa mga affinity at tagapili ng nodeSamakatuwid, ang mga pod na inilaan para sa Arm ay binalak sa mga katugmang node. Ang mga manifest ay maaaring magsama ng mga hadlang ayon sa arkitektura at mga mapagkukunan, at ang observability (Prometheus, Grafana) ay iniangkop upang basahin ang mga sukatan sa magkahalong kapaligiran.
Upang mapadali ang pag-deploy, ang mga sumusunod ay isinasaalang-alang: mga larawang multi-arkitektura At kapag hindi available ang mga native na binary, maaaring gamitin ang QEMU para sa dynamic na emulation. Gayunpaman, para sa mga production environment na may matagal na workload, ang rekomendasyon ay mag-compile ng native ARM64 para masulit ang Axion nang walang karagdagang gastos.
Ang autoscaling ay gumagamit ng pagkakaiba-iba: kung ang isang CPU-based na AI microservice ay tumataas sa demand, ang orkestra ay maaaring ilipat ito sa Axion node at makipaglaro sa mga variable cost instance (hal., spot), pagpapanatili ng mga SLO at pagbabawas ng pagsingil kung posible.
Mga modelo ng pagpepresyo at serbisyo: kung paano magbayad ng mas mura nang walang mga komplikasyon
Nag-aalok ang Google Cloud ng ilang paraan upang makapagsimula: mayroon libreng pagpipilian sa pagsisimula upang makapagsimula nang walang bayad at subukan ang mga serbisyo, na tumutulong sa pagpapatunay ng pagiging tugma at pagganap nang secure.
Ang pinakakaraniwang modelo ay pay-as-you-goMagbabayad ka lang para sa iyong ginagamit, nang walang paunang bayad o mga parusa sa pagkansela. Nag-iiba ang mga presyo depende sa configuration, paggamit, at rehiyon; Nire-refer ka ng Google sa dokumentasyon nito para sa mga detalye.
Sa computing, ang mga sumusunod ay binanggit c4a-highcpu instance na may panimulang presyo na humigit-kumulang $0.03787 USD bawat oras, na may mga opsyon sa pagtitipid na maaaring umabot sa matataas na porsyento (hal., mga tier na hanggang 55% at hanggang 91% sa ilang partikular na pangako o modalidad).
Sa storage, may ilang pamilya na may mga presyong nagsisimula sa unang GB bawat buwan: Patuloy na Disk simula sa $0.048 USD/GB/buwan, Hyperdisk mula $0.125 USD/GB/buwan at lokal na SSD Simula sa $0.08 USD/GB/buwan. Ang Hyperdisk ay nagde-decoupling ng performance mula sa laki ng instance at maaaring dynamic na mai-provision sa real time.
Online, ang Standard na antas Gumamit ng pampublikong internet para sa trapiko sa pagitan ng iyong mga serbisyo at mga user. Ang papasok at papalabas na trapiko ay libre hanggang 200 GB/buwan. Premium na antas Nagruruta ito sa backbone network ng Google at nagsisimula sa $0.08 bawat GB ng papalabas na trapiko (nananatiling libre ang papasok na trapiko).
AI, cybersecurity at mga distributed na teknolohiya
Sa artificial intelligence, bumibilis ang Axion Mga hinuha na nauugnay sa CPU at mga gawain sa pagsasanay Salamat sa SVE2 at sa mga naka-optimize na library nito (ONNX Runtime on Neon, native ARM64 toolchain), maaari nitong bawasan ang latency sa pagpasa ng data, preprocessing, at orchestration sa malalaking kapaligiran ng modelo.
Sa mga tuntunin ng seguridad, nagdaragdag ang pagkakaiba-iba ng arkitektura pagtatanggol sa malalimAng isang insidente sa x86 ay hindi palaging nagpapahiwatig ng pagkakalantad sa mga Arm node, lalo na sa VPC segmentation, RBAC, at mga kontrol sa pagkakakilanlan. Ang PAC at MTE ay nagdaragdag ng mababang antas ng pagpapagaan, at ang pagsunod ay sinusuportahan ng AES-256 encryption at cryptographic module certifications.
Para sa blockchain at mga distributed system, ang kahusayan ng enerhiya Ang ratio ng performance-per-watt ng Arm ay pinapaboran ang mga validator at buong node. Ang mga panloob na pagsubok ay nagpakita ng mga pagpapabuti sa throughput sa mga transaksyon sa matalinong kontrata na pinagsama-sama para sa ARM64, na nakakaapekto sa parehong mga gastos at pagpapanatili.
Sa mga usapin sa regulasyon, ang Google ay sumangguni GDPR, HIPAA at NIST SP 800-53 tulad ng mga balangkas kung saan ipinapahayag nito ang mga kontrol; Ang mga tool tulad ng Binary Authorization ay nagpapatunay ng mga lagda ng container bago ang pag-deploy, at ang traceability ay nagpapadali sa mga pag-audit sa mga hybrid na kapaligiran.
Ang napakalaking panloob na paglipat: 30.000 mga pakete at isang AI na tinatawag na CogniPort
Lumipat ang Google humigit-kumulang 30.000 mga pakete ng produksyon patungo sa Arm at planong kumpletuhin ang conversion para gumana ang mga internal na workload nito sa parehong Axion at x86. Ang mga serbisyo tulad ng YouTube, Gmail, at BigQuery ay tumatakbo na sa parehong mga arkitektura.
Sa preprint «Instruction Set Migration sa Warehouse Scale"At ang mga teknikal na publikasyon ay nagdedetalye ng proseso: inaasahan ng mga koponan ang mga problema sa floating-point, concurrency at mga partikular na dependencies, ngunit ang katotohanan ay mas madaling pamahalaan salamat sa mga modernong compiler at sanitizer.
Ang mga unang migrasyon (F1, Spanner, Bigtable) ay nakuha methodical engineeringLingguhang sprint, pagsasaayos sa mga build/release system, at refactoring ng mga pagsubok na isinama sa x86 assumptions. Ang pinakakaraniwang bottleneck ay sa mga tumatandang test suite at deployment pipeline.
Upang sukatin, binuo ng Google CogniPortAng isang AI na bumubuo ng mga commit at nagwawasto ng mga build o pagsubok. Sa ilalim ng mga partikular na kundisyon, nakakamit nito ang mga awtomatikong pag-aayos sa humigit-kumulang 30% ng mga kaso, lalo na sa mga marupok na pagsubok, kundisyon na partikular sa platform, at mga isyu sa representasyon ng data.
Ang layunin ay para magawa ni Borg mag-iskedyul ng mga load ayon sa gastos at pagganap sa pagitan ng Arm at x86 server. Kung babawasan ng Axion ang gastos sa bawat yunit ng trabaho at pagbutihin ang kahusayan, itutulak ng scheduler ang mga kaliskis patungo sa Arm kapag ito ay makatuwiran nang hindi isinasakripisyo ang mga SLO.
x86 vs Arm teknikal na paghahambing sa cloud
Sa mga indibidwal na core, karaniwang nag-aalok ang x86 mataas na pagganap ng single-thread Salamat sa mataas na frequency at malaking cache, ang Arm ay nagbabayad ng mas mataas na core density at superyor na kahusayan, na nag-aalok ng napakahusay na multithreading para sa mga microservice at distributed analytics.
Sa mga tagubilin sa vector, nagbibigay ang x86 AVX-512 Sa mga partikular na sitwasyon ng HPC/ML, ang Arm SVE2 ay sumusukat sa malalawak na SIMD at gumagamit ng mga parallel na pipeline. Ang pagpili ay depende sa workload profile at kung ang pag-optimize ay ginagawa sa bawat katutubong aklatan ng ISA.
Sa seguridad ng hardware, mayroon ang x86 SGX Para sa mga enclave, habang ang Arm ay napakahusay sa PAC/MTE upang palakasin ang memorya at mga pointer. Sa pamamagitan ng pagsasama-sama sa parehong network ng serbisyo, ang ibabaw ng pag-atake ay sari-sari, na nagpapalubha ng sistematikong pagsasamantala.
Sa mga tuntunin ng pagiging tugma, tinatangkilik ng x86 ang a legacy na ekosistema Ito ay napakahusay na itinatag; Mabilis na lumalaki ang braso sa mga container at Linux, at ang mga multi-arch artifact, kasama ang QEMU kapag walang native binary, ay nagpapalambot sa landing.
Mga kaso ng paggamit sa industriya at mga pattern ng pag-aampon
Mga kumpanyang masinsinan sa real-time na data—tulad ng Uber o Spotify— Sinuri o inilipat ang mga workload sa Arm para sa gastos at kahusayan, lalo na sa mga elastic na serbisyo at streaming pipeline na nakikinabang mula sa mga siksik, lubos na magkatulad na mga CPU.
Sa cybersecurity, ilang provider (halimbawa, mga simulation ng pagbabantaGinagamit nila ang heterogeneity upang mabawasan ang pag-iwas sa hardware na nakabatay sa fingerprint. Ang pagpapalit ng mga ISA ay nagpapalubha ng mga bagay para sa mga umaatake at nagbibigay ng mga karagdagang signal para sa pagtuklas ng anomalya.
Sa distributed AI, federated learning at mga rekomendasyong mababa ang latency Sinasamantala nila ang kumbinasyon ng mga mahuhusay na CPU, high-speed networking, at decoupled storage. Ang mga frameworks tulad ng Flower ay maayos na nakahanay sa mga hybrid na cluster.
Para sa mga koponan ng DevOps, isinudokumento ng Google ang mga path ng paglilipat at gcloud CLI na may suporta para sa mga larawan ng Arm, kasama ang paunang compatibility sa “Migrate to Virtual Machines” para ilipat ang mga instance sa bagong arkitektura na may pinababang friction.
Mga tool, pinakamahusay na kagawian at pang-araw-araw na operasyon
Ang rekomendasyon para sa mga platform na may mga microservice ay magdagdag pagsubok ng multi-arkitektura CI/CD (Jenkins, GitHub Actions) para maagang ma-detect ang mga incompatibilities. Binabawasan ng mga matrice ng arkitektura/OS ang mga sorpresa sa produksyon.
Pag-profile sa pagganap sa Linux At ang pagsubaybay sa eBPF ay nakakatulong na matukoy ang mga serbisyo na mga kandidato para sa Arm (high parallelism, CPU hotspots) at sukatin ang tunay na benepisyo. Ang pagsasama ng mga KPI ng gastos/latency/pagkonsumo ng kuryente sa mga dashboard ay gumagabay sa mga desisyon sa pag-iiskedyul.
Para sa CPU-based na AI, ang mga library gaya ng Arm Compute Library Ang mga na-update na toolchain ng LLVM/GCC ay nag-a-unlock ng mga pag-optimize. Sa mga container, ang paggamit ng mga multi-arch na manifest at wastong pag-tag ng mga larawan ay pumipigil sa mga pag-crash ng scheduler.
Sa pagsunod at supply chain, palakasin Binary AuthorizationTinitiyak ng SBOM at mga container firm na ang pagkakaiba-iba ng mga arkitektura ay hindi lumilikha ng mga kahinaan. Ang mga scanner at patakaran sa pagpasok ay dapat magsama ng mga panuntunan para sa bawat arkitektura.
Patuloy na pangangasiwa sa Falco o iba pang makina Ang real-time na seguridad ay nagdaragdag ng isang dynamic na layer upang makakita ng mga anomalya sa magkakaibang mga node, na nagpapanatili ng pare-parehong postura sa pagitan ng x86 at Arm.
Sa Axion, nagtatakda ang Google ng malinaw na direksyon: custom na Arm chips, mga offload tulad ng TitaniumMga premium na backbone network at isang pragmatic na multi-architecture na diskarte na pinagsasama ang pinakamahusay sa x86 ecosystem sa kahusayan ng Arm. Sa pamamagitan ng paglalagay ng mga numero sa talahanayan—pagganap, gastos, kapangyarihan—at pagsisiwalat ng mga pamamaraan (tulad ng CogniPort AI at mga gabay sa paglilipat), malinaw ang mensahe para sa mga teknikal na koponan: mayroong makatotohanang landas sa paggamit ng Arm sa sukat nang hindi isinusulat muli ang lahat, at may mga tool na nagpapaikli sa paglalakbay.
