Tech

Ampere bekerja sama dengan Qualcomm untuk meluncurkan server AI berbasis Arm

Ampere dan Qualcomm bukanlah mitra yang paling jelas. Keduanya menawarkan chip berbasis Arm untuk menjalankan server pusat data (meskipun pasar terbesar Qualcomm tetap mobile). Namun seperti yang diumumkan kedua perusahaan hari ini, mereka kini menggabungkan kekuatan untuk menawarkan server yang berfokus pada AI yang menggunakan CPU Ampere dan chip inferensi AI Cloud AI100 Ultra Qualcomm dari Qualcomm untuk menjalankan — bukan pelatihan — model.

Seperti produsen chip lainnya, Ampere ingin mengambil keuntungan dari booming AI. Namun, fokus perusahaan selalu pada chip server yang cepat dan hemat daya, sehingga meskipun dapat menggunakan Arm IP untuk menambahkan beberapa fitur ini ke chipnya, hal tersebut belum tentu merupakan kompetensi inti. Itu sebabnya Ampere memutuskan untuk bekerja sama dengan Qualcomm (dan SuperMicro untuk mengintegrasikan kedua solusi tersebut), kata CTO Arm Jeff Wittich kepada saya.

“Idenya di sini adalah meskipun saya akan menunjukkan kepada Anda beberapa kinerja luar biasa untuk CPU Ampere yang menjalankan inferensi AI hanya pada CPU tersebut, jika Anda ingin memperluas skala ke model yang lebih besar — ​​​​model parameter multi-100 miliar, misalnya — sama seperti semua beban kerja lainnya, AI bukanlah satu ukuran untuk semua,” kata Wittich kepada TechCrunch. “Kami telah bekerja sama dengan Qualcomm dalam solusi ini, menggabungkan CPU Ampere kami yang super efisien untuk melakukan banyak tugas tujuan umum yang Anda jalankan bersamaan dengan inferensi, dan kemudian menggunakan kartu mereka yang sangat efisien, kami mendapatkan solusi solusi tingkat server.”

Mengenai kemitraan dengan Qualcomm, Wittich mengatakan bahwa Ampere ingin menghadirkan solusi terbaik.

“[R]Kolaborasi yang sangat bagus yang kami miliki dengan Qualcomm di sini,” katanya. “Ini adalah salah satu hal yang sedang kami kerjakan, menurut saya kami memiliki banyak kesamaan minat, itulah sebabnya menurut saya ini sangat menarik. Mereka sedang membangun solusi yang sangat, sangat efisien dan banyak bagian pasar yang berbeda. Kami sedang membangun solusi yang sangat, sangat efisien di sisi CPU server.”

Kemitraan Qualcomm adalah bagian dari pembaruan peta jalan tahunan Ampere. Bagian dari peta jalan tersebut adalah chip AmpereOne 256-core baru, yang dibuat menggunakan proses 3nm modern. Chip baru tersebut belum tersedia secara umum, namun Wittich mengatakan chip tersebut sudah siap dan akan diluncurkan akhir tahun ini.

Selain inti tambahan, fitur penentu chip AmpereOne generasi baru ini adalah RAM DDR5 12 saluran, yang memungkinkan pelanggan pusat data Ampere menyesuaikan akses memori penggunanya dengan lebih baik sesuai dengan kebutuhan mereka.

Namun, promosi penjualan di sini bukan hanya kinerja, tetapi juga konsumsi daya dan biaya untuk menjalankan chip ini di pusat data. Hal ini terutama berlaku dalam hal inferensi AI, di mana Ampere suka membandingkan kinerjanya dengan GPU A10 Nvidia.

Perlu dicatat bahwa Ampere tidak menghentikan chip apa pun yang ada demi chip baru ini. Wittich menekankan bahwa chip lama ini pun masih memiliki banyak kegunaan.

Ampere juga mengumumkan kemitraan lain hari ini. Perusahaan bekerja sama dengan BERSIH untuk membangun solusi bersama yang memasangkan CPU Ampere dengan chip pemrosesan video NETINT. Server baru ini akan mampu mentranskode 360 ​​saluran video langsung secara paralel, sambil juga menggunakan OpenAI Bisikan model ucapan-ke-teks untuk subtitle 40 aliran.

“Kami memulai jalur ini enam tahun lalu karena jelas ini adalah jalur yang benar,” kata CEO Ampere Renee James dalam pengumuman hari ini. “Daya rendah dulunya identik dengan kinerja rendah. Ampere telah membuktikan bahwa itu tidak benar. Kami telah memelopori efisiensi komputasi dan memberikan kinerja melebihi CPU lama dalam lingkup komputasi yang efisien.”

Source

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button