پیاده‌سازی هوش مصنوعی مولد با Intel Xeon 6 در سرور HPE DL380 Gen12

تحول زیرساخت‌هایAI با نسل جدید پردازنده‌های اینتل

هوش مصنوعی مولد (Generative AI) طی سال‌های اخیر به یکی از مهم‌ترین فناوری‌های تحول‌آفرین در حوزه IT تبدیل شده است. از مدل‌های زبانی بزرگ (LLM) گرفته تا تولید محتوا، تحلیل داده و اتوماسیون فرآیندها، همه به قدرت پردازشی بالا و زیرساختی پایدار نیاز دارند.

تا مدت‌ها اجرای این بارهای کاری به‌صورت مستقیم با کارت‌های گرافیکی (GPU) گره خورده بود، اما هزینه بالا، مصرف انرژی زیاد و محدودیت در تامین GPUها باعث شد سازمان‌ها به دنبال جایگزین‌های مقرون‌به‌صرفه‌تر باشند. در همین راستا، پردازنده‌های جدید Intel Xeon 6 مسیر تازه‌ای برای اجرای مدل‌های هوش مصنوعی مولد روی CPU ایجاد کرده‌اند؛ مسیری که در سرورهای نسل جدیدی مانند HPE ProLiant DL380 Gen12 به بلوغ رسیده است.

Intel Xeon 6؛ معماری جدید برای پردازش بارهای AI

پردازنده‌های Intel Xeon 6 با هدف پاسخگویی به نیازهای پردازشی مدرن طراحی شده‌اند و ترکیبی از کارایی بالا، مصرف انرژی بهینه و قابلیت اجرای بارهای AI را ارائه می‌کنند.

این نسل از پردازنده‌ها از معماری ترکیبی شامل هسته‌های پرقدرت (P-Cores) و هسته‌های کم‌مصرف (E-Cores) بهره می‌برد که باعث ایجاد تعادل میان Performance و Efficiency می‌شود. چنین ساختاری برای دیتاسنترهایی که هم‌زمان چندین workload را اجرا می‌کنند، اهمیت بسیار بالایی دارد.

یکی از مهم‌ترین قابلیت‌های Xeon 6 برای هوش مصنوعی، فناوری‌های زیر است:

Intel AMX (Advanced Matrix Extensions)
AVX-512
شتاب‌دهنده‌های داخلی AI
بهینه‌سازی پردازش ماتریسی و Tensor Operations

این قابلیت‌ها باعث می‌شوند اجرای مدل‌های مبتنی بر Transformer مانند Llama یا سایر LLMها بدون وابستگی کامل به GPU امکان‌پذیر شود.

نقش Intel AMX در افزایش سرعت مدل‌های زبانی

فناوری Intel AMX یکی از کلیدی‌ترین قابلیت‌های Xeon 6 محسوب می‌شود که برای پردازش محاسبات ماتریسی طراحی شده است. این ویژگی عملکرد مدل‌های AI را به‌صورت چشمگیری افزایش می‌دهد و تاخیر پردازشی را کاهش می‌دهد.

در سناریوهای عملیاتی، AMX می‌تواند عملیات مربوط به inference مدل‌های زبانی را با سرعت بسیار بالاتری نسبت به نسل‌های قبلی CPU انجام دهد. این موضوع برای سازمان‌هایی که قصد دارند سرویس‌های AI را در مقیاس وسیع ارائه کنند، اهمیت زیادی دارد.

سرور HPE ProLiant DL380 Gen12؛ زیرساختی قدرتمند برای GenAI

سرور HPE ProLiant DL380 Gen12 یکی از مهم‌ترین سرورهای نسل جدید اچ‌پی است که برای پردازش workloadهای سنگین، مجازی‌سازی، AI و تحلیل داده طراحی شده است.

این سرور 2 یونیتی دو پردازنده‌ای، از پردازنده‌های Intel Xeon 6 پشتیبانی می‌کند و زیرساختی ایده‌آل برای اجرای مدل‌های هوش مصنوعی مولد در اختیار سازمان‌ها قرار می‌دهد.

با سرور DL380 Gen12 بیشتر آشنا شوید.

مهم‌ترین مزایای DL380 Gen12 برای AI

پشتیبانی از پردازنده‌های نسل جدید Intel Xeon 6
بهره‌وری انرژی بالا
پشتیبانی از حافظه‌های DDR5
پهنای باند بالاتر با PCIe Gen5
قابلیت توسعه‌پذیری گسترده
مدیریت پیشرفته با HPE iLO

این ویژگی‌ها باعث می‌شوند سرور DL380 Gen12 بتواند به‌عنوان یک زیرساخت AI Factory مقرون‌به‌صرفه در سازمان‌ها عمل کند.

کاهش هزینه‌ها با اجرای AI روی CPU

یکی از مهم‌ترین مزایای استفاده از Intel Xeon 6 در سرورهای HPE، کاهش چشمگیر هزینه مالکیت یا TCO است.

در معماری‌های سنتی AI، سازمان‌ها مجبور به استفاده از GPUهای گران‌قیمت بودند؛ سخت‌افزارهایی که علاوه بر قیمت بالا، نیازمند خنک‌سازی پیشرفته و مصرف برق قابل‌توجه هستند. اما اجرای مدل‌های AI روی Xeon 6 می‌تواند:

هزینه سرمایه‌گذاری اولیه را کاهش دهد
مصرف انرژی دیتاسنتر را بهینه کند
پیچیدگی زیرساخت را کمتر کند
مدیریت و نگهداری سیستم‌ها را ساده‌تر سازد

بر اساس نتایج منتشرشده، پردازنده‌های Xeon 6 می‌توانند تا 68 درصد صرفه‌جویی در هزینه‌های عملیاتی ایجاد کنند.

OpenVINO؛ ابزار کلیدی بهینه‌سازی مدل‌های AI

برای دستیابی به بهترین عملکرد در سرورهای مبتنی بر Xeon 6، استفاده از ابزار OpenVINO Toolkit اهمیت زیادی دارد.

OpenVINO مجموعه‌ای از ابزارهای نرم‌افزاری اینتل برای بهینه‌سازی مدل‌های هوش مصنوعی است که قابلیت‌هایی مانند موارد زیر را ارائه می‌دهد:

Quantization مدل‌ها به INT8 و INT4
کاهش مصرف حافظه
افزایش Throughput
کاهش Latency
بهینه‌سازی اجرای مدل روی CPU

استفاده از OpenVINO باعث می‌شود مدل‌های بزرگ زبانی با سرعت و کارایی بیشتری روی سرورهای HPE اجرا شوند.

Updated graphic for use on the Intel Create Homepage.

اجرای LLMها روی سرورهای HPE با Docker و vLLM

در محیط‌های عملیاتی مدرن، اجرای مدل‌های هوش مصنوعی معمولاً با استفاده از کانتینرها انجام می‌شود.

ابزارهایی مانند Docker و vLLM امکان استقرار سریع مدل‌های زبانی را فراهم می‌کنند. برای مثال، مدل‌هایی مانند Llama-3.1-8B را می‌توان با استفاده از نسخه‌های بهینه‌شده OpenVINO روی CPU اجرا کرد.

این معماری چند مزیت مهم دارد:

استقرار سریع‌تر سرویس‌های AI
مقیاس‌پذیری بهتر
مدیریت ساده‌تر
کاهش وابستگی به GPU
استفاده بهینه از منابع سخت‌افزاری

روش‌های سفارشی‌سازی مدل‌های AI در سازمان‌ها

سازمان‌ها برای استفاده کاربردی از هوش مصنوعی مولد، معمولاً مدل‌ها را متناسب با نیازهای تجاری خود شخصی‌سازی می‌کنند. در سرورهای HPE DL380 Gen12 سه رویکرد رایج وجود دارد:

مهندسی پرامپت (Prompt Engineering)

ساده‌ترین روش برای کنترل خروجی مدل‌ها بدون تغییر ساختار اصلی مدل.

RAG یا بازیابی تقویت‌شده با تولید

در این روش مدل به منابع داده داخلی سازمان متصل می‌شود تا پاسخ‌هایی دقیق‌تر و مبتنی بر داده‌های اختصاصی ارائه دهد.

فاین‌تیونینگ (Fine-Tuning)

در این رویکرد، مدل روی داده‌های تخصصی آموزش داده می‌شود تا برای حوزه‌هایی مانند پزشکی، مالی یا حقوقی بهینه شود.

عملکرد واقعی Xeon 6 در بارهای کاری هوش مصنوعی

نتایج آزمایش‌ها نشان می‌دهد ترکیب Intel Xeon 6 و OpenVINO می‌تواند عملکرد بسیار رقابتی در اجرای مدل‌های AI ارائه دهد.

در برخی سناریوها:

Throughput بیش از 2 برابر افزایش یافته است
عملکرد کلی تا 40 درصد نسبت به نسل قبل بهتر شده
مصرف انرژی بهینه‌تر شده است
تاخیر پاسخ‌دهی کاهش پیدا کرده است

این پیشرفت‌ها باعث شده‌اند سرورهای نسل جدید HPE گزینه‌ای جدی برای اجرای AI در Edge و دیتاسنتر باشند.

جمع‌بندی

ترکیب پردازنده‌های Intel Xeon 6 با سرورهای HPE ProLiant DL380 Gen12 رویکرد جدیدی برای پیاده‌سازی هوش مصنوعی مولد ایجاد کرده است.

سازمان‌ها اکنون می‌توانند بدون وابستگی کامل به GPUهای گران‌قیمت، مدل‌های زبانی بزرگ و workloadهای AI را با هزینه کمتر، مصرف انرژی بهینه‌تر و پیچیدگی زیرساخت پایین‌تر اجرا کنند.

استفاده از فناوری‌هایی مانند Intel AMX و OpenVINO نشان می‌دهد آینده زیرساخت‌های AI تنها به GPU محدود نخواهد بود و CPUهای مدرن نیز نقش کلیدی در نسل بعدی دیتاسنترهای هوشمند ایفا خواهند کرد.

آداک فناوری مانیا با عرضه سرور و استوریج با قیمت و کیفیت مناسب در کنار شماست تا بهترین انتخاب را داشته باشید. با مشاورین فنی ما در تماس باشید تا بهترین پیشنهاد را به شما داشته باشند.