تحول زیرساختهایAI با نسل جدید پردازندههای اینتل
هوش مصنوعی مولد (Generative AI) طی سالهای اخیر به یکی از مهمترین فناوریهای تحولآفرین در حوزه IT تبدیل شده است. از مدلهای زبانی بزرگ (LLM) گرفته تا تولید محتوا، تحلیل داده و اتوماسیون فرآیندها، همه به قدرت پردازشی بالا و زیرساختی پایدار نیاز دارند.
تا مدتها اجرای این بارهای کاری بهصورت مستقیم با کارتهای گرافیکی (GPU) گره خورده بود، اما هزینه بالا، مصرف انرژی زیاد و محدودیت در تامین GPUها باعث شد سازمانها به دنبال جایگزینهای مقرونبهصرفهتر باشند. در همین راستا، پردازندههای جدید Intel Xeon 6 مسیر تازهای برای اجرای مدلهای هوش مصنوعی مولد روی CPU ایجاد کردهاند؛ مسیری که در سرورهای نسل جدیدی مانند HPE ProLiant DL380 Gen12 به بلوغ رسیده است.
Intel Xeon 6؛ معماری جدید برای پردازش بارهای AI
پردازندههای Intel Xeon 6 با هدف پاسخگویی به نیازهای پردازشی مدرن طراحی شدهاند و ترکیبی از کارایی بالا، مصرف انرژی بهینه و قابلیت اجرای بارهای AI را ارائه میکنند.
این نسل از پردازندهها از معماری ترکیبی شامل هستههای پرقدرت (P-Cores) و هستههای کممصرف (E-Cores) بهره میبرد که باعث ایجاد تعادل میان Performance و Efficiency میشود. چنین ساختاری برای دیتاسنترهایی که همزمان چندین workload را اجرا میکنند، اهمیت بسیار بالایی دارد.
یکی از مهمترین قابلیتهای Xeon 6 برای هوش مصنوعی، فناوریهای زیر است:
- Intel AMX (Advanced Matrix Extensions)
- AVX-512
- شتابدهندههای داخلی AI
- بهینهسازی پردازش ماتریسی و Tensor Operations
این قابلیتها باعث میشوند اجرای مدلهای مبتنی بر Transformer مانند Llama یا سایر LLMها بدون وابستگی کامل به GPU امکانپذیر شود.

نقش Intel AMX در افزایش سرعت مدلهای زبانی
فناوری Intel AMX یکی از کلیدیترین قابلیتهای Xeon 6 محسوب میشود که برای پردازش محاسبات ماتریسی طراحی شده است. این ویژگی عملکرد مدلهای AI را بهصورت چشمگیری افزایش میدهد و تاخیر پردازشی را کاهش میدهد.
در سناریوهای عملیاتی، AMX میتواند عملیات مربوط به inference مدلهای زبانی را با سرعت بسیار بالاتری نسبت به نسلهای قبلی CPU انجام دهد. این موضوع برای سازمانهایی که قصد دارند سرویسهای AI را در مقیاس وسیع ارائه کنند، اهمیت زیادی دارد.
سرور HPE ProLiant DL380 Gen12؛ زیرساختی قدرتمند برای GenAI
سرور HPE ProLiant DL380 Gen12 یکی از مهمترین سرورهای نسل جدید اچپی است که برای پردازش workloadهای سنگین، مجازیسازی، AI و تحلیل داده طراحی شده است.
این سرور 2 یونیتی دو پردازندهای، از پردازندههای Intel Xeon 6 پشتیبانی میکند و زیرساختی ایدهآل برای اجرای مدلهای هوش مصنوعی مولد در اختیار سازمانها قرار میدهد.
مهمترین مزایای DL380 Gen12 برای AI
- پشتیبانی از پردازندههای نسل جدید Intel Xeon 6
- بهرهوری انرژی بالا
- پشتیبانی از حافظههای DDR5
- پهنای باند بالاتر با PCIe Gen5
- قابلیت توسعهپذیری گسترده
- مدیریت پیشرفته با HPE iLO
این ویژگیها باعث میشوند سرور DL380 Gen12 بتواند بهعنوان یک زیرساخت AI Factory مقرونبهصرفه در سازمانها عمل کند.

کاهش هزینهها با اجرای AI روی CPU
یکی از مهمترین مزایای استفاده از Intel Xeon 6 در سرورهای HPE، کاهش چشمگیر هزینه مالکیت یا TCO است.
در معماریهای سنتی AI، سازمانها مجبور به استفاده از GPUهای گرانقیمت بودند؛ سختافزارهایی که علاوه بر قیمت بالا، نیازمند خنکسازی پیشرفته و مصرف برق قابلتوجه هستند. اما اجرای مدلهای AI روی Xeon 6 میتواند:
- هزینه سرمایهگذاری اولیه را کاهش دهد
- مصرف انرژی دیتاسنتر را بهینه کند
- پیچیدگی زیرساخت را کمتر کند
- مدیریت و نگهداری سیستمها را سادهتر سازد
بر اساس نتایج منتشرشده، پردازندههای Xeon 6 میتوانند تا 68 درصد صرفهجویی در هزینههای عملیاتی ایجاد کنند.
OpenVINO؛ ابزار کلیدی بهینهسازی مدلهای AI
برای دستیابی به بهترین عملکرد در سرورهای مبتنی بر Xeon 6، استفاده از ابزار OpenVINO Toolkit اهمیت زیادی دارد.
OpenVINO مجموعهای از ابزارهای نرمافزاری اینتل برای بهینهسازی مدلهای هوش مصنوعی است که قابلیتهایی مانند موارد زیر را ارائه میدهد:
- Quantization مدلها به INT8 و INT4
- کاهش مصرف حافظه
- افزایش Throughput
- کاهش Latency
- بهینهسازی اجرای مدل روی CPU
استفاده از OpenVINO باعث میشود مدلهای بزرگ زبانی با سرعت و کارایی بیشتری روی سرورهای HPE اجرا شوند.

اجرای LLMها روی سرورهای HPE با Docker و vLLM
در محیطهای عملیاتی مدرن، اجرای مدلهای هوش مصنوعی معمولاً با استفاده از کانتینرها انجام میشود.
ابزارهایی مانند Docker و vLLM امکان استقرار سریع مدلهای زبانی را فراهم میکنند. برای مثال، مدلهایی مانند Llama-3.1-8B را میتوان با استفاده از نسخههای بهینهشده OpenVINO روی CPU اجرا کرد.
این معماری چند مزیت مهم دارد:
- استقرار سریعتر سرویسهای AI
- مقیاسپذیری بهتر
- مدیریت سادهتر
- کاهش وابستگی به GPU
- استفاده بهینه از منابع سختافزاری
روشهای سفارشیسازی مدلهای AI در سازمانها
سازمانها برای استفاده کاربردی از هوش مصنوعی مولد، معمولاً مدلها را متناسب با نیازهای تجاری خود شخصیسازی میکنند. در سرورهای HPE DL380 Gen12 سه رویکرد رایج وجود دارد:
مهندسی پرامپت (Prompt Engineering)
سادهترین روش برای کنترل خروجی مدلها بدون تغییر ساختار اصلی مدل.
RAG یا بازیابی تقویتشده با تولید
در این روش مدل به منابع داده داخلی سازمان متصل میشود تا پاسخهایی دقیقتر و مبتنی بر دادههای اختصاصی ارائه دهد.

فاینتیونینگ (Fine-Tuning)
در این رویکرد، مدل روی دادههای تخصصی آموزش داده میشود تا برای حوزههایی مانند پزشکی، مالی یا حقوقی بهینه شود.
عملکرد واقعی Xeon 6 در بارهای کاری هوش مصنوعی
نتایج آزمایشها نشان میدهد ترکیب Intel Xeon 6 و OpenVINO میتواند عملکرد بسیار رقابتی در اجرای مدلهای AI ارائه دهد.
در برخی سناریوها:
- Throughput بیش از 2 برابر افزایش یافته است
- عملکرد کلی تا 40 درصد نسبت به نسل قبل بهتر شده
- مصرف انرژی بهینهتر شده است
- تاخیر پاسخدهی کاهش پیدا کرده است
این پیشرفتها باعث شدهاند سرورهای نسل جدید HPE گزینهای جدی برای اجرای AI در Edge و دیتاسنتر باشند.
جمعبندی
ترکیب پردازندههای Intel Xeon 6 با سرورهای HPE ProLiant DL380 Gen12 رویکرد جدیدی برای پیادهسازی هوش مصنوعی مولد ایجاد کرده است.
سازمانها اکنون میتوانند بدون وابستگی کامل به GPUهای گرانقیمت، مدلهای زبانی بزرگ و workloadهای AI را با هزینه کمتر، مصرف انرژی بهینهتر و پیچیدگی زیرساخت پایینتر اجرا کنند.
استفاده از فناوریهایی مانند Intel AMX و OpenVINO نشان میدهد آینده زیرساختهای AI تنها به GPU محدود نخواهد بود و CPUهای مدرن نیز نقش کلیدی در نسل بعدی دیتاسنترهای هوشمند ایفا خواهند کرد.
آداک فناوری مانیا با عرضه سرور و استوریج با قیمت و کیفیت مناسب در کنار شماست تا بهترین انتخاب را داشته باشید. با مشاورین فنی ما در تماس باشید تا بهترین پیشنهاد را به شما داشته باشند.



