گرگ مارتین مدیر بازاریابی استراتژیک Xilinx است
در بازارهای پویا و در حال تحول – مانند 5G، مرکز داده، خودرو و صنعتی – برنامههای کاربردی شتاب محاسباتی فزایندهای را میطلبند، در حالی که در بستههای قدرت فشرده باقی میمانند. یک عامل اصلی در تقاضا برای تراکم محاسباتی بالاتر، هوش مصنوعی (AI) است که پذیرش آن به سرعت در حال افزایش است.
استنتاج هوش مصنوعی به عملکرد پردازشی بالا با بودجه های کم توان نیاز دارد، خواه در ابر، لبه یا نقطه پایانی مستقر شود. سخت افزار اختصاصی هوش مصنوعی اغلب برای تسریع بارهای کاری استنتاج هوش مصنوعی مورد نیاز است.
در عین حال، الگوریتمهای هوش مصنوعی بسیار سریعتر از سرعت چرخههای توسعه سنتی سیلیکون در حال تکامل هستند. تراشههای سیلیکونی ثابت، مانند پیادهسازیهای ASIC شبکههای هوش مصنوعی، به دلیل نوآوری سریع در مدلهای هوش مصنوعی پیشرفته، به سرعت منسوخ میشوند.
رایانش تطبیقی پاسخی به این چالش هاست.
محاسبات تطبیقی منحصر به فرد است زیرا شامل سخت افزار سیلیکونی است که می تواند برای برنامه های خاص بهینه شود بعد از ساخت. از آنجایی که بهینه سازی پس از تولید سخت افزار انجام می شود، می توان آن را با آخرین مدل های هوش مصنوعی پیکربندی کرد، مدل هایی که در زمان طراحی ASIC های رقیب وجود نداشتند. این بهینه سازی همچنین می تواند تقریباً بی نهایت بار انجام شده و مجدداً انجام شود و انعطاف پذیری منحصر به فردی را ارائه دهد. تغییرات سخت افزاری را می توان حتی پس از استقرار کامل دستگاه در یک محیط تولیدی نیز انجام داد. درست مانند یک CPU تولیدی که میتوان برنامه جدیدی برای اجرا در اختیار داشت، به یک پلتفرم تطبیقی نیز میتوان پیکربندی سختافزاری جدیدی برای انطباق با آن، حتی در یک محیط تولید زنده، داد.
سخت افزار تطبیقی در مقابل جایگزین ها
پردازندهها و پردازندههای گرافیکی دارای قابلیتهای منحصربهفردی هستند و به خوبی برای انجام وظایف خاص مناسب هستند. CPU ها برای توابع تصمیم گیری که در آن منطق پیچیده نیاز به ارزیابی دارد، بهینه هستند. پردازندههای گرافیکی برای پردازش دادههای آفلاین که به توان عملیاتی بالا نیاز است، بهینه هستند، اما تأخیر نگران کننده نیست. محاسبات تطبیقی در جایی که توان عملیاتی بالا در زمان تأخیر کم مورد نیاز است، بهینه است، مانند پخش جریانی ویدیو در زمان واقعی، ارتباطات 5G و ترکیب حسگر خودرو.
دلیل اینکه محاسبات تطبیقی میتواند عملکرد بالایی در زمان تأخیر کم ارائه دهد، توانایی فعال کردن معماریهای دامنه خاص (DSAs) است که به طور بهینه برنامههای خاص را در دامنههای خاص پیادهسازی میکنند. در مقابل، CPU ها و GPU ها دارای معماری های ثابت و مبتنی بر فون نویمان هستند که اجازه بهینه سازی دامنه معماری زیربنایی خود را نمی دهند.
DSA ها همچنین می توانند با استفاده از یک دستگاه سیلیکونی اختصاصی (ثابت) ساخته شوند که معمولاً محصول استاندارد ویژه برنامه یا ASSP نامیده می شود. در حالی که اجرای DSA در یک ASSP ثابت مزایایی دارد، معایبی نیز دارد.
اول سرعت نوآوری است. برای ادامه، از تولیدکنندگان انتظار می رود که خدمات جدیدی را در بازه های زمانی کوتاه تر از همیشه ایجاد و ارائه کنند. به طور خاص، بازههای زمانی کوتاهتر از زمانی است که برای طراحی و ساخت یک DSA سیلیکونی ثابت جدید نیاز است. این یک ناهماهنگی اساسی بازار بین تقاضاهای بازار در مورد نوآوری و زمان لازم برای طراحی و ساخت ASSP توسط شرکت ها ایجاد می کند. تغییر در استانداردهای صنعتی یا سایر الزامات نوسانی می تواند به سرعت این دستگاه ها را منسوخ کند.
دومین مورد، هزینه سیلیکون سفارشی است. هزینه یکباره طراحی و ساخت یک طرح سیلیکونی منحصر به فرد، مانند یک ASIC پیچیده 7 نانومتری، می تواند چندین صد میلیون دلار هزینه مهندسی غیر تکراری (NRE) داشته باشد. پیش بینی می شود که با کاهش هندسه دستگاه به 5 نانومتر و کمتر، هزینه ها بیشتر افزایش یابد. افزایش هزینه، پذیرش گره های پیشرفته برای ASSP ها را کند می کند، که می تواند کاربران خود را با فناوری قدیمی و کم کارآمدتر مواجه کند.
معرفی پلتفرم های تطبیقی
پلتفرمهای تطبیقی همگی بر اساس یک پایه سختافزار تطبیقی اساسی هستند. با این حال، آنها بسیار بیشتر از سخت افزار یا دستگاه سیلیکونی هستند. پلتفرم های تطبیقی مجموعه ای جامع از نرم افزارهای زمان اجرا را در بر می گیرند. در ترکیب، سختافزار و نرمافزار قابلیت منحصربهفردی را ارائه میکنند که از آن میتوان برنامههای بسیار انعطافپذیر و در عین حال کارآمد ساخت.
این دستگاه ها محاسبات تطبیقی را برای طیف وسیعی از توسعه دهندگان نرم افزار و سیستم در دسترس قرار می دهند. این پلتفرمها میتوانند بهعنوان پایهای برای بسیاری از محصولات، با مزایایی از جمله:
-
کاهش زمان ورود به بازار برنامهای که با استفاده از پلتفرمی مانند کارت شتابدهنده مرکز داده Alveo ساخته میشود، میتواند از سختافزار تسریعشده برای یک برنامه خاص استفاده کند، اما نیازی به سفارشیسازی سختافزاری ندارد. یک کارت PCIe به سرور اضافه می شود و کتابخانه های تسریع شده مستقیماً از یک برنامه نرم افزاری موجود فراخوانی می شوند.
-
کاهش هزینه های عملیاتی برنامههای بهینهشده مبتنی بر یک پلتفرم تطبیقی میتوانند بهدلیل افزایش چگالی محاسباتی، راندمان قابلتوجهی بالاتری را در هر گره نسبت به راهحلهای فقط CPU ارائه دهند.
-
بار کاری انعطاف پذیر و پویا پلتفرم های تطبیقی را می توان بسته به نیازهای فعلی پیکربندی مجدد کرد. توسعه دهندگان می توانند به راحتی برنامه های مستقر شده در یک پلت فرم تطبیقی را با استفاده از تجهیزات مشابه برای برآورده کردن نیازهای در حال تغییر حجم کاری تغییر دهند.
-
طرح های اثبات شده در آینده پلتفرمهای تطبیقی را میتوان بهطور مداوم تطبیق داد. اگر ویژگیهای جدیدی در یک برنامه موجود مورد نیاز باشد، سختافزار را میتوان برای اجرای بهینه این ویژگیها برنامهریزی کرد و نیاز به ارتقای سختافزار را کاهش داد و در نتیجه طول عمر سیستم را افزایش داد.
-
شتاب کل برنامه به ندرت استنتاج هوش مصنوعی به صورت مجزا وجود دارد. این بخشی از یک زنجیره بزرگتر از تجزیه و تحلیل و پردازش داده ها است که اغلب دارای چندین مرحله قبل و بعد است که از یک پیاده سازی سنتی (غیر هوش مصنوعی) استفاده می کند. بخشهای تعبیهشده هوش مصنوعی این سیستمها از شتاب هوش مصنوعی بهره میبرند. قطعات غیر هوش مصنوعی نیز از شتاب بهره می برند. ماهیت انعطاف پذیر محاسبات تطبیقی برای سرعت بخشیدن به وظایف پردازش هوش مصنوعی و غیر AI مناسب است. این “شتاب کل برنامه” نامیده می شود و از آنجایی که استنتاج هوش مصنوعی محاسباتی در برنامه های بیشتری نفوذ می کند، اهمیت فزاینده ای پیدا کرده است.
دسترسی به پلت فرم تطبیقی
در گذشته، بهره مندی از فناوری FPGA، توسعه دهندگان را ملزم می کرد که بردهای سخت افزاری خود را بسازند و از زبان توصیف سخت افزار (HDL) برای پیکربندی FPGA استفاده کنند. در مقابل، پلتفرمهای تطبیقی به توسعهدهندگان اجازه میدهند تا از محاسبات تطبیقی مستقیماً از چارچوبها و زبانهای نرمافزار آشنا خود مانند C++، Python، TensorFlow و غیره بهره ببرند. توسعهدهندگان نرمافزار و هوش مصنوعی اکنون میتوانند از محاسبات تطبیقی بدون نیاز به ساخت برد یا متخصص سختافزار استفاده کنند.
انواع مختلف پلتفرم های تطبیقی
انواع مختلفی از پلتفرم های تطبیقی بر اساس کاربرد و نیاز وجود دارد، از جمله کارت های شتاب مرکز داده و ماژول های لبه استاندارد. پلتفرم های متعددی برای ارائه بهترین نقطه شروع ممکن برای برنامه مورد نظر وجود دارد. برنامههای کاربردی بسیار متفاوت هستند، از برنامههای حساس به تأخیر، مانند رانندگی مستقل و پخش ویدیو در زمان واقعی، تا پیچیدگی بالای پردازش سیگنال 5G و پردازش دادههای پایگاههای داده بدون ساختار.
محاسبات تطبیقی را می توان در ابر، شبکه، لبه و حتی در نقطه پایانی مستقر کرد و آخرین نوآوری های معماری را به برنامه های گسسته و انتها به انتها رساند. گستره مکانهای استقرار به لطف انواع پلتفرمهای تطبیقی امکانپذیر است – از دستگاههای با ظرفیت بالا روی کارتهای شتابدهنده PCIe در مرکز داده، تا دستگاههای کوچک و کم مصرف مناسب برای پردازش نقطه پایانی مورد نیاز دستگاههای IoT.
معرفی موتور هوش مصنوعی
یکی از بزرگترین نوآوری های اخیر در محاسبات تطبیقی، معرفی موتور هوش مصنوعی توسط Xilinx بود. موتور هوش مصنوعی هنوز اساساً یک بلوک قابل تنظیم است، اما مانند یک CPU نیز قابل برنامه ریزی است. یک موتور هوش مصنوعی به جای اینکه از سخت افزار پردازش استاندارد FPGA تشکیل شود، دارای پردازنده های برداری اسکالر با کارایی بالا و داده های چندگانه (SIMD) است. این پردازندهها برای پیادهسازی کارآمد توابع غنی از ریاضی که معمولاً در استنتاج هوش مصنوعی و ارتباطات بیسیم یافت میشوند، بهینه شدهاند.
آرایههایی از موتورهای هوش مصنوعی همچنان با اتصالات دادهای سازگار با FPGA مانند متصل هستند که امکان ساخت مسیرهای داده کارآمد و بهینهشده را برای برنامه مورد نظر فراهم میکند. این ترکیب از عناصر پردازشی شبیه به CPU که از نظر محاسباتی متراکم (غنی از ریاضیات) متصل به اتصال FPGA مانند هستند، نسل جدیدی از هوش مصنوعی و محصولات ارتباطی را آغاز می کند.
برای دنیایی هوشمندتر و متصل تر آماده شوید
اساساً، محاسبات تطبیقی مبتنی بر فناوری FPGA موجود است، اما آن را برای طیف گستردهتری از توسعهدهندگان و برنامههای کاربردی بیش از همیشه در دسترس قرار میدهد. توسعه دهندگان نرم افزار و هوش مصنوعی اکنون می توانند برنامه های کاربردی بهینه سازی شده را با استفاده از محاسبات تطبیقی بسازند، فناوری که قبلاً در دسترس آنها نبود.
توانایی تطبیق سخت افزار با یک برنامه خاص، تمایز منحصر به فردی از CPU ها، GPU ها و ASSP ها است که دارای معماری سخت افزاری ثابت هستند. محاسبات تطبیقی به سخت افزار اجازه می دهد تا برای یک برنامه کاربردی طراحی شود و کارایی بالایی را به همراه داشته باشد، اما همچنان در صورت تغییر حجم کاری یا استانداردها، سازگاری آینده را امکان پذیر می کند.
همانطور که جهان بیشتر متصل و هوشمند می شود، محاسبات تطبیقی همچنان در خط مقدم برنامه های بهینه و شتاب یافته قرار می گیرد و به همه توسعه دهندگان قدرت می دهد تا فردای بهتر بسازند.