Blog post

Amazon-მა დააანონსა სერვერული Arm-პროცესორები Graviton3 და ხელოვნური ინტელექტის მქონე ჩიპები Trainium

Amazon-ის ქლაუდ-განყოფილება AWS-მა დააანონსა EC2 ინსტანციები C7g საკუთარი წარმოების მესამე თაობის ARM-პროცესორ Graviton3-ის ბაზაზე, აგრეთვე Trn1 ინსტანციები, რომლებშიც გამოიყენება ხელოვნური ინტელექტის მქონე ამაჩქარებლები Trainium – ისინი შექმნილია AWS-ის ძალისხმევით და განკუთვნილია მანქანური სწავლებისთვის. 

ორივე მათგანის ანონსი წინასწარ ხასიათს ატარებს. Graviton3-ის შემთხვევაში არ კონკრეტდება არც ARM-არქიტექტურის თაობა, არც ბირთვების რაოდენობა და სიხშირეები. სამაგიეროდ ცნობილია, რომ ახალ პროდუქტებს  Graviton2 ინსტანციებთან შედარებით მეოთხედით მეტი წარმადობა და ორჯერ უფრო სწრაფი გამოთვლების უნარი აქვს კრიპტოგრაფიასთან მუშაობისას. ამასთან, ახალი მოწყობილობები 60%-ით ნაკლებ ენერგიას მოიხმარენ.

მოხდა გარკვეული არქიტექტურული ცვლილებები. bfloat16-ის მხარდაჭერა საშუალებას იძლევა ორჯერ დაჩქარდეს ხელოვნურ ინტელექტთან დაკავშირებული გამოთვლები (სავარაუდოდ საუბარია ინფერენსზე), DDR5 სტანდარტზე გადასვლა კი 50%-ით აამაღლებს მეხსიერების სიჩქარეს. თითოეულ vCPU-ს საკუთარი ქეში აქვს, დამატებით უსაფრთხოებას კი უზრუნველყოფს სტეკის აპარატული დაცვა. გარდა ამისა, ახალ ინსტანციებში ჩუმათობის პრინციპით (default-ად) გამოიყენება მეხსიერების სავალდებულო დაშიფვრა, მხარდაჭერილია EBS-ტომების დაშიფვრა, EFA-კავშირის სიჩქარე კი 30 გბ/წმ-ს აღწევს. 

AWS-ის განცხადებით, EC2 C7g შესაფერეისია HPC-სთვის, EDA-სთვის, ანალიტიკისთვის, გეიმინგ და სარეკლამო პლატფორმებისთვის, მედიაკოდირებისთვის და ა.შ. მათთვის ხელმისაწვდომია დისტრიბუტივები Amazon Linux 2, RHEL, SUSE და Ubuntu, აგრეთვე მთელი რიგი უკვე ადაპტირებული პროგრამული უზრუნველყოფები. ჯერჯერობით C7g ხელმისაწვდომია დახურული ტესტირებებისთვის, თუმცა მისი შეფასება უკვე მოასწრეს Epic Games-მა, Formula 1 Management-მა, Honeycomb.io-მ და Twitter-მა. 

image.png 

თავად Graviton3 პროცესორები წინამორბედების მსგავსად ნაკლებად სავარაუდოა, რომ გაიყიდება “გარეთ” და ძირითადი AWS ინფრასტრუქტურის მიღმა მოხვდება მხოლოდ Outposts-ში. ნებისმიერ შემთხვევაში, ეს მიღწევა თავად Amazon-ისთვის, Nitro-ს დანერგვასთან ერთად,  გარე მომწოდებლებისგან დამოუკიდებლობისა და საკუთარი სერვისების მუშაობის გაუმჯობესებისკენ გადადგმული მნიშვნელოვანი ნაბიჯია. Graviton2-ის ბაზაზე ამჟამად უკვე შემოთავაზებულია 12 ტიპის ინსტანცია, თუმცა AWS-ს საკმაოდ აქტიურად და წარმატებულად გადააქვს ყველა დანარჩენი სერვისი საკუთარ CPU-ებზე.  

EC2 ინსტანცია Trn1 ჯამში ამავე მიზნისკენაა მიმართული. ისინი დამყარებულია Trainium ამაჩქარებლებზე, ეს არის Amazon-ის წარმოების მეორე ჩიპი, რომელიც სპეციალურად მანქანური სწავლებისთვის შეიქმნა. ჩიპს აქვს 32 გბ HBM2e, მისი წარმადობა შეადგენს 210 Tops-ს. Trn1 ინსტანციებში გაერთიანებულია 16-მდე ამგვარი ამაჩქარებელი, რომლებიც ინტერკონექტ NeuronLink-თანაა დაკავშირებული (768 გბ/წმ), აქვთ EFAკავშირი სიჩქარით 800 გბ/წმ-მდე (ორჯერ მეტი წინა თაობის GPU-ინსტანციებთან შედარებით) და გააჩნიათ 8 ტბ-მდე NVMe SSD. 

image.png 

AWS საშუალებას იძლევა შეიქმნას კლასტერები ათიათასობით Trainium-ისგან, რომლებიც გაერთიანებულია პეტაბაიტური კლასის ქსელით და Amazon FSx-ის მეშვეობით დაკავშირებულია პეტაბაიტიან Lustre-სანახ სივრცესთან. ეს ყველაფერი საშუალებას იძლევა სწრაფად მოხდეს გიგანტური მოდელების სწავლება. სამუშაო პროცესისთვის შემოთავაზებულია ინსტრუმენტების საფირმო ნაკრები Neuron SDK (იგივე, რაც განკუთვნილია AWS Inferentia-სთვის), აგრეთვე მხარდაჭერილია ისეთი პოპულარული ფრეიმვორქები, როგორებიცაა Tensorflow ან PyTorchTrn1 ამჟამად ჯერჯერობით წინასწარ წვდომაშია მოთხოვნის შესაბამისად.

 

overclockers.ge