რა არის გუგლის TPU

 

ეს დიდი ამბავი 2016 წელს დაიწყო, (ან შეიძლება უფრო ადრეც) მაგრამ გუშინ სტოკ ბირჟებზე მაგარი ამბები გაიჩითა, ხოდა ჩაძიების მერე აღმოვაჩინე, რომ გუგლმა კიდევ ერთი კოზირი დააძრო. 

ნახეთ ვიდეო:


 ::  შესავალი: შემდეგი ნახტომი ხელოვნური ინტელექტის აპარატურაში
ხელოვნური ინტელექტის (AI) განვითარების ტემპი თავბრუდამხვევია. ის, რაც დღეს ხდება, ძალიან ჰგავს „ინტერნეტის ადრეულ დღეებს“ — იგივე წარმოუდგენელი ენერგია და შესაძლებლობების შეგრძნება, თუმცა ის, რასაც მაშინ წლები სჭირდებოდა, ახლა თვეებში ან კვირებში ხდება. ამ რევოლუციის ცენტრში დგას უზარმაზარი გამოთვლითი სიმძლავრის საჭიროება.

თუმცა, ინდუსტრიის ფოკუსი თანდათან იცვლება. საუბარი აღარ არის მხოლოდ გიგანტური მოდელების „დატრენინგებაზე“. ახლა მთავარი გამოწვევაა, ეს მოდელები სასარგებლო და სწრაფ იარაღად ვაქციოთ რეალურ დროში ინტერაქციებისთვის. სწორედ ამ ახალი ეპოქისთვის შექმნა Google-მა თავისი მეშვიდე თაობის ტენზორული დამუშავების ერთეული (TPU), Ironwood. ის შექმნილია იმისთვის, რომ მასშტაბურად უზრუნველყოს მოაზროვნე, დასკვნებზე ორიენტირებული AI მოდელების მუშაობა, რადგან ის ბრწყინვალედ უმკლავდება მასიურ გამოთვლებს და მნიშვნელოვნად ამცირებს ჩიპის შიგნით მონაცემთა გადაადგილებისთვის საჭირო დროს.

 ::  ფაქტი 1: ის შექმნილია „დასკვნების ეპოქისთვის“ და არა მხოლოდ ვარჯიშისთვის

მარტივად რომ ვთქვათ, „დასკვნების ეპოქა“ ნიშნავს, რომ აქცენტი გადადის მოდელების შექმნიდან მათ ყოველდღიურ გამოყენებაზე, ანუ „სასარგებლო, სწრაფ ინტერაქციებზე“. დაფიქრდით რეალურ დროში ენების თარგმნაზე, ჩეთბოტების კომპლექსურ მსჯელობაზე ან გენერაციული ხელოვნების შექმნაზე — სწორედ ეს არის დასკვნების ეპოქის არსი. Ironwood სპეციალურად ამ მიზნისთვისაა შექმნილი: ის ოპტიმიზებულია მაღალი წარმადობისა და ხარჯთეფექტური დასკვნებისთვის, ანუ „მაღალი მოცულობის, დაბალი შეყოვნების მქონე AI დასკვნებისა და მოდელების მომსახურებისთვის“.

მისი სიმძლავრე შთამბეჭდავია: ის წინა თაობასთან შედარებით გვთავაზობს „4-ჯერ უკეთეს წარმადობას თითო ჩიპზე როგორც ვარჯიშის, ისე დასკვნების დატვირთვისთვის“. ეს მას Google-ის მიერ დღემდე შექმნილ ყველაზე მძლავრ და ენერგოეფექტურ ჩიპად აქცევს.

 ::  ფაქტი 2: მისი მასშტაბი თითქმის წარმოუდგენელია

მაგრამ Ironwood-ის ნამდვილი ძალა არა ცალკეულ ჩიპში, არამედ მის თითქმის წარმოუდგენელ მასშტაბირების უნარში ვლინდება. ის Google-ის „AI ჰიპერკომპიუტერის“ — ინტეგრირებული სუპერკომპიუტერული სისტემის — ფუნდამენტური კომპონენტია, რომელიც ინდივიდუალურ TPU-ებს აერთიანებს ურთიერთდაკავშირებულ ერთეულებში, რომლებსაც „პოდები“ ეწოდება.

წარმოიდგინეთ შემდეგი მონაცემები:

• ეს არქიტექტურა Google-ს საშუალებას აძლევს, ერთ „სუპერპოდში“ 9,216-მდე ინდივიდუალური ჩიპი ერთიან, უნიფიცირებულ გამოთვლით ქსოვილად აქციოს.

• ეს ჩიპები ერთმანეთთან დაკავშირებულია რევოლუციური Inter-Chip Interconnect (ICI) ქსელით, რომელიც 9.6 ტერაბიტი/წამში სიჩქარით მუშაობს.

• ერთ სუპერპოდს წვდომა აქვს 1.77 პეტაბაიტის მოცულობის გაზიარებულ მაღალი გამტარობის მეხსიერებაზე (HBM).

ეს მასიური ურთიერთკავშირი საშუალებას აძლევს ათასობით ჩიპს, სწრაფად დაამყაროს კომუნიკაცია, გადალახოს მონაცემთა გადაცემის შეფერხებები და მსოფლიოში ერთ-ერთი ყველაზე დიდი და რთული მოდელი „როგორც ერთიანი, კოორდინირებული ოპერაცია“ ამუშაოს. შედეგად, ეს ეფექტურობა მნიშვნელოვნად ამცირებს გამოთვლით საათებსა და ენერგიას, რომელიც საჭიროა უახლესი AI სერვისების ვარჯიშისა და მუშაობისთვის.

იმისათვის, რომ ეს რიცხვები უფრო გასაგები გახდეს, Google-ს საინტერესო ანალოგია მოჰყავს:

ეს გამტარუნარიანობა ეკვივალენტურია მთელი ვიკიპედიის 12-ჯერ ჩამოტვირთვისა ყოველ წამში.

აღსანიშნავია ისიც, რომ მაქსიმალური წარმადობისა და ეფექტურობისთვის, სუპერპოდის თითოეული TPU თხევადი გაგრილების სისტემით მუშაობს.

 ::  ფაქტი 3: ხელოვნური ინტელექტი უკვე საკუთარ აპარატურას აპროექტებს

ეს, ალბათ, ყველაზე გასაოცარი ფაქტია. Ironwood-ის შექმნა Google-ში არსებული „უწყვეტი ციკლის“ შედეგია, სადაც მკვლევრები პირდაპირ გავლენას ახდენენ აპარატურის დიზაინზე, ხოლო აპარატურა, თავის მხრივ, აჩქარებს კვლევას. კონკურენტებისგან განსხვავებით, რომლებიც გარე მომწოდებლებზე არიან დამოკიდებულნი, Google DeepMind-ის მკვლევრებს შეუძლიათ პირდაპირ ითანამშრომლონ TPU-ს ინჟინრებთან.

ამ პროცესში Google-ის მკვლევრები ხელოვნურ ინტელექტსაც კი იყენებენ შემდეგი თაობის ჩიპების შესაქმნელად. მეთოდს, რომელსაც „AlphaChip“ ჰქვია, იყენებს განმტკიცებით სწავლებას (ხელოვნური ინტელექტის ერთ-ერთი სახეობა), რათა ჩიპების უკეთესი ფიზიკური განლაგება შექმნას. ეს AI-ზე დაფუძნებული დიზაინის მეთოდი გამოყენებული იყო ბოლო სამი თაობის TPU-სთვის, Ironwood-ის ჩათვლით. ეს უნიკალური უკუკავშირი ქმნის აპარატურისა და მოდელების განვითარების ისეთ მზარდ აჩქარებას, რომლის გამეორებაც კონკურენტებისთვის ძალიან რთულია.

 ::  დასკვნა: რას ნიშნავს ეს მომავლისთვის?

Ironwood წარმოადგენს უმნიშვნელოვანეს ნაბიჯს ისეთი მძლავრი, ეფექტური და მასშტაბირებადი აპარატურის შესაქმნელად, რომელიც სპეციალურად თანამედროვე ხელოვნური ინტელექტის მოთხოვნებს პასუხობს. აქცენტი კეთდება არა მხოლოდ სიმძლავრეზე, არამედ ეფექტურობაზეც, რასაც ადასტურებს „წარმადობის 2-ჯერ გაუმჯობესება ვატზე“ და ფოკუსირება „ტოკენებზე ვატზე“. ამ მიდგომის პრაქტიკული შედეგი შთამბეჭდავია: ბოლო 12 თვის განმავლობაში, Gemini-ის აპლიკაციებმა უფრო მაღალი ხარისხის პასუხები გასცეს, მაშინ როცა ენერგიის მოხმარება 33-ჯერ შემცირდა, ხოლო ნახშირბადის მთლიანი კვალი — 44-ჯერ.

ეს ყველაფერი გვაფიქრებინებს: თუ ხელოვნური ინტელექტი უკვე საკუთარი აპარატურის შექმნას აჩქარებს, რა იქნება შემდეგი ნაბიჯი და რამდენად სწრაფად მივაღწევთ მომავალს, რომელსაც დღეს მხოლოდ ვვარაუდობთ?



 ::  წყარო

3 რამ აირონვუდზე აირონვუდი — გუგლის ღრუბლოვანი TPU

Announcing Ironwood TPUs General Availability and new Axion VMs to power the age of inference Google Cloud unboxes seventh generation Ironwood TPU CPU vs GPU vs TPU vs DPU vs QPU:

Comments

Popular posts from this blog

სტენფორდის ონლაინ კურსი კოდირებაში

თხა და გიგო (ზღაპარი)

@ მეილის ნიშნის ისტორია