ხ᳥ლოვნური ინტ᳥ლ᳥ქტის ანა-ბანა - ყველაფერი, რაც უნდა იცოდეთ

Opinions expressed by 鶹 contributors are their own.

You're reading 鶹 Georgia, an international franchise of 鶹 Media.

ბოლო რამდენიმე თვეში ჩატბოტებმა, მაგალითად ChatGPT, და სურათების გენერატორებმა, როგორიცაა მაგალითად Midjourney, ჩვენს ყოველდღიურობაში დაიკავეს ადგილი და კულტურული ფენომენებიც გახდნენ.

ამ სტატიაში გაგაცნობთ ხ᳥ლოვნურ ინტ᳥ლ᳥ქტს, როგორც არა მხოლოდ ჩატბოტს, არამედ მრავალი ფუნქციით დატვირთულ ციფრულ ქმნილებას. ვნახოთ, როგორ გახდნენ ეს ქმნილებები ჩვენი ცხოვრების ნაწილი.

როგორ სწავლობს ხ᳥ლოვნური ინტ᳥ლ᳥ქტი?

ყველანაირ მანქანურ დასწავლაში მნიშვნელოვანია მეცადინეობის პროცესი. ჩვენ ხ᳥ლოვნურ ინტ᳥ლ᳥ქტს დიდი რაოდენობით ინფორმაციას ვაწვდით − იქნება ეს ფოტო/ვიდეო/აუდიო ფაილები თუ სიტყვიერი ჩანაწერები. ამავდროულად, ვაძლევთ ინსტრუქციებსაც. მაგალითად, "იპოვე ყველა ფოტო, რომელშიც სახე ჩანს", ან "კატეგორიებად დაყავი ეს ხმები".

პროგრამა ძიებას და ინფორმაციის დასწავლას იწყებს, ცდილობს საერთო და განმასხვავებელი ნიშნები იპოვოს. ხანდახან შეიძლება თქმაც დასჭირდეს, რომ "ეს სახე არაა", "ეს ხმები განსხვავებულია". თუმცა, პროგრამა ნელ-ნელა სწავლობს ინფორმაციას და დასწავლის პერიოდის შემდეგ საკუთარ შესაძლებლობებსაც განსაზღვრავს.

რა არის ჩატბოტი?

ჩატბოტზე ისე უნდა ვიფიქროთ, თითქოს ის თუთიყუშია − შეუძლია სიტყვები გაიმეოროს, თუმცა კონტექსტი და მნიშვნელობა ზედმიწევნით არ ესმის. ცხადია, ჩატბოტები ამას ბევრად დახვეწილად აკეთებენ. და მაინც, როგორ შეუძლიათ წერა?

ისინი ხ᳥ლოვნური ინტ᳥ლ᳥ქტის იმ კატეგორიას განეკუთვნებიან, რომელსაც "დიდი ენობრივი მოდელები" (Large Language Models) ჰქვია და ნასწავლი აქვთ დიდ ტექსტებზე მუშაობა. LLM-ს არა მხოლოდ სიტყვების, არამედ მთელი წინადადებების გენერირება შეუძლია. გარდა ამისა, მათ წვდომა აქვთ ფაქტობრივად მთელ ინტერნეტსივრცეზე, ამიტომაც მათი სიტყვათა მარაგი უსაზღვროა. გარდა ამისა, LLM-ებს ესმით გრამატიკა და ადამიანის დახმარების გარეშე შეუძლიათ გამართული წინადადებების წერა.

შეიძლება ხ᳥ლოვნურ ინტ᳥ლ᳥ქტს დაველაპარაკო?

თუკი ოდესმე გამოგიყენებია Alexa, Siri ან ხმის ამომცნობი ნებისმიერი სხვა სისტემა, მაშინ ხ᳥ლოვნურ ინტ᳥ლ᳥ქტთან გისაუბრია კიდეც. როგორ ხდება ეს?

ხ᳥ლოვნური ინტ᳥ლ᳥ქტი იწერს თქვენს ხმას, აშორებს ყველანაირ ხმაურს, თქვენს საუბარს ფონეტიკურ ერთეულებად ყოფს და შემდეგ თავის უზარმაზარ ბიბლიოთეკაში ათავსებს. თქვენი საუბარი ტექსტად გარდაიქმნება.

ამ ტიპის ხ᳥ლოვნურ ინტ᳥ლ᳥ქტს ენის ბუნებრივ დამუშავებას უწოდებენ. სწორედ ეს ინტ᳥ლ᳥ქტი გპასუხობს, როცა ეკითხები, როგორი ამინდი იქნება კონკრეტულ ქალაქში და გისმენს, როცა საბანკო ტრანზაქციას "დიახ" პასუხით ადასტურებ.

ესმის თუ არა ხ᳥ლოვნურ ინტ᳥ლ᳥ქტს ფოტოების შინაარსი?

ოდესმე თქვენს ტელეფონს დაუჯგუფებია ფოტოები ფოლდერებში − "სანაპიროზე", "ღამე", "ღრუბლები"? − ამ შემთხვევაშიც ისე იყენებდით ხ᳥ლოვნურ ინტ᳥ლ᳥ქტს, რომ არც კი გაგიანალიზებიათ. ალგორითმმა კი ერთნაირი შინაარსები იპოვა და ისინი დააჯგუფა.

ეს პროგრამები ძალიან მოცულობითი ცნობების დამუშავებას არიან შეჩვეული. თუკი, მაგალითად, ფოტოს ამომცნობ ხ᳥ლოვნურ ინტ᳥ლ᳥ქტს მიაწვდი შესაბამის ფოტოებს და ეტყვი, რომ მათზე ველოსიპედია გამოსახული, ის დაისწავლის ფოტოებს და გარკვეულ ეტაპზე შ᳥ძლებს იპოვოს განსხვავება ველოსიპედსა და ავტომობილს, ველოსიპედსა და მოტოციკლს შორის.

ხანდახან ხ᳥ლოვნურ ინტ᳥ლ᳥ქტს იმისთვისაც წვრთნიან, რომ უმცირესი სხვაობა იპოვოს დეტალებში. ასე მუშაობს, მაგალითად, სახის ამოცნობა − ინტ᳥ლ᳥ქტი ნაკვთებს შორის კავშირს, მანძილს, ფერებს − ყველაფერს სწავლობს და მეორედ უკვე გცნობთ.

და ახალი ფოტოები როგორღა იქმნება?

ხ᳥ლოვნური ინტ᳥ლ᳥ქტი მხოლოდ ფოტოების წაკითხვაზე არ გაჩერებულა − მას ფოტოების გენერირების უნარიც აქვს. ისეთ ინტ᳥ლ᳥ქტებს, როგორიცაა, მაგალითად, Midjourney, შეგიძლია სთხოვო რაღაც ისეთის ვიზუალიზაცია, რაც არასდროს მომხდარა. ალბათ გვახსოვს კიდეც ხ᳥ლოვნური ინტ᳥ლ᳥ქტის მიერ დახატული "კრემლის დაცემა".

ან, შეგიძლია ისეთი ნახატის დახატვა სთხოვო, რომელიც რამდენიმე ელემენტს აერთიანებს, მაგალითად, ინგლისის ნაკრების მწვრთნელი პიკასოს სტილში.

ხ᳥ლოვნური ინტ᳥ლ᳥ქტი ნახატს პიქსელებიდან აწყობს. დასწავლის პერიოდში მას პატერნები აქვს ნასწავლი და სხვადასხვა ობიექტის "აშენება" შეუძლია. წერტილები ერთმანეთს ემატება, ახალი შრეები წარმოიქმნება და წერტილების შეერთებით იმის მსგავსი ნახატი ჩნდება, რაც ხ᳥ლოვნურ ინტ᳥ლ᳥ქტს მონაცემთა ბაზაში ჰქონდა ნანახი.

ასე მაგალითად, მის ბაზაში ცალკე იყო კრემლის შენობა, ნანახი აქვს ნგრევაც და ხანძარიც − ამ სამი ელემენტის შეერთებით კი "კრემლის დაცემის" ფოტო დახატა.

ხ᳥ლოვნური ინტ᳥ლ᳥ქტის მიერ შექმნილი ნამუშევრები სრულიად ახალია, თუმცა ბაზად აქამდე არსებულ ნახატებს იყენებს.

ხ᳥ლოვნურ ინტ᳥ლ᳥ქტ ყველაფრის გაკ᳥თ᳥ბა შ᳥ძლებ?

მანქანის მართვა, ინფორმაციის უსწრაფესად მოძიება და მიწოდება, ხატვა და მუსიკის შექმნა − რა მოხდება ამ და კიდევ სხვა უნარებს თუკი გავაერთიანებთ? შესაძლებელია უნივერსალური, ჰიბრიდული ხ᳥ლოვნური ინტ᳥ლ᳥ქტის შექმნა?

მულტიფუნქციური მოდელების უნივერსალურ შესაძლებლობებს ყველაზე კარგად ChatGPT გვაჩვენებს. გაუმჯობესების შემდეგ ChatGPT მხოლოდ ტექსტზე აღარ კონცენტრირდება და ფოტოების კითხვაც დაიწყო.

იდეას, რომელიც უნივერსალური ხ᳥ლოვნური ინტ᳥ლ᳥ქტის შექმნას აღწერს და გვაძლევს შესაძლებლობას, ერთი მოდელის დახმარებით ვთარგმნოთ და შევქმნათ წამლები, ხ᳥ლოვნური გენერალური ინტ᳥ლ᳥ქტი (Artificial General Intelligence (AGI) ეწოდება.

უნდა გვაწუხებდეს ხ᳥ლოვნური ინტ᳥ლ᳥ქტის ასეთი განვითარება?

ბოლო წლებში ხ᳥ლოვნური ინტ᳥ლ᳥ქტის განვითარების ტემპმა ბევრს ენთუზიაზმი შთაბერა, ზოგიერთები კი იმაზე ააღელვა, საფრთხე ხომ არ გვემუქრება.

ერთ-ერთი ასეთი ღელვის მიზეზი სიძულვილის ენის წახალისებაა − ესმის თუ არა ხ᳥ლოვნურ ინტ᳥ლ᳥ქტს, რომ სექსისტური, რასისტული, ჰომოფობიური ტერმინები არ უნდა გამოიყენოს? გარდა ამისა, აქვს თუ არა ამ მოდელებს რაიმე ეთიკური ჩარჩო, როცა ნახატს ხატავენ ან ესსეს წერენ?

არიან ისეთებიც, რომლებიც ფიქრობენ, რომ ხ᳥ლოვნური ინტ᳥ლ᳥ქტის მომაკვდინებელ შედეგებზე ფიქრის ნაცვლად, უფრო ახლო მომავალზე უნდა დავფიქრდეთ. მაგალითად, როგორ შეიძლება ამ მოდელებმა უნდობლობა გაზარდონ მედიისა და პოლიტიკოსების მიმართ?

მსოფლიო განსაკუთრებულად ელოდება 2024 წლის საპრეზიდენტო არჩევნებს აშშ-ში, რათა დავაკვირდეთ, როგორ გაუმკლავდებიან ამომრჩევლები და პოლიტიკური პარტიები ბევრად დახვეწილ დეზინფორმაციულ კამპანიებს.

რა მოხდება, თუკი ხ᳥ლოვნური ინტ᳥ლ᳥ქტის საშუალებით გავრცელდება დიდი რაოდენობით ვიდეოები, სადაც საპრეზიდენტო კანდიდატების საუბრებია ფალსიფიცირებული და რომელიღაც კონკრეტული ჯგუფის გაბრაზებას ემსახურება?

ევროპაში კანონმდებლები უკვე მუშაობენ "ხ᳥ლოვნური ინტ᳥ლ᳥ქტის შესახებ აქტის" შემუშავებაზე, რომელიც მოდელების გამოყენებას დაარეგულირებს.