სს „საქართველოს ბანკის“ მონაცემთა ანალიტიკის დეპარტამენტი აცხადებს ვაკანსიას მონაცემთა მეცნიერის (ქართული მეტყველების ტექნოლოგიები) პოზიციაზე.

ვინ ვართ ჩვენ - საქართველოს ბანკის მონაცემთა კვლევითი ლაბორატორია, რომელიც ავითარებს და ნერგავს ხელოვნური ინტელექტის სისტემებს. დღესდღეობით ყურადღებას ვამახვილებთ ქართული მეტყველების ტექნოლოგიებზე.

ჩვენმა ნამუშევარმა წელს მსოფლიო აღიარებაც მოგვიტანა, როცა Global Finance-მა ჩვენი AI ჩეტბოტი მსოფლიოში საუკეთესო AI ფინანსური ინოვაციების სიაში დაასახელა.

ჩვენთან დაგხვდება - მეგობრული, გუნდური, ენერგიული და ტალანტებით გაჯერებული გარემო. ძალიან ბევრი საინტერესო, დინამიკური პროექტი და მენეჯმენტის გუნდის სრული მხარდაჭერა.

ჩვენ ვეძებთ კვალიფიციურ და მოტივირებულ მონაცემთა მეცნიერს, რათა შემოუერთდეს ჩვენ გუნდს, რომელიც მომართულია ქართული ენის მეტყველების ტექნოლოგიების შემუშავებაზე. თქვენ საკვანძო როლს შეასრულებთ ისეთი სისტემების განვითარებაში, როგორიცაა ენის მანქანური გამგები (NLU), ქართული აუდიოს გამტექსტებელი (Speech-to-Text), აზრის მაგენერირებელი დიდი ენის მოდელები (Generative Large Language Models), ტექსტის წარმომთქმელი (სინთეზატორი).

მოვალეობები:

1. მონაცემთა შეგროვება და წინასწარი დამუშავება:

·ქართული ენის ტექსტური და აუდიო კორპუსის მოძიება, შეგროვება, გაწმენდა, გამდიდრება და წინასწარი დამუშავება, მოდელირებისთვის მრავალფეროვანი და ხარისხიანი მონაცემების მისაღებად.

2. მოდელის შემუშავება, ოპტიმიზაცია და დანერგვა:

·მანქანური სწავლების თანამედროვე მეთოდებით და ხელსაწყოებით ქართული ენის არსებული მოდელების გაუმჯობესება, გენერაციული მოდელების გაქართულება და დარგობრივი ცოდნით აღჭურვა ქართულ ენაზე.

· მოდელირების და დანერგვის პროცესების ოპტიმიზება (დროის, ინფრასტრუქტურისა და გამოთვლითი რესურსების ჭრილში)

3.შეფასება და ვალიდაცია:

· ენის მოდელის ხარისხის შეფასების და ვალიდაციის ჩარჩოების დახვეწა და დანერგვა.

4.მუდმივი კვლევა და ინოვაცია.

5.თანამშრომლობა ბიზნესთან, რათა კარგად იყოს გააზრებული მისი საჭიროებები და ის ღირებულება, რაც უნდა მიიღოს ტექნოლოგიის გამოყენებით. ხარჯ-სარგებლის ანალიზი.

სასურველი კვალიფიკაცია:

-აკადემიური ხარისხი კომპიუტერულ მეცნიერებაში, მონაცემთა მეცნიერებაში, მანქანურ სწავლებაში ან მონათესავე სფეროში.

-Python, C/C++, Git, Bash Scripting, Linux, SQL გამოცდილება. TensorFlow, Keras, PyTorch, Jax/Flax ფრეიმვორკებიდან რომელიმეს ცოდნა (უმჯობესია Pytorch).

Docker და Kubernetes ჩაითვლება უპირატესობად.

-უპირატესობად ჩაითვლება მეტყველების ტექნოლოგიებთან მუშაობის დადასტურებული გამოცდილება. უფრო მეტად საყურადღებო იქნება მცირერესურსიანი ენების ან მრავალენოვანი მოდელების შემუშავების პრაქტიკა.

-მეტყველებისა და ტექსტების მონაცემთა კორპუსის შეგროვების, გაწმენდისა და წინასწარი დამუშავების გამოცდილება.

-ნედლი და მრავალფეროვანი მონაცემთა წყაროების დამუშავების გამოცდილება მოდელირებისთვის ხარისხიანი მონაცემების მისაღებად.

-ანალიტიკური ხერხებით ქმედითი მიგნებების კეთების უნარი კომპლექსური მონაცემებიდან.

-უპირატესობად ჩაითვლება ღრუბლოვან პლატფორმებთან მუშაობის გამოცდილება (Amazon Web Services, Microsoft Azure, Google Cloud Platform), ინდუსტრიულ გარემოში მეტყველების ტექნოლოგიების დანერგვისა და მასშტაბირების კონტექსტში.

შემოგვიერთდით ამ საინტერესო მოგზაურობაში, რათა გავაციფრულოთ ქართული და ხელი შევუწყოთ მას, იყოს სიცოცხლისუნარიანი.

რეზიუმეების მიღების საბოლოო ვადაა 20 იანვარი, 2024

მონაცემთა მეცნიერი (ქართული მეტყველების ტექნოლოგიები)

გამოაგზავნეთ განაცხადი

გამოაგზავნეთ განაცხადი

Choose your cookie settings