![](https://shotam.info/wp-content/uploads/2022/11/314737927_2028168667382631_3462772128515768993_n.jpg)
![](https://shotam.info/wp-content/uploads/2022/11/314737927_2028168667382631_3462772128515768993_n.jpg)
Технології
Компанія Grammarly презентувала другу версію GEC-корпусу української мови
Компанія Grammarly опублікувала у вільному доступі другу версію анотованого GEC-корпусу української мови, що містить майже 34 000 речень.
Про це повідомили на фейсбук-сторінці Grammarly Ukraine.
Зазначається, що команда Grammarly запустила волонтерський проєкт зі створення цього набору даних у серпні 2020 року.
Першу версію корпусу UA-GEC, яка містила близько 20 000 речень, опублікували у відкритому доступі у січні 2021 року та відтоді працювали над його розширенням та покращенням. Другу версію вже можна вільно завантажити на платформі GitHub.
GEC-корпус (GEC — grammatical error correction) — це сукупність текстів, авторами яких може стати кожен. Grammarly перевіряє ці тексти на наявність граматичних, стилістичних чи орфографічних помилок та викладає отримані дані у відкритий доступ. Після цього їх можна використати для тренування та оцінки програм виправлення граматичних помилок. Корпус використовують для наукового та практичного вивчення мови.
Чому це важливо?
Тоді як для англійської мови є чимало анотованих GEC-корпусів, історично для багатьох мов, зокрема і для української, таких даних у публічному доступі не було. Команда Grammarly поставила за мету створити такий ресурс для української мови та зробити його доступним науковій спільноті.
GEC-корпус може бути корисним для досліджень у сфері обробки природної мови, а також тренування та покращення моделей машинного навчання. Що більше даних у корпусі, то краще працюють моделі на його основі. Для порівняння: GEC-корпус німецької мови нараховує 25 тис. речень, чеської — близько 47 тис. речень, а англійської — 1 млн 167 тис. речень. Корпус UA-GEC 2.0 містить 33 735 речень.
Чим відрізняється версія UA-GEC 2.0 від попередньої?
- Збільшився розмір корпусу — до майже 34 000 речень;
- Додали більш деталізовану класифікацію помилок (зокрема розділили категорії «граматика» і «стиль» на ще 13 і 5 підкатегорій відповідно);
- Завантажили корпус у двох варіантах — тепер його можна використовувати у двох різних завданнях: виправленні тільки граматики і виправленні граматики та стилю.
Читайте також: Як вивчити українську? 250 безкоштовних курсів від мовного омбудсмена
Grammarly подякували всім волонтерам (а це понад 800 людей), які долучилися до збору текстів, та сподівається, що корпус UA-GEC буде корисним українським та міжнародним науковим спільнотам, які займаються обробкою природної мови, а також сприятиме практичному дослідженню української мови і покращенню інструментів для роботи з нею.
Про Grammarly
Grammarly — українська онлайн-платформа на основі штучного інтелекту для допомоги у спілкуванні англійською мовою, запущена 2009 року. Grammarly підвищує якість письмового спілкування, пропонуючи рекомендації щодо правильності (граматика та механіки письма), чіткості (стислість та зрозумілість), захопливості (словниковий запас та розмаїття) та тону повідомлення (формальність, ввічливість і впевненість). Має представництва у Києві, Сан-Франциско, Нью-Йорку та Ванкувері.
Нагадаємо, український стартап Grammarly залучив інвестиції і досяг капіталізації в $13 млрд.
Також ми повідомляли, що соцмережа LinkedIn «заговорила» українською.
Малюнок: facebook.com/GrammarlyUkraine.
Технології
![](https://shotam.info/wp-content/uploads/2024/07/2-scaled-1.jpg)
![](https://shotam.info/wp-content/uploads/2024/07/1-1-1536x997-1.jpg)
![](https://shotam.info/wp-content/uploads/2024/07/Screenshot_1-31.jpg)
Ефективність та економія
Технології
![](https://shotam.info/wp-content/uploads/2024/07/66a22058e6900.jpg.webp)
- Натиснути на кнопку з трьома крапками на головному екрані.
- У спадному меню вибрати «Оновити документ».
Технології
![](https://shotam.info/wp-content/uploads/2024/07/1eb12589-b1260214222224d085c760dec59237be.jpg)
Розробники повідомили, що реліз гри S.T.A.L.K.E.R. 2: Heart of Chornobyl, який спочатку планували на 5 вересня, перенесено на 20 листопада 2024 року.
Про це повідомляють розробники.
Вони презентували новий трейлер гри та пояснили, що їм потрібні ще два місяці для виправлення «багів».
Читати також: На ВДНГ відкрили фан-зону: там можна подивитися Олімпійські Ігри 2024
Команда також анонсувала відео S.T.A.L.K.E.R. 2 Developer Deep Dive, яке вийде на медіамайданчиках Xbox 12 серпня. У цьому відео будуть інтерв’ю, нові відеоматеріали та повне проходження одного з квестів гри.
Про гру
Дії S.T.A.L.K.E.R. 2 відбуваються у зоні відчуження Чорнобильської АЕС. Гра поєднує елементи шутера, горора й імерсивного симулятора. Основний сюжет гри триває приблизно 40 годин і має варіантивність у проходженні, що призводить до чотирьох різних кінцівок.
GSC Game World обіцяє додаткові анонси влітку 2024 року, де буде представлено більше інформації про шутер.
Нагадаємо, що у Львові скасували рішення про початок навчального року з 19 серпня.
Фото: S.T.A.L.K.E.R. 2: Heart of Chornobyl.