Суспільство
У Grammarly розробили GEC-корпус української мови
Онлайн-сервіс Grammarly розробив GEC-корпус української, схожі корпуси є для багатьох мов, але до сьогодні не було такого анотованого корпусу для вивчення української мови.
Про це пише nachasi.
GEC-корпус української від Grammarly
GEC-корпус — це сукупність текстів, авторами яких є звичайні люди. Однак через людський фактор такі тексти можуть мати одруки та помилки — сервіс GEC (Grammatical Error Correction) має на меті виправити такі помилки.
Лінгвісти Grammarly перевірили тексти на наявність граматичних, стилістичних чи орфографічних помилок. Ці дані виклали у відкритий доступ і їх можна використати для тренування та оцінки програм виправлення граматичних помилок. Призначення корпусу — наукове та практичне вивчення мови.
GEC-корпус української мови налічує понад тисячу різножанрових текстів (а це більш ніж 20 000 речень), які написали майже 500 волонтерів з усієї України та з-за кордону.
Головні переваги
Головними перевагами сервісу є:
- Цей проєкт сприятиме розвитку онлайн-систем виправлення граматики в українськомовних текстах. Українська мова входить до 50 найпоширеніших мов світу; водночас якісних текстових ресурсів для дослідження української зараз існує небагато. GEC-корпус надає українській дослідницькій спільноті ще один інструмент для опрацювання природної мови та може прискорити розвиток українських комунікаційних асистентів.
- Популяризація якісної української мови в онлайні. Цей корпус буде корисним для наукової спільноти, адже надасть більше інструментів для досліджень та в результаті буде корисним для тих, хто спілкується українською онлайн.
Окрім того, проєкт зі збору та наповнення GEC-корпусу української мови стає постійним у Grammarly і буде частиною внеску компанії у розвиток українського NLP (natural language processing — опрацювання природної мови). Команда продовжить наповнювати корпус текстами за допомогою вебсайту проєкту, а також працюватиме над удосконаленням його технічної цінності, щоб збільшити його значення для наукової спільноти.
«Ми вбачаємо в цьому проєкті особливу цінність для розвитку української комп’ютерної лінгвістики та української мови онлайн і саме тому ухвалили рішення зробити цей проєкт постійним для нашої компанії. Якщо підсумувати простими словами значення цієї ініціативи, то це один із маленьких кроків, які наближають нас до чудової мети — навчити комп’ютер ще краще розуміти українську мову. Саме це надихає всю нашу команду», – розповіла менеджерка команди комп’ютерних лінгвістів Grammarly та керівниця проєкту зі збору корпусу Настасія Осідач.
Читайте також: “Так” українському кіно! Як працює онлайн-кінотеатр Takflix
Ці дані будуть корисні тим, хто цікавиться лінгвістикою, — від студента-науковця до приватної компанії — і для дослідницької роботи, і для створення або поліпшення власного онлайн-застосунка, продукту тощо.
«Ми зробили GEC-корпус загальнодоступним, тож беріть його, досліджуйте та розвивайте комп’ютерне опрацювання української мови! Окрім доповнення самого корпусу текстами, команда активно вдосконалюватиме його технічну цінність. Наші лінгвісти підготують додатковий варіант анотації, що дасть змогу використовувати корпус у двох різних завданнях: виправленні тільки граматики та виправленні граматики й стилю, що суттєво збільшує можливості його використання та значення», – впевнений інженер-дослідник Grammarly Олексій Сивоконь.
Нагадаємо, запустили онлайн-курс для вчителів із викладання української мови для нацменшин.
Усі фото: nachasi.com.
Суспільство
очільниця ГО «Юстина».
Вирішили створювати свою громадську організацію
Ми готували вдома на вогні. Газу не було, світла не було, а отже й інтернету — ми не знали, що відбувається. Але надавали медичну допомогу, прибирали у дворі, прали, годували собак і котів. Люди дуже згуртувалися.
«Юстина», бо справедливість
Місцеві не одразу звикли до таких заходів, а деякі вважали, що їм не потрібна психологічна допомога, і мали багато упереджень щодо психологів. Але зміни в тих, хто таки відвідував заняття, були помітні. Жінки ставали спокійнішими, більш розкутими, виговорювались. Між собою знайомились, бо навіть живучи в одному селі, могли ніде не перетинатися.
Спільний запит у селі — велопарковка
Діти там теж висловлювали свої думки, і мене тоді збентежило, що одна дитина каже: «Нащо писати? Все одно нас ніхто не чує». І мені так хотілося щось зробити для дітей, щоб вони бачили, що мрії мають здійснюватися.
Зробили покриття та надихнули інших на зміни
Коментарі
Суспільство
Як працюватиме новий маршрут?
- На ділянці Варшава – Рава-Руська курсуватиме поїзд польської залізниці PKP Intercity.
- На маршруті Рава-Руська – Львів – Чернівці працюватиме дизель-поїзд українського виробництва ДПКр-3.
Коментарі