Авто-пам’ять та пам’ять зі штрафом

Ситуація

На руках маєш файли пам’яті TMX з попередніх проектів, у них є 100% відповідності, однак точність перекладу залишає бажати кращого. Така ситуація може бути, наприклад, при наявності файлів пам’яті після машинного перекладу, або при отриманні проекту, в якому значна частина матеріалів перекладалась колись кимось іншим, а відтак була змінена тощо.
Крім того, маєш інші файли пам’яті, у яких теж присутні 100% відповідності, проте в цих файлах якість перекладу тебе задовольняє і ти хотів би при 100% відповідностях автоматично отримувати переклад сегментів без зайвих рухів.
Звісно, щоб OmegaT могла ці файли TMX використовувати, маєш їх помістити у теку /tm всередині проекту (чи у іншу теку, але у властивостях проекту вказати, куди саме OmegaT повинна дивитися по пам’ять).

Проблема

У OmegaT є можливість автоматично вставляти відповідності, що мають певний відсоток подібності. В залежності від проекту і якості додаткової пам’яті цей відсоток може бути різним (тобі вирішувати, який саме), але він не повинен бути низьким (70% — це дуже низький). Крім того, при автоматичній вставці OmegaT може додавати ще й префікс до вставлених таким чином сегментів, щоб потім їх потім можна було швидко знайти і підправити. Активується це через меню «Options» → «Editing Behaviour», прапорець на «Insert the best fuzzy match».
Коли така можливість активована, з’являється проблема — «якісні» відповідності вставляються із «зайвим» префіксом, вимагаючи додаткового редагування. Якщо ж префікс забрати, то «неякісні» відповідності вставляються, нічим свою низьку якість тобі не показуючи. Можна, звісно, відключити цю опцію зовсім, однак тоді треба буде дивитись за кожною відповідністю та по кожній приймати рішення. Втім, OmegaT дозволяє цю проблему елегантно вирішити.

Рішення

  1. Всередині теки /tm створи підтеку /auto (матимеш тека_проекту/tm/auto), клади туди «якісну» пам’ять, і тоді вже не важливо, активована вище вказана функція чи ні — пам’ять з цієї теки вестиме себе так, як головна пам’ять проекту project_save.tmx.
  2. Для тих файлів пам’яті, точність відповідностей у котрих треба зменшити, так, щоб 100% перетворилось, скажімо, на 90%, у теці /tm створи підтеку penalty-10 (матимеш тека_проекту/tm/penalty-10; -10, як ти здогадався — це відсотки «штрафу», тому може бути і -15, і -55). Сюди кладеш ті файли, з яких автоматично не повинні вставлятися переклади, наприклад, пам’яті, які виготовив собі з Google Traslate. Відсоток штрафу вказуй такий, щоб результат вийшов нижчим за той показник, при якому відбувається автоматична вставка.
  3. Решту файлів пам’яті лишай просто у /tm і вже сам вирішуй, як тобі з відповідностями поводитися.

Успіхів!

2 thoughts on “Авто-пам’ять та пам’ять зі штрафом

  1. Добрый день! Дельные советы. Мне нравится делать так:
    auto — памяти от наших предыдущих переводов. Причем они должны быть названы в порядке, обратном порядку их сохранения, чтобы наиболее свежие памяти всегда шли по порядку первыми как потенциально более актуальные. Просто присваиваю цифру для этого. Например, 99_память.tmx — старая, 98_память.tmx — новая.
    penalty-30 — память заказчика
    penalty-50 — памяти для справки от других проектов.

    Спасибо за ссылку на мой блог 🙂

    С уважением,
    Роман

    • Всегда пожалуйста. Ваш блог сложно не порекомендовать — столько в нем полезного и доступно изложенного.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s