Репозиторий Sisyphus
Последнее обновление: 1 октября 2023 | Пакетов: 18631 | Посещений: 37046348
en ru br
Репозитории ALT

Группа :: Работа с текстами
Пакет: hunalign

 Главная   Изменения   Спек   Патчи   Sources   Загрузить   Gear   Bugs and FR  Repocop 

Текущая версия: 1.2-alt2
Время сборки: 4 октября 2019, 17:14 ( 234.0 недели назад )
Размер архива: 3.08 Mb

Домашняя страница:   http://mokk.bme.hu/resources/hunalign/

Лицензия: LGPL
О пакете: The hunalign sentence aligner
Описание:

hunalign aligns bilingual text on the sentence level. Its input is
tokenized and sentence-segmented text in two languages. In the simplest
case, its output is a sequence of bilingual sentence pairs (bisentences).

In the presence of a dictionary, hunalign uses it, combining this
information with Gale-Church sentence-length information. In the absence
of a dictionary, it first falls back to sentence-length information,
and then builds an automatic dictionary based on this alignment. Then
it realigns the text in a second pass, using the automatic dictionary.

Like most sentence aligners, hunalign does not deal with changes of
sentence order: it is unable to come up with crossing alignments, i.e.,
segments A and B in one language corresponding to segments B' A' in
the other language.

There is nothing Hungarian-specific in hunalign, the name simply reflects
the fact that it is part of the hun* NLP toolchain.

Текущий майнтейнер: Vitaly Lipatov

Список всех майнтейнеров, принимавших участие
в данной и/или предыдущих сборках пакета:

Список rpm-пакетов, предоставляемый данным srpm-пакетом:

  • hunalign
  • hunalign-data
  • hunalign-debuginfo
ACL:
     
    дизайн и разработка: Vladimir Lettiev aka crux © 2004-2005, Andrew Avramenko aka liks © 2007-2008
    текущий майнтейнер: Michael Shigorin