


Пакет за подршку српског језика у програму GNU aspell
0.02, 09. 11. 2005.


Припремио и издао Горан Ракић, <gox na devbase tacka net>. Пакет је објављен под GNU 
LGPL лиценцом (копија лиценце је достављена у пакету)  и објављен је на локацији 
http://www.srpski.org/aspell/

У листи речи се налази и 133986 речи добијених из Корпуса савременог српског језика 
изграђеном на Математичком факултету Универзитета у Београду укупне величине 25MW 
састављен од стране Групе за језичке технологије МАТФ. Листа речи је устпљена под 
GNU LGPL лиценцом за потребе формирања GNU aspell и MySpell речника српског језика. 
Додатно, исправност 284420 других речи, из корпуса формираног из текстова објављених 
на интернету, је проврена пропуштањем кроз поменути Корпус савременог српског језика 
чиме је 150080 речи означено као потенцијално неисправно. Овом приликом се
захваљујем професору Душку Витасу са Математичког факултета Универзитета у Београду 
на указаној помоћи и уступљеним ресурсима. Више информација о Корпусу савременог 
српског језика можете пронаћи на локацији http://korpus.matf.bg.ac.yu.

Захваљујем се и Виктору Керкезу <alef na uns.ns.ac tacka yu> на листи речи из које
се 281865 речи нашло у овом издању. 762 потпуно нових речи је присутно само захваљујући
овој листи.

Такође, осећам потребу да се захвалим и Тањи Самарџић са Филолошког факултета
Универзитета у Београду на саветима и помоћи у провери исправности речи. Неке
њене сугестије су већ примењене на ово издање, али ће већи део бити примењен у
наредним издањима.

Речник у овој верзији још увек не користи афиксна правила и садржи 343242 речи 
и њихових облика.

Пакет садржи три речника (ћирилица, латиница и комбиновани) и две листе речи 
(ћирилица и латиница). Подразумевани је комбиновани речник. Да бисте укључили 
проверу само текста написаног на ћирилици, односно латиници искористите опцију 
"--variety" при позиву програма. Речи су записане у UTF-8 кодној страници,  
нормализованој на посебну 8bit-ну кодну страницу под именом l-sr. GNU aspell  
датотеке l-sr.cset и l-sr.cmap су приложене у пакету. За опис кодне странице,
погледајте датотеку misc/l-sr.txt у дистрибуцији. Кодна страница подржава
акцентоване вокале, али се у овом издању у речнику не налазе речи са акцентованим
вокалима. Аутор се захваљује Кевину Еткинсону, координатору развоја програма 
GNU aspell на помоћи при креирању кодне странице.

Бићу обрадован уколико Ви као корисници покажете било какву инцијативу у 
вези исправке грешака у речима у речнику или у вези допуне речника новим речима.
У плану је отварање страница на локацији овог пакета преко које ће корисници
бити у могућности да у речник увезу своје личне речнике, као и да помогну у провери
исправности речи које се сада налазе у речнику.

Аутора можете контактирати на е-адресу наведену у заглављу ове датотеке.