APPENDIX-A A.1 TAMIL TRANSLITERATIONshodhganga.inflibnet.ac.in/bitstream/10603/9233/20/20...ம ma...

38
252 APPENDIX-A A.1 TAMIL TRANSLITERATION Tamil Roman a a A i I u U e E ai o O au q ka k xa x xA ி xi xI xu xU xe xau xE xai xo xO கா kA கி ki kI ku kU ke kE kai கா ko கா kO கௗ kau nga ng ஙா ngA ஙி ngi ngI ngu ngU nge ngE ngai ஙா ngo ஙா ngO ஙௗ ngau sa s சா sA சி si sI su sU se sE sai சா so சா sO சௗ sau nja nj ஞா njA ஞி nji njI nju njU nje njE njai ஞா njo

Transcript of APPENDIX-A A.1 TAMIL TRANSLITERATIONshodhganga.inflibnet.ac.in/bitstream/10603/9233/20/20...ம ma...

252

APPENDIX-A

A.1 TAMIL TRANSLITERATION

Tamil Roman

அ a அ a ஆ A இ i ஈ I உ u ஊ U எ e ஏ E ஐ ai ஒ o ஓ O ஔ au ஃ q க ka க் k க்ஷ xa

x க்ஷா xA க்ஷி xi க்ஷீ xI க்ஷு xu க்ஷூ xU ெக்ஷ xe ெக்ஷௗ xau

ேக்ஷ xE ைக்ஷ xai ெக்ஷா xo ேக்ஷா xO கா kA கி ki கீ kI கு ku கூ kU ெக ke ேக kE ைக kai ெகா ko ேகா kO ெகௗ kau ங nga ங் ng ஙா ngA ஙி ngi ஙீ ngI ஙு ngu ஙூ ngU ெங nge ேங ngE ைங ngai ெஙா ngo

ேஙா ngO ெஙௗ ngau ச sa ச் s சா sA சி si சீ sI சு su சூ sU ெச se ேச sE ைச sai ெசா so ேசா sO ெசௗ sau ஞ nja ஞ் nj ஞா njA ஞி nji ஞீ njI

nju njU

ெஞ nje ேஞ njE ைஞ njai ெஞா njo

253

ேஞா njO ெஞௗ njau ட da ட் d டா dA

di டீ dI

du dU

ெட de ேட dE ைட dai ெடா do ேடா dO ெடௗ dau ண Na ண் N ணா NA ணி Ni ணீ NI

Nu NU

ெண Ne ேண NE ைண Nai ெணா No ேணா NO ெணௗ Nau த tha த் th

தா thA தி thi தீ thI

thu thU

ெத the ேத thE ைத thai ெதா tho ேதா thO ெதௗ thau ந wa ந் w நா wA நி wi நீ wI

wu wU

ெந we ேந wE ைந wai ெநா wo ேநா wO ெநௗ wau ப pa ப் p பா pA பி pi பீ pI

pu

pU ெப pe ேப pE ைப pai ெபா po ேபா pO ெபௗ pau ம ma ம் m மா mA மி mi மீ mI

mu mU

ெம me ேம mE ைம mai ெமா mo ேமா mO ெமௗ mau ய ya ய் y யா yA யி yi யீ yI

yu yU

ெய ye ேய yE ைய yai

254

ெயா yo ேயா yO ெயௗ yau ர ra ர் r ரா rA ாி ri ாீ rI

ru rU

ெர re ேர rE ைர rai ெரா ro ேரா rO ெரௗ rau ல la ல் l லா lA

li லீ lI

lu lU

ெல le ேல lE ைல lai ெலா lo ேலா lO ெலௗ lau வ va

வ் v வா vA வி vi

vI vu vU

ெவ ve ேவ vE ைவ vai ெவா vo ேவா vO ெவௗ vau ழ za ழ் z ழா zA ழி zi ழீ zI

zu zU

ெழ ze ேழ zE ைழ zai ெழா zo ேழா zO ெழௗ zau ள La ள் L ளா LA ளி Li ளீ LI

Lu LU

ெள Le ேள LE ைள Lai ெளா Lo ேளா LO ெளௗ Lau ற Ra ற் R றா RA றி Ri றீ RI

Ru RU

ெற Re ேற RE ைற Rai ெறா Ro ேறா RO ெறௗ Rau ன na ன் n னா nA னி ni னீ nI

nu nU

ென ne ேன nE

255

ைன nai ெனா no ேனா nO ெனௗ nau ஜ ja ஜ் j ஜா jA ஜி ji ஜீ jI ஜு ju ஜூ jU ெஜ je ேஜ jE ைஜ jai ெஜா jo ேஜா jO ெஜௗ jau ஸ Sa ஸ் S

sri ஸா SA

Si ஸீ SI ஸு Su ஸூ SU ெஸ Se ேஸ SE ைஸ Sai ெஸா So ேஸா SO

ெஸௗ Sau ஷ sha ஷ் sh ஷா shA ஷி shi ஷீ shI ஷு shu ஷூ shU ெஷ she ேஷ shE ைஷ shai ெஷா sho ேஷா shO ெஷௗ shau ஹ ha ஹ் h ஹா hA ஹி hi ஹீ hI ஹு hu ஹூ hU ெஹ he ேஹ hE ைஹ hai ெஹா ho ேஹா hO ெஹௗ hau

256

A.2 DETAILS OF AMIRTA POS TAGS

The major POS tags are noun, verb, adjective and adverb. The noun tag is further

classified into 10 tag categories; verb tag is classified into 7 tag categories; the rest are adjective,

adverb and others.

Noun Tags

Nouns are the words which denote a person, place, thing, time, etc. In Tamil language,

nouns are inflected for the number and case in the morphological level. However on

phonological level, four types of suffixes can occur with noun stem.

Noun (+ number) (+ case)

Example: pUk-kaL-ai <NN>

Flower-plural-accusative case suffix

   Noun ( + number ) (+ oblique) (+ euphonic) (+ case )

Example: pUk-kaL-in-Al <NN>

Flower-plural-euphonic suffix-accusative case suffix  

As mentioned earlier, distinct tags based on grammatical information are avoided. So

plurality and case suffixation can be obtained from a morph analyzer. This brings the number of

tags down, and helps to achieve simplicity, consistency and better machine learning. Therefore,

only two tags common noun <NN> and common compound noun <NNC> are used without

taken into consideration further based on the grammatical information contained in the noun

word.

Example for Common Nouns (NN)

paRavai <NN>

‘bird’

paRavai-kaL <NN>

‘bird-s’

paRavai-kku <NN>

‘to- bird’

paRavai-yAl <NN>

257

‘by- bird’

Example for Compound Nouns (NNC)

UrAdsi <NNC> thalaivar <NNC>

‘Township leader’

vanap <NNC> pakuthi <NNC>

‘forest area’

Proper Noun tag

Proper Nouns are the words which denote a particular person, place, or thing. Indian

languages, unlike English, do not have any specific marker for proper nouns in its orthographic

convention. English proper nouns begin with a capital letter which distinguishes them from

common nouns. Most of the words which occur as proper nouns in Indian languages can also

occur as common nouns. For example in English, John, Harry, Mary occur only as proper nouns

whereas in Tamil, thAmarai, maNi, pissai, arasi etc are used as proper nouns as well as common

nouns. Given below, is a list of Tamil words with their grammatical category and English

glosses. These words can be occurred in the text as common and proper nouns.

thAmarai noun lotus

maNi noun bell

pissai noun beg

arasi noun queen

Two tags have been used for proper noun,

• Proper noun <NNP>

• Compound proper noun <NNPC>

Example for Proper Nouns (NNP)

raja <NNP> wERRu vawthAn.

“Raja came yesterday”

Example for Compound Proper Nouns (NNPC)

apthul<NNPC> kalAm <NNPC> inRu cennai varukiRAr.

“Today, Abdul kalam is coming to Chennai”

258

Cardinal Tag

Any word denoting a cardinal number is tagged as <CRD>.

Example for Cardinals <CRD>

enakku 150 <CRD> rupAy vENdum.

“I need 150 ruppes”.

mUnRu <CRD > waparkaL angku amarwthirukkiRArkaL.

“Three people were sitting there”

Ordinal Tag

Ordinals are an extension of the natural numbers different from integers and from

cardinals. In Tamil, Ordinals are formed by adding the suffixes Am and Avathu. Expressions

denoting ordinals are marked as <ORD>.

Example for Ordinals <ORD>

muthalAm <ORD> vakuppu.

“first class”

12-Am <ORD> wURRANdu

“12th century”

Pronoun Tag Pronouns are the words that take the place of nouns. One uses a pronoun in place of a

noun to refer the same entity. Linguistically, a pronoun is a variable which is functionally a

noun; seperate tag for pronouns will be helpful for anaphora resolution.

Example for personal Pronouns (PRP)

avan <PRP> weRRu ingku vawthAn.

“He came here yesterday”

Adjective Tag

Adjectives are the noun modifiers. In modern Tamil, simple and derived adjectives are

present. The derived adjectives in Tamil are formed by adding the suffixes (Ana) to the noun

root. <ADJ> tag is used for representing adjectives.

259

Example for Adjectives <ADJ>

iwtha walla <ADJ> paiyan

“this nice boy”

oru azakAna <ADJ> peN

“A beautiful girl”

Adverb Tag Adverbs are words which tell more about the verbs. In modern Tamil, simple and derived

adverbs are present. The derived adverbs in Tamil are formed by adding the suffixes (Aka and

Ay) to the verb root. The temporal and spatial entities are also tagged as adverbs. <ADV> tag is

used for representing adverbs.

Example for Adverbs <ADV>

Avan adikkadi <ADV> vidumuRai eduththAn.

“He took leave frequently”

kuthirai vEkam-Aka <ADV> Odiyathu.

“The horse ran fast”’

VerbTags

Verbs are defined as the action word, which can take tense suffixes, person, number,

gender suffixes and few other verbal suffixes. Tamil verb forms can be distinguished into finite

and non finite verbs.

Finite verb tag

Finite verbs as the predicate of the main clause occur at the end of the sentence.

Example for Finite Verb <VF>

avan paSsil vawthAn <VF>

“he came by bus”

Non finite verb tag

Tamil distinguishes between four types of non-finite verb forms.They are verbal

participle <VNAV>, adjectival participle <VNAJ>, infinitive <VINT> and conditional <CVB>.

260

Example for verbal participle <VNAV>

      wowthu<VNAV> poo

“become vexed”

Example for adjectival participle <VNAJ>

vawtha <VNAJ> paiyan

“‘the boy who came”

Example for infinitive <VINT>

awtha maraththil idi viza <VINT>

“may thunder fall on the tree”

Example for conditional <CVB>

wI wEraththOdu vawthAl <CVB>

“If you would come in time”

Nominalized verb tag

Nominalized verbal forms are verbal nouns, participle nouns and adjectival nouns.

<VBG> tag is used for all the forms of nominalized verbs.

Example for Nominalized verb forms <VBG>

seythal <VBG> (doing)

seyAthu <VBG> (a neuter which is doing)

seythavan <VBG> (a man who did)

Anaw enna seyvathu <VBG>?

“What shall (we) do Anand?”

Auxiliary verb tag

Auxiliary verbs are the verbs which lose their original syntactic and semantic properties

when they collocate with the main verbs. They signify various grammatical meanings which are

auxiliary to the main verbs in a sentence. <VAX> tag is used for denoting auxiliary verb.

Example for auxiliary verb <VAX>

261

sItha angkE iruwthAL “Seetha was there” - Main Verb

sItha angkE vawthirukkiRAL “Seetha has come there” – Auxiliary verb

Other Tags

Postposition tag

Tamil has a few free forms which are referred as postpositions. They are added after the case marker.

Example

kovil kiri vIddukku pakkaththil <PPO> uLLathu

“The temple is near to Giri’s house”

In the above example, the post position pakkaththil 'near' occurs after the dative noun

phrase vIddukku. Here the form pakkaththil is not considered as a suffix, it is a free form and

because of its place of occurrence it is termed as postposition. Postpositions are historically

derived from verbs. Schiffman (1999) describes various postpositions. Postpositions are

conditioned by the nouns inflected for the case they follow. In Tamil, some postpositions are

simple and some are compound. <PPO> tag is used for representing postposition words.

Example for Postposition <PPO>

avan wAyaip pOl <PPO> kaththinAn.

“He cried like a dog”

Conjunction tag

Co-ordination or conjunction in Tamil is mainly realized by certain noun forms, verb

forms and clitics. <CNJ> tag is used for representing conjunctions.

Example for Conjunction <CNJ>

ciRiYA AnAl <CNJ > walla pen.

“a small but nice girl”

Determiner tag

A determiner is a noun-modifier that expresses the reference of a noun or noun-phrase in

a context, rather than attributes expressed by adjectives. This function is usually performed by

262

articles, demonstratives or possessive determiners. <DET> tag is used for annotating

determiners.

Example for determiners <DET>

awthath <DET>thittam.

“That plan”

Complimentizer

A complementizer is a syntactic category roughly equivalent to the term subordinating

conjunction in traditional grammar. For example, the word “that” is a complimentizer in the

following English sentence. “Mary believes that it is raining” . <COM> is used for tagging

complimentizer.

Example for complimentizer <COM>

avan vawthAn enRu<COM> kELvippattEn.

“I heard that he had come”

Emphasis tag

Force or intensity of expression that gives impressiveness or importance to the

word category is termed emphasis. <EMP > tag is used for annotating emphasis.

Example for Emphasis <EMP>

avan than<EMP> sonnAn.

“He only said”

Echo word tag

The tag < ECH> is used to denote echo words.

Example for Echo words (ECH)

kAppi kIppi <ECH>

“coffee keeffee”

Reduplication word tag

Reduplication words are the same word which is written twice for various purposes such

as indicating emphasis, deriving a category from another category. <RDW> tag is used for

263

tagging reduplication words.

Example for Reduplication words <RDW>

palapala <RDW> thiddam.

“many plans”

Question word and Question marker

Tags <QW> and <QM> are used for question word and question marker.

Example for question word and marker <QW> and <QM>

Avan vawthAnA <QW>? <QM>.

“Did he come?”

Symbol tags

Only two symbols dot <DOT> tag and comma <COMM> tag are considered in the

corpus. <DOT> tag is used to show the sentence separation. <COMM> tag is used in-between

the multiple nouns and proper noun.

Example for <DOT>

avan thAn sonnAn .<DOT>

“He only said”

Example for <COMMA>

rithaniyA, <COMM> tharunyAudan vawthaL.

“Rethanya came with Dharunya”

264

APPENDIX-B

B.1 PENN TREEBANK POS TAGS

S.No Tag Description 1 CC Coordinating conjunction 2 CD Cardinal number 3 DT Determiner 4 EX Existential there 5 FW Foreign word 6 IN Preposition or subordinating conjunction 7 JJ Adjective 8 JJR Adjective, comparative 9 JJS Adjective, superlative 10 LS List item marker 11 MD Modal 12 NN Noun, singular or mass 13 NNS Noun, plural 14 NNP Proper noun, singular 15 NNPS Proper noun, plural 16 PDT Predeterminer 17 POS Possessive ending 18 PRP Personal pronoun 19 PRP$ Possessive pronoun 20 RB Adverb 21 RBR Adverb, comparative 22 RBS Adverb, superlative 23 RP Particle 24 SYM Symbol 25 TO To 26 UH Interjection 27 VB Verb, base form 28 VBD Verb, past tense 29 VBG Verb, gerund or present participle 30 VBN Verb, past participle 31 VBP Verb, non-3rd person singular present 32 VBZ Verb, 3rd person singular present 33 WDT Wh-determiner 34 WP Wh-pronoun 35 WP$ Possessive wh-pronoun 36 WRB Wh-adverb

 

265

B.2 DEPENDENCY TAGS  

 

 

Dependency Label

Meaning Depende

ncy Label

Meaning

dep Dependent acomp adjectival complement aux Auxiliary agent Agent auxpass passive auxiliary ref Referent cop Copula expl expletive (expletive there) conj Conjunct mod Modifier cc Coordination advcl adverbial clause modifier arg Argument purpcl purpose clause modifier subj Subject tmod temporal modifier nsubj nominal subject rcmod relative clause modifier nsubjpass passive nominal subject amod adjectival modifier csubj clausal subject infmod infinitival modifier comp Complement partmod participial modifier obj Object num numeric modifier dobj direct object number element of compound number iobj indirect object appos appositional modifier pobj object of preposition nn noun compound modifier attr Attributive abbrev abbreviation modifier ccomp clausal complement+internal Sub advmod adverbial modifier xcomp clausal complement+external Sub neg negation modifier compl Complementizer poss possession modifier mark marker ( introducing an advcl) possessive possessive modifier (’s) rel relative (introducing a rcmod) prt phrasal verb particle acomp adjectival complement det Determiner agent Agent prep prepositional modifier xsubj controlling subject sdep semantic dependent

266

B.3 TAMIL VERB MLI FILE

Null PT+3SM PT+3SF PT+3SE PT+3SE+PL PT+3SN PT+NOM_athu PT+RP+3SN PT+3PN PT+RP+3PN PT+NOM_ana PT+2S PT+2EH PT+2EH+PL PT+1S PT+1P PRT+3SM PRT+3SF PRT+3SE PRT+3SE+PL PRT+3SN PRT+RP+3SN PRT+NOM_athu PRT+3PN PRT+RP+3PN PRT+NOM_ana PRT+2S PRT+2EH PRT+2EH+PL PRT+1S PRT+1P FT+3SM FT+3SF FT+3SE FT+3SE+PL FT+3SN FT+RP+3SN FT+NOM_athu FT+3PN FT+RP+3PN FT+NOM_ana FT+2S FT+2EH FT+2EH+PL FT+1S FT+1P FT_3SN RP_UM 

PT+RP PRT+RPNM+RP PT+RP+3SM PT+RP+3SF PT+RP+3SEPRT+RP+3SM PRT+RP+3SF PRT+RP+3SEPRT+3SN PRT+3SN PRT+NOM_athu FT+RP+3SMFT+RP+3SF FT+RP+3SE NM+RP+3SM NM+RP+3SFNM+RP+3SE NM+RP+NOM_athu PT+RP+3PN_vai NM+NOM_anaVP INF NM+3SNNM+VPNM+VP_aamal NOM_thal NOM_alNOM_kai NM+NOM_mai NOM_kkal+MOOD_aam NOM_kkal+MOOD_aakum NOM_kkal+NM+3SN VP+PAAR_AUX+PT+3SM VP+PAAR_AUX+PT+3SF VP+PAAR_AUX+PT+3SE VP+PAAR_AUX+PT+2S VP+PAAR_AUX+PT+1P VP+PAAR_AUX+PT+1SVP+PAAR_AUX+PRT+3SE VP+PAAR_AUX+PRT+3SE+PL VP+PAAR_AUX+PRT+3SF VP+PAAR_AUX+PRT+3SM VP+PAAR_AUX+PRT+1P VP+PAAR_AUX+PRT+2S VP+PAAR_AUX+PRT+1S VP+PAAR_AUX+FT+3SE VP+PAAR_AUX+FT+3SF 

267

VP+PAAR_AUX+FT+3SM VP+PAAR_AUX+FT+2S VP+PAAR_AUX+FT+1S VP+PAAR_AUX+FT+1P VP+IRU_AUX+PT+3SE VP+IRU_AUX+PT+3SF VP+IRU_AUX+PT+3SM VP+IRU_AUX+PT+2S VP+IRU_AUX+PT+1S VP+IRU_AUX+PT+1P VP+IRU_AUX+PRT+3SE VP+IRU_AUX+PRT+3SF VP+IRU_AUX+PRT+3SM VP+IRU_AUX+PRT+1S VP+IRU_AUX+PRT+1P VP+IRU_AUX+FT+3SE VP+IRU_AUX+FT+3SF VP+IRU_AUX+FT+3SM VP+IRU_AUX+FT+2S VP+IRU_AUX+FT+1S VP+IRU_AUX+FT+1P VP+KODU_AUX+PT+3SM VP+KODU_AUX+PT+3SF VP+KODU_AUX+PT+3SE VP+KODU_AUX+PT+3SE VP+KODU_AUX+PT+3SN VP+KODU_AUX+PT+3PN VP+KODU_AUX+PT+2S VP+KODU_AUX+PT+2SE VP+KODU_AUX+PT+2SE+PL VP+KODU_AUX+PT+1S VP+KODU_AUX+PT+1P VP+KODU_AUX+PRT+3SM VP+KODU_AUX+PRT+3SF VP+KODU_AUX+PRT+3SE VP+KODU_AUX+PRT+3SE+PL VP+KODU_AUX+PRT+3SN VP+KODU_AUX+PRT+3PN VP+KODU_AUX+PRT+2S VP+KODU_AUX+PRT+2EH VP+KODU_AUX+PRT+2EH+PL VP+KODU_AUX+PRT+1S VP+KODU_AUX+PRT+1P VP+KODU_AUX+FT+3SM VP+KODU_AUX+FT+3SF VP+KODU_AUX+FT+3SE VP+KODU_AUX+FT+3SE+PL VP+KODU_AUX+FT+3SN VP+KODU_AUX+FT+3PN VP+KODU_AUX+FT+2S 

VP+KODU_AUX+FT+2EH VP+KODU_AUX+FT+2EH+PL VP+KODU_AUX+FT+1S VP+KODU_AUX+FT+1P VP+POO_AUX+PT+3SM VP+POO_AUX+PT+3SF VP+POO_AUX+PT+3SE VP+POO_AUX+PT+3SE+PL VP+POO_AUX+PT+3SNVP+POO_AUX+PT+3PN VP+POO_AUX+PT+2S VP+POO_AUX+PT+2EH VP+POO_AUX+PT+2EH+PL VP+POO_AUX+PT+1S VP+POO_AUX+PT+1P VP+POO_AUX+PRT+3SM VP+POO_AUX+PRT+3SF VP+POO_AUX+PRT+3SE VP+POO_AUX+PRT+3SE+PL VP+POO_AUX+PRT+3SN VP+POO_AUX+PRT+3PN VP+POO_AUX+PRT+2S VP+POO_AUX+PRT+2EH VP+POO_AUX+PRT+2EH+PL VP+POO_AUX+PRT+1S VP+POO_AUX+PRT+1P VP+POO_AUX+FT+3SM VP+POO_AUX+FT+3SFVP+POO_AUX+FT+3SE VP+POO_AUX+FT+3SE+PL VP+POO_AUX+FT+3SNVP+POO_AUX+FT+3PNVP+POO_AUX+FT+2S VP+POO_AUX+FT+2EH VP+POO_AUX+FT+2EH+PL VP+POO_AUX+FT+1S VP+POO_AUX+FT+1P VP+VIDU_AUX+PT+3SE VP+VIDU_AUX+PT+3SFVP+VIDU_AUX+PT+3SM VP+VIDU_AUX+PT+2S VP+VIDU_AUX+PT+1P VP+VIDU_AUX+PT+1SVP+VIDU_AUX+PRT+3SE VP+VIDU_AUX+PRT+3SM VP+VIDU_AUX+PRT+3SF VP+VIDU_AUX+PRT+2S VP+VIDU_AUX+PRT+1P VP+VIDU_AUX+PRT+1S VP+VIDU_AUX+FT+3SE

268

VP+VIDU_AUX+FT+3SF VP+VIDU_AUX+FT+3SM VP+VIDU_AUX+FT+2S VP+VIDU_AUX+FT+1S VP+VIDU_AUX+FT+1P VP+KI_AUX+PT+3SE VP+KI_AUX+PT+3SM VP+KI_AUX+PT+3SF VP+KI_AUX+PT+2S VP+KI_AUX+PT+1P VP+KI_AUX+PT+1S VP+KI_AUX+PRT+3SE VP+KI_AUX+PRT+3SF VP+KI_AUX+PRT+3SM VP+KI_AUX+PRT+2S VP+KI_AUX+PRT+1P VP+KI_AUX+PRT+1S VP+KI_AUX+FT+3SE VP+KI_AUX+FT+3SM VP+KI_AUX+FT+3SF VP+KI_AUX+FT+2S VP+KI_AUX+FT+1P VP+KI_AUX+FT+1S VP+AUX_aayiRRu VP+FT+POODU_AUX+PT+3SE VP+FT+POODU_AUX+PT+3SM VP+FT+POODU_AUX+PT+3SF VP+FT+POODU_AUX+PT+2S VP+FT+POODU_AUX+PT+1S VP+FT+POODU_AUX+PT+1P VP+FT+POODU_AUX+PRT+3SE VP+FT+POODU_AUX+PRT+3SMVP+FT+POODU_AUX+PRT+3SF VP+FT+POODU_AUX+PRT+2S VP+FT+POODU_AUX+PRT+1S VP+FT+POODU_AUX+PRT+1P VP+FT+POODU_AUX+FT+3SE VP+FT+POODU_AUX+FT+3SM VP+FT+POODU_AUX+FT+3SF VP+FT+POODU_AUX+FT+2S VP+FT+POODU_AUX+FT+1P VP+FT+POODU_AUX+FT+1S VP+THOLAI_AUX+PT+3SE VP+THOLAI_AUX+PT+3SM VP+THOLAI_AUX+PT+3SF VP+THOLAI_AUX+PT+2S VP+THOLAI_AUX+PT+1P VP+THOLAI_AUX+PT+3SM VP+THOLAI_AUX+PRT+3SE VP+THOLAI_AUX+PRT+3SF 

VP+THOLAI_AUX+PRT+3SM VP+THOLAI_AUX+PRT+2S VP+THOLAI_AUX+PRT+1P VP+THOLAI_AUX+PRT+1S VP+THOLAI_AUX+FT+3SE VP+THOLAI_AUX+FT+3SM VP+THOLAI_AUX+FT+3SF VP+THOLAI_AUX+FT+2S VP+THOLAI_AUX+FT+1S VP+THOLAI_AUX+FT+1P VP+THALLU_AUX+PT+3SE VP+THALLU_AUX+PT+3SF VP+THALLU_AUX+PT+3SM VP+THALLU_AUX+PT+2S VP+THALLU_AUX+PT+1P VP+THALLU_AUX+PT+1S VP+THALLU_AUX+FT+3SE VP+THALLU_AUX+FT+3SM VP+THALLU_AUX+FT+3SF VP+THALLU_AUX+FT+2S VP+THALLU_AUX+FT+1S VP+THALLU_AUX+FT+1P VP+KIZI_AUX+PT+3SE VP+KIZI_AUX+PT+3SMVP+KIZI_AUX+PT+3SF VP+KIZI_AUX+PT+2S VP+KIZI_AUX+PT+1S VP+KIZI_AUX+PT+1PVP+KIZI_AUX+FT+3SE VP+KIZI_AUX+FT+3SM VP+KIZI_AUX+PRT+3SFVP+KIZI_AUX+FT+2SVP+KIZI_AUX+FT+1S VP+KIZI_AUX+FT+1P VP+KIZI_AUX+PRT+3SEVP+KIZI_AUX+PRT+3SM VP+KIZI_AUX+PRT+3SF VP+KIZI_AUX+PRT+2S VP+KIZI_AUX+PRT+1SVP+KIZI_AUX+PRT+1P VP+KIZI_AUX+FT+3SE VP+KIZI_AUX+FT+3SM VP+KIZI_AUX+FT+3SFVP+KIZI_AUX+FT+2S VP+KIZI_AUX+FT+1S VP+KIZI_AUX+FT+1PVP+KIDA_AUX+PT+3SEVP+KIDA_AUX+PT+3SM VP+KIDA_AUX+PT+3SF VP+KIDA_AUX+PT+2S

269

VP+KIDA_AUX+PT+1S VP+KIDA_AUX+PT+1P VP+KIDA_AUX+PRT+3SE VP+KIDA_AUX+PRT+3SM VP+KIDA_AUX+PRT+3SF VP+KIDA_AUX+PRT+2S VP+KIDA_AUX+PRT+1S VP+KIDA_AUX+PRT+1P VP+KIDA_AUX+FT+3SE VP+KIDA_AUX+FT+3SM VP+KIDA_AUX+FT+3SF VP+KIDA_AUX+FT+2S VP+KIDA_AUX+FT+1S VP+KIDA_AUX+FT+1P VP+THEER_AUX+PT+3SE VP+THEER_AUX+PT+3SM VP+THEER_AUX+PT+3SF VP+THEER_AUX+PT+2S VP+THEER_AUX+PT+1P VP+THEER_AUX+PT+1S VP+THEER_AUX+PRT+3SE VP+THEER_AUX+PRT+3SM VP+THEER_AUX+PRT+3SF VP+THEER_AUX+PRT+2S VP+THEER_AUX+PRT+1P VP+THEER_AUX+PRT+1S VP+THEER_AUX+FT+3SE VP+THEER_AUX+FT+3SM VP+THEER_AUX+FT+3SF VP+THEER_AUX+FT+2S VP+THEER_AUX+FT+1P VP+THEER_AUX+FT+1S VP+MUDI_AUX+PT+3SE VP+MUDI_AUX+PT+3SM VP+MUDI_AUX+PT+3SF VP+MUDI_AUX+PT+2S VP+MUDI_AUX+PT+1P VP+MUDI_AUX+PT+1S VP+MUDI_AUX+PRT+3SE VP+MUDI_AUX+PRT+3SM VP+MUDI_AUX+PRT+3SF VP+MUDI_AUX+PRT+2S VP+MUDI_AUX+PRT+1P VP+MUDI_AUX+PRT+1S VP+MUDI_AUX+FT+3SE VP+MUDI_AUX+FT+3SM VP+MUDI_AUX+FT+3SF VP+MUDI_AUX+FT+2S VP+MUDI_AUX+FT+1S VP+MUDI_AUX+FT+1P 

INF+AUX_attumINF+MOD_vendum INF+MOD_vendam INF+MOD_koodum INF+MOD_koodathuINF+MAATTU_AUX+3SM INF+MAATTU_AUX+3SF INF+MAATTU_AUX+3SE INF+MAATTU_AUX+1SINF+MAATTU_AUX+2S INF+MAATTU_AUX+1P INF+MOD_illai INF+IYAL_AUX+RP_UM INF+IYAL_AUX+FT_3SN INF+IYAL_AUX+PT+3SN INF+IYAL_AUX+PRT+3SN INF+MUDI_AUX+PT+3SN INF+MUDI_AUX+PRT+3SN INF+MUDI_AUX+FT_3SN INF+MUDI_AUX+RP_UM INF+IRU_AUX+PT+3SM INF+IRU_AUX+PT+3SF INF+IRU_AUX+PT+3SE INF+POO_AUX+PT+3SM INF+POO_AUX+PT+3SF INF+POO_AUX+PT+3SE INF+VAA_AUX+PT+3SM INF+VAA_AUX+PT+3SFINF+VAA_AUX+PT+3SE INF+PAAR_AUX+PT+3SM INF+PAAR_AUX+PT+3SF INF+PAAR_AUX+PT+3SE INF+VAI_AUX+PT+3SE INF+VAI_AUX+PT+3SM INF+VAI_AUX+PT+3SFINF+PANNU_AUX+PT+3SM INF+PANNU_AUX+PT+3SF INF+PANNU_AUX+PT+3SE INF+SEY_AUX+PT+3SM INF+SEY_AUX+PT+3SF INF+SEY_AUX+PT+3SE INF+PERU_AUX+PT+3SM INF+PERU_AUX+PT+3SF INF+PERU_AUX+PT+3SE INF+PADU_AUX+PT+3SN INF+PADU_AUX+PT+3SM INF+PADU_AUX+PT+3SF INF+PADU_AUX+PT+3SE INF+PADU_AUX+PRT+3SN INF+PADU_AUX+PRT+3SM 

270

INF+PADU_AUX+PRT+3SF INF+PADU_AUX+PRT+3SE INF+PADU_AUX+FT_3SN INF+PADU_AUX+RP_UM INF+VVA_AUX+PT+3SN INF+VVA_AUX+PRT+3SN INF+VVA_AUX+FT_3SN INF+VVA_AUX+RP_UM INF+VI_AUX+PT+3SN INF+VI_AUX+PT+3SN INF+VI_AUX+PRT+3SN INF+VI_AUX+PRT+3SN INF+VI_AUX+FT_3SN INF+VI_AUX+RP_UM VP+KAADDU_AUX+PT+3SM VP+KAADDU_AUX+PT+3SF VP+KAADDU_AUX+PT+3SE VP+KAADDU_AUX+PT+2S VP+KAADDU_AUX+PT+1S VP+KAADDU_AUX+PT+1P VP+KAADDU_AUX+PRT+3SM VP+KAADDU_AUX+PRT+3SF VP+KAADDU_AUX+PRT+3SE VP+KAADDU_AUX+PRT+2S VP+KAADDU_AUX+PRT+1P VP+KAADDU_AUX+FT+3SE VP+KAADDU_AUX+FT+3SM VP+KAADDU_AUX+FT+3SF VP+KAADDU_AUX+FT+2S VP+KAADDU_AUX+FT+1P VP+VAI_AUX+PT+3SE VP+VAI_AUX+PT+3SM VP+VAI_AUX+PT+3SF VP+VAI_AUX+PT+2S VP+VAI_AUX+PT+1P VP+VAI_AUX+PT+1S VP+VAI_AUX+PRT+3SE VP+VAI_AUX+PRT+2S VP+VAI_AUX+PRT+3SM VP+VAI_AUX+PRT+3SF VP+VAI_AUX+PRT+1P VP+VAI_AUX+FT+3SE VP+VAI_AUX+FT+3SM VP+VAI_AUX+FT+3SF VP+VAI_AUX+FT+2S VP+VAI_AUX+FT+1P VP+KAADDU_AUX+INF+MOD_vendVP+VAI_AUX+INF+MOD_vendum VP+THOLAI_AUX+INF+MOD_vendu VP+KIZI_AUX+INF+MOD_vendum

VP+PAAR_AUX+INF+MOD_vendum VP+IRU_AUX+INF+MOD_vendum VP+KODU_AUX+INF+MOD_vendu VP+POO_AUX+INF+MOD_vendum VP+VIDU_AUX+INF+MOD_vendum VP+KI_AUX+INF+MOD_vendum VP+POODU_AUX+INF+MOD_vendu VP+THALLU_AUX+INF+MOD_vendum VP+KIDA_AUX+INF+MOD_vendum VP+THEER_AUX+INF+MOD_vendum VP+MUDI_AUX+INF+MOD_vendum VP+PAAR_AUX+INF+MOD_vendum VP+SEY_AUX+INF+MOD_vendum VP+KAADDU_AUX+INF+MOD_venda VP+VAI_AUX+INF+MOD_vendam VP+THOLAI_AUX+INF+MOD_venda VP+KIZI_AUX+INF+MOD_vendam VP+PAAR_AUX+INF+MOD_vendam VP+IRU_AUX+INF+MOD_vendam VP+KODU_AUX+INF+MOD_vendam VP+POO_AUX+INF+MOD_vendam VP+VIDU_AUX+INF+MOD_vendam VP+KI_AUX+INF+MOD_vendam VP+POODU_AUX+INF+MOD_vendam VP+THALLU_AUX+INF+MOD_vendam VP+KIDA_AUX+INF+MOD_vendam VP+THEER_AUX+INF+MOD_vendam VP+MUDI_AUX+INF+MOD_venda VP+PAAR_AUX+INF+MOD_vendam VP+SEY_AUX+INF+MOD_vendam VP+PAAR_AUX+INF+MOD_illai VP+IRU_AUX+INF+MOD_illai VP+KODU_AUX+INF+MOD_illai VP+POO_AUX+INF+MOD_illai VP+VIDU_AUX+INF+MOD_illai VP+KI_AUX+INF+MOD_illai VP+POODU_AUX+INF+MOD_illai VP+THOLAI_AUX+INF+MOD_illai VP+THALLU_AUX+INF+MOD_illai VP+KIZI_AUX+INF+MOD_illai VP+KIDA_AUX+INF+MOD_illai VP+THEER_AUX+INF+MOD_illai VP+MUDI_AUX+INF+MOD_illai VP+VAA_AUX+INF+MOD_illai VP+VAI_AUX+INF+MOD_illai VP+KAADDU_AUX+INF+MOD_illai VP+KODU_AUX+INF+MOD_illai INF+VAA_AUX+INF+MOD_illai INF+VAI_AUX+INF+MOD_illai INF+SEY_AUX+INF+MOD_illai 

271

INF+PANNU_AUX+INF+MOD_illaiINF+PERU_AUX+INF+MOD_illai INF+PADU_AUX+INF+MOD_illai INF+VENDU_AUX+VP+NOM_athu+

INF+VENDU_AUX+VP+3SN+MOD_illai FT+NOM_athu+MOD_illai FT+3SN+MOD_illai FT+NOM_athu+CM_dat+MOD_illai INF+UL_AUX+RP+3SM INF+UL_AUX+RP+3SF INF+UL_AUX+RP+3PE INF+UL_AUX+RP+3SN Ungal INF+CL_um INF+PADU_AUX+VP+IRU_AUX+PT+3S INF+PADU_AUX+VP+IRU_AUX+PT+3

INF+PADU_AUX+VP+IRU_AUX+PT+3

INF+PADU_AUX+VP+IRU_AUX+PT+2

INF+PADU_AUX+VP+IRU_AUX+PT+1s INF+PADU_AUX+VP+IRU_AUX+PT+1SINF+PADU_AUX+VP+IRU_AUX+PRT+3SE INF+PADU_AUX+VP+IRU_AUX+P3SE+PL INF+PADU_AUX+VP+IRU_AUX+PRT+3SF INF+PADU_AUX+VP+IRU_AUX+PRT+3S

INF+PADU_AUX+VP+IRU_AUX+PRT+2SINF+PADU_AUX+VP+IRU_AUX+PRT+1P INF+PADU_AUX+VP+IRU_AUX+PRT+1S INF+PADU_AUX+VP+IRU_AUX+PRT+3S

INF+PADU_AUX+VP+IRU_AUX+FT+3SEINF+PADU_AUX+VP+IRU_AUX+FT+3SMINF+PADU_AUX+VP+IRU_AUX+FT+3SF INF+PADU_AUX+VP+IRU_AUX+FT+2S INF+PADU_AUX+VP+IRU_AUX+FT+1PINF+PADU_AUX+VP+IRU_AUX+FT+1S INF+PADU_AUX+VP+IRU_AUX+PT+3SN INF+PADU_AUX+VP+IRU_AUX+FT_3SN INF+PADU_AUX+VP+IRU_AUX+RP_UMINF+PADU_AUX+VP+IRU_AUX+INF+MOD INF+PADU_AUX+VP+IRU_AUX+INF+MOD INF+PADU_AUX+VP+UL_AUX+RP+3PE INF+PADU_AUX+VP+VIDU_AUX+FT_3SN

INF+PADU_AUX+VP+VIDU_AUX+RP_UMINF+PADU_AUX+VP+VIDU_AUX+PT+3SN VP+KII_AUX+PRT+1S VP+KII_AUX+PT+1S VP+KII_AUX+FT+1SVP+KII_AUX+PRT+1P VP+KII_AUX+PT+1P VP+KII_AUX+FT+1P VP+KII_AUX+PRT+2SVP+KII_AUX+PT+2S VP+KII_AUX+FT+1S VP+KII_AUX+PRT+3SM VP+KII_AUX+PT+3SMVP+KII_AUX+FT+3SM VP+KII_AUX+PRT+3SF VP+KII_AUX+PT+3SFVP+KII_AUX+FT+3SF VP+KII_AUX+PRT+3SN VP+KII_AUX+PT+3SN VP+KII_AUX+FT+3SNVP+KII_AUX+PRT+3PE VP+KII_AUX+PT+3PE VP+KII_AUX+FT+3PE VP+IRU_AUX+PRT+1PVP+IRU_AUX+PRT+2S VP+IRU_AUX+PT+2S VP+IRU_AUX+PRT+3SN VP+IRU_AUX+PT+3SNVP+IRU_AUX+FT+3SN VP+KI_AUX+PRT+3SN VP+KI_AUX+PT+3SNVP+KI_AUX+FT+3SNVP+IRU_AUX+PRT+3PE VP+IRU_AUX+PT+3PE VP+IRU_AUX+FT+3PEVP+KI_AUX+PRT+3PE VP+KI_AUX+PT+3PE VP+KI_AUX+FT+3PE VP+IRU_AUX+FT_3SNVP+IRU_AUX+RP_UM VP+KI_AUX+FT_3SN VP+KI_AUX+RP_UM VP+KII_AUX+FT_3SNVP+KII_AUX+RP_UM 

 

 

272

B.4 TAMIL NOUN WORD FORMS

நரம்ைப நரம்பிைன நரம்பினத்ைத நரம்ேபா நரம்பிேனா நரம்பினத்ேதா நரம்பினால் நரம்பால் நரம் க்கு நரம்பிற்கு நரம்பின் நரம்ப நரம்பின நரம்பின்கண் நரம்ப கண் நரம் க்காக நரம்பாலான நரம் ைடய நரம்பி ைடய நரம்பில் நரம்பினில் நரம் டன் நரம்பி டன் நரம் வைரக்கும் நரம் வைரயில் நரம்பின்வைர நரம்பில்லாமல் நரம்ேபா ல்லாமல் நரம் க்கில்லாமல் நரம் டனில்லாமல் நரம்பாட்டம் நரம் க்காட்டம் நரம் தல் நரம் வழியாக நரம்பின்வழியாக நரம்பின வழியாக நரம்பிடம்

நரம்பின் லம் நரம்பின லம் நரம்பதன் லம் நரம் ப்பக்கம் நரம்பின்பக்கம் நரம்பதின்பக்கம் நரம்பண்ைட நரம்பினண்ைட நரம் க்கண்ைட நரம்பின ேக நரம் க்க ேக நரம்பதன ேக நரம்ப கில் நரம்பின கில் நரம்பதன கில் நரம் க்க கில் நரம் கிட்ட நரம்பின்கிட்ட நரம் ேமல் நரம்பின்ேமல் நரம் க்குேமல் நரம்பின ேமல் நரம் ேமேல நரம்பின்ேமேல நரம் க்குேமேல நரம்ப ேமேல நரம்பின ேமேல நரம்பின்கீழ் நரம் க்குங்கீழ் நரம்பதின்கீழ் நரம்பின்கீேழ நரம் க்குங்கீேழ நரம்பதின்கீேழ நரம்ைபப்பற்றி நரம்பிைனப்பற்றி நரம்பினத்ைதப்பற்றி நரம்ைபக்குறித்

273

நரம்பிைனக்குறித் நரம்பினத்ைதக்குறித் நரம்ைபப்பார்த் நரம்பிைனப்பார்த் நரம்பினத்ைதப்பார்த் நரம்ைபேநாக்கி நரம்பினத்ைதேநாக்கி நரம்பிைனேநாக்கி நரம்ைபச்சுற்றி நரம்பினத்ைதச்சுற்றி நரம்பிைனச்சுற்றி நரம்ைபத்தாண் நரம்பிைனத்தாண் நரம்பினத்ைதத்தாண் நரம்ைபத்தவிர்த் நரம்பிைனத்தவிர்த் நரம்பினத்ைதத்தவிர்த் நரம்ைபத்தவிர நரம்பிைனத்தவிர நரம்பினத்ைதத்தவிர நரம்ெபாழிய நரம்ைபெயாழிய நரம்பினத்ைதெயாழிய நரம்ைபெயாட் நரம்பிைனெயாட் நரம்பினத்ைதெயாட் நரம்ைபக்ெகாண் நரம்பிைனக்ெகாண் நரம்பினத்ைதக்ெகாண் நரம்ைபைவத் நரம்பினத்ைதைவத் நரம்பிைனைவத் நரம்ைபவிட் நரம்பிைனவிட் நரம்பினத்ைதவிட் நரம்ைபப்ேபால நரம்பிைனப்ேபால நரம்பினத்ைதப்ேபால நரம்ைபப்ேபால்

நரம்பிைனப்ேபால் நரம்பினத்ைதப்ேபால் நரம் மாதிாி நரம்ைபமாதிாி நரம்ைபவிட நரம்பிைனவிட நரம்பினத்ைதவிட நரம் க்குப்பதிலாக நரம் க்காக நரம்பி க்காக நரம் க்குப்பிறகு நரம் க்கப் றம் நரம் க்கப்பால் நரம் க்குேமல் நரம் க்குேமேல நரம் க்குங்கீழ் நரம் க்குங்கீேழ நரம் க்குள் நரம் க்குள்ேள நரம் க்குெவளியில் நரம் க்குெவளிேய நரம் க்க யில் நரம் க்க கில் நரம் ன் நரம் க்கு ன் நரம் ன்னால் நரம் க்கு ன்னால் நரம் பின்னால் நரம் க்குப்பின்னால் நரம் க்குப்பின் நரம் க்குப்பிந்தி நரம் க்குகு க்ேக நரம் க்குள் நரம்பி ள் நரம் க்குள்ேள நரம்பி க்குள்ேள நரம்ெபதிேர நரம் க்ெகதிேர நரம்ெபதிர்க்கு

274

நரம்ெபதிாில் நரம் க்ெகதிாில் நரம் க்ெகதிர்த்தாற்ேபால் நரம் க்கிைடயில் நரம் க்குந வில் நரம் க்க த்தாற்ேபால் நரம்பி ந் நரம் டன் நரம்பிடமி ந் நரம் லமி ந் நரம் ப்பக்கமி ந் நரம்பண்ைடயி ந் நரம்ப ேகயி ந் நரம் க்க ேகயி ந் நரம்ப கி ந் நரம் க்க கி ந் நரம் கிட்டயி ந் நரம் ேம ந் நரம் க்குேம ந் நரம் ேமேலயி ந் நரம் க்குேமேலயி ந் நரம் க்குங்கீழி ந் நரம்பின்கீழி ந் நரம்பதின்கீழி ந் நரம்பின்கீேழயி ந் நரம்பதன்கீேழயி ந் நரம் கள் நரம் கைள நரம் களிைன நரம் களின் நரம் க க்காக நரம் க க்கான நரம் க க்கு நரம் களில் நரம் க டன் நரம் கேளா நரம் கள நரம் களால் நரம் க டன்

நரம் கள்வைரக்கும் நரம் கள்வைரயில் நரம் களில்லாமல் நரம் களல்லாமல் நரம் களாட்டம் நரம் கள் தல் நரம் களின்ப நரம் களின்வழியாக நரம் களிடம் நரம் களின் லம் நரம் களின்பக்கம் நரம் களினண்ைட நரம் கள ேக நரம் களின ேக நரம் களின கில் நரம் கள்கிட்ட நரம் களின்ேமல் நரம் களின்ேமேல நரம் களின்கீழ் நரம் களின்கீேழ நரம் கைளப்பற்றி நரம் கைளக்குறித் நரம் கைளப்பார்த் நரம் கைளேநாக்கி நரம் கைளச்சுற்றி நரம் கைளத்தாண் நரம் கைளத்தவிர்த் நரம் கைளத்தவிர நரம் கைளெயாழிய நரம் கைளெயாட் நரம் கைளக்ெகாண் நரம் கைளைவத் நரம் கைளவிட் நரம் கைளப்ேபால் நரம் கைளப்ேபால நரம் கைளமாதிாி நரம் கைளவிட நரம் க க்குப்பதிலாக நரம் க க்காக

275

B.5 TAMIL VERB WORD FORMS ப ப த்தான் ப த்தாள் ப த்தார் ப த்தார்கள் ப த்த ப த்தன ப த்தாய் ப த்தீர் ப த்தீர்கள் ப த்ேதன் ப த்ேதாம் ப க்கிறான் ப க்கிறாள் ப க்கிறார் ப க்கிறார்கள் ப க்கின்ற ப க்கின்றன ப க்கின்றாய் ப க்கின்றீர் ப க்கின்றீர்கள் ப க்கின்ேறன் ப க்கின்ேறாம் ப ப்பான் ப ப்பாள் ப ப்பார் ப ப்பார்கள் ப ப்ப ப ப்பன ப ப்பாய் ப ப்பீர் ப ப்பீர்கள் ப ப்ேபன் ப ப்ேபாம் ப க்கும் ப த்த

ப க்கின்ற ப க்காத ப த்தவன் ப த்தவள் ப த்தவர் ப த்த ப க்கின்றவன் ப க்கின்றவள் ப க்கின்றவர் ப க்கின்ற ப ப்பவன் ப ப்பவள் ப ப்பவர் ப ப்ப ப க்காதவன் ப க்காதவள் ப க்காதவர் ப க்காத ப த்தைவ ப க்காதன ப த் ப க்க ப க்கா ப க்காமல் ப த்தல் ப க்காைம ப க்கலாம் ப க்கலாகும் ப க்கலாகா ப த் ப்பார்த்தான் ப த் ப்பார்த்தாள் ப த் ப்பார்த்தார் ப த் ப்பார்த்தாய் ப த் ப்பார்த்ேதாம் ப த் ப்பார்த்ேதன் ப த் ப்பார்க்கின்றார்

276

ப த் ப்பார்க்கின்றார்கள் ப த் ப்பார்க்கின்றாள் ப த் ப்பார்க்கின்றான் ப த் ப்பார்க்கின்ேறாம் ப த் ப்பார்க்கின்றாய் ப த் ப்பார்க்கின்ேறன் ப த் ப்பார்ப்பார் ப த் ப்பார்ப்பாள் ப த் ப்பார்ப்பான் ப த் ப்பார்ப்பாய் ப த் ப்பார்ப்ேபன் ப த் ப்பார்ப்ேபாம் ப த்தி ந்தார் ப த்தி ந்தாள் ப த்தி ந்தான் ப த்தி ந்தா ப த்தி ந்ேதன் ப த்தி ந்ேதாம் ப த்தி க்கின்றார் ப த்தி க்கின்றாள் ப த்தி க்கின்றான் ப த்தி க்கின்ேறன் ப த்தி க்கின்ேறாம் ப த்தி ப்பார் ப த்தி ப்பாள் ப த்தி ப்பான் ப த்தி ப்பாய் ப த்தி ப்ேபன் ப த்தி ப்ேபாம் ப த் க்ெகா த்தான் ப த் க்ெகா த்தாள் ப த் க்ெகா த்தார் ப த் க்ெகா த்தார் ப த் க்ெகா த்த ப த் க்ெகா த்தன ப த் க்ெகா த்தாய் ப த் க்ெகா த்தீர் ப த் க்ெகா த்தீர்கள் ப த் க்ெகா த்ேதன்

ப த் க்ெகா த்ேதாம் ப த் க்ெகா க்கிறான் ப த் க்ெகா க்கிறாள் ப த் க்ெகா க்கிறார் ப த் க்ெகா க்கிறார்கள் ப த் க்ெகா க்கின்ற ப த் க்ெகா க்கின்றன ப த் க்ெகா க்கின்றாய் ப த் க்ெகா க்கின்றீர் ப த் க்ெகா க்கின்றீர்கள் ப த் க்ெகா க்கின்ேறன் ப த் க்ெகா க்கின்ேறாம் ப த் க்ெகா ப்பான் ப த் க்ெகா ப்பாள் ப த் க்ெகா ப்பார் ப த் க்ெகா ப்பார்கள் ப த் க்ெகா ப்ப ப த் க்ெகா ப்பன ப த் க்ெகா ப்பாய் ப த் க்ெகா ப்பீர் ப த் க்ெகா ப்பீர்கள் ப த் க்ெகா ப்ேபன் ப த் க்ெகா ப்ேபாம் ப த் ப்ேபானான் ப த் ப்ேபானாள் ப த் ப்ேபானார் ப த் ப்ேபானார்கள் ப த் ப்ேபான ப த் ப்ேபாயின ப த் ப்ேபானாய் ப த் ப்ேபானீர் ப த் ப்ேபானீர்கள் ப த் ப்ேபாேனன் ப த் ப்ேபாேனாம் ப த் ப்ேபாகிறான் ப த் ப்ேபாகிறாள் ப த் ப்ேபாகிறார் ப த் ப்ேபாகிறார்கள் ப த் ப்ேபாகின்ற

277

ப த் ப்ேபாகின்றன ப த் ப்ேபாகின்றாய் ப த் ப்ேபாகின்றீர் ப த் ப்ேபாகின்றீர்கள் ப த் ப்ேபாகின்ேறன் ப த் ப்ேபாகின்ேறாம் ப த் ப்ேபாவான் ப த் ப்ேபாவாள் ப த் ப்ேபாவார் ப த் ப்ேபாவார்கள் ப த் ப்ேபாவ ப த் ப்ேபாவன ப த் ப்ேபாவாய் ப த் ப்ேபா ர் ப த் ப்ேபா ர்கள் ப த் ப்ேபாேவன் ப த் ப்ேபாேவாம் ப த் விட்டார் ப த் விட்டாள் ப த் விட்டான் ப த் விட்டாய் ப த் விட்ேடாம் ப த் விட்ேடன் ப த் வி கின்றார் ப த் வி கின்றான் ப த் வி கின்றாள் ப த் வி கின்றாய் ப த் வி கின்ேறாம் ப த் வி கிேறன் ப த் வி வார் ப த் வி வாள் ப த் வி வான் ப த் வி வாய் ப த் வி ேவன் ப த் வி ேவாம் ப த் க்ெகாண் ந்தார் ப த் க்ெகாண் ந்தான் ப த் க்ெகாண் ந்தாள் ப த் க்ெகாண் ந்தாய்

ப த் க்ெகாண் ந்ேதாம் ப த் க்ெகாண் ந்ேதன் ப த் க்ெகாண் க்கிறார் ப த் க்ெகாண் க்கிறாள் ப த் க்ெகாண் க்கிறான் ப த் க்ெகாண் க்கிறாய் ப த் க்ெகாண் க்கிேறாம் ப த் க்ெகாண் க்கிேறன் ப த் க்ெகாண் ப்பார் ப த் க்ெகாண் ப்பான் ப த் க்ெகாண் ப்பாள் ப த் க்ெகாண் ப்பாய் ப த் க்ெகாண் ப்ேபாம் ப த் க்ெகாண் ப்ேபன் ப த்தாயிற் ப த் ப்ேபாட்டார் ப த் ப்ேபாட்டான் ப த் ப்ேபாட்டாள் ப த் ப்ேபாட்டாய் ப த் ப்ேபாட்ேடன் ப த் ப்ேபாட்ேடாம் ப த் ப்ேபா கிறார் ப த் ப்ேபா கிறான் ப த் ப்ேபா கிறாள் ப த் ப்ேபா கிறாய் ப த் ப்ேபா கிேறன் ப த் ப்ேபா கிேறாம் ப த் ப்ேபா வார் ப த் ப்ேபா வான் ப த் ப்ேபா வாள் ப த் ப்ேபா வாய் ப த் ப்ேபா ேவாம் ப த் ப்ேபா ேவன் ப த் த்ெதாைலத்தார் ப த் த்ெதாைலத்தான் ப த் த்ெதாைலத்தாள் ப த் த்ெதாைலத்தாய் ப த் த்ெதாைலேதாம் ப த் த்ெதாைலேதான்

278

ப த் த்ெதாைலகிறார் ப த் த்ெதாைலகிறாள் ப த் த்ெதாைலகிறான் ப த் த்ெதாைலகிறாய் ப த் த்ெதாைலகிேறாம் ப த் த்ெதாைலகிேறன் ப த் த்ெதாைலப்பார் ப த் த்ெதாைலப்பான் ப த் த்ெதாைலப்பாள் ப த் த்ெதாைலப்பாய் ப த் த்ெதாைலப்ேபன் ப த் த்ெதாைலப்ேபாம் ப த் த்தள்ளினார் ப த் த்தள்ளினாள் ப த் த்தள்ளினான் ப த் த்தள்ளினாய் ப த் த்தள்ளிேனாம் ப த் த்தள்ளிேனன் ப த் த்தள் வார் ப த் த்தள் வான் ப த் த்தள் வாள் ப த் த்தள் வாய் ப த் த்தள் ேவன் ப த் த்தள் ேவாம் ப த் க்கிழித்தார் ப த் க்கிழித்தான் ப த் க்கிழித்தாள் ப த் க்கிழித்தாய் ப த் க்கிழித்ேதன் ப த் க்கிழித்ேதாம் ப த் க்கிழிப்பார் ப த் க்கிழிப்பான் ப த் க்கிழிக்கிறாள் ப த் க்கிழிப்பாய் ப த் க்கிழிப்ேபன் ப த் க்கிழிப்ேபாம் ப த் க்கிழிக்கிறார் ப த் க்கிழிக்கிறான் ப த் க்கிழிக்கிறாள்

ப த் க்கிழிக்கிறாய் ப த் க்கிழிக்கிேறன் ப த் க்கிழிக்கிேறாம் ப த் க்கிழிப்பார் ப த் க்கிழிப்பான் ப த் க்கிழிப்பாள் ப த் க்கிழிப்பாய் ப த் க்கிழிப்ேபன் ப த் க்கிழிப்ேபாம் ப த் க்கிடந்தார் ப த் க்கிடந்தான் ப த் க்கிடந்தாள் ப த் க்கிடந்தாய் ப த் க்கிடந்ேதன் ப த் க்கிடந்ேதாம் ப த் க்கிடக்கிறார் ப த் க்கிடக்கிறான் ப த் க்கிடக்கிறாள் ப த் க்கிடக்கிறாய் ப த் க்கிடக்கிேறன் ப த் க்கிடக்கிேறாம் ப த் க்கிடப்பார் ப த் க்கிடப்பான் ப த் க்கிடப்பாள் ப த் க்கிடப்பாய் ப த் க்கிடப்ேபன் ப த் க்கிடப்ேபாம் ப த் த்தீர்த்தார் ப த் த்தீர்த்தான் ப த் த்தீர்த்தாள் ப த் த்தீர்த்தாய் ப த் த்தீர்த்ேதாம் ப த் த்தீர்த்ேதன் ப த் த்தீர்க்கிறார் ப த் த்தீர்க்கிறான் ப த் த்தீர்க்கிறாள் ப த் த்தீர்க்கிறாய் ப த் த்தீர்க்கிேறாம் ப த் த்தீர்க்கிேறன்

279

ப த் த்தீர்ப்பார் ப த் த்தீர்ப்பான் ப த் த்தீர்ப்பாள் ப த் த்தீர்ப்பாய் ப த் த்தீர்ப்ேபாம் ப த் த்தீர்ப்ேபன் ப த் த்தார் ப த் த்தான் ப த் த்தாள் ப த் த்தாய் ப த் த்ேதாம் ப த் த்ேதன் ப த் க்கிறார் ப த் க்கிறான் ப த் க்கிறாள் ப த் க்கிறாய் ப த் க்கிேறாம் ப த் க்கிேறன் ப த் ப்பார் ப த் ப்பான் ப த் ப்பாள் ப த் ப்பாய் ப த் ப்ேபன் ப த் ப்ேபாம் ப க்கட் ம் ப க்கேவண் ம் ப க்கேவண்டாம் ப க்கக்கூ ம் ப க்கக்கூடா ப க்கமாட்டான் ப க்கமாட்டாள் ப க்கமாட்டார் ப க்கமாட்ேடன் ப க்கமாட்டாய் ப க்கமாட்ேடாம் ப க்கவில்ைல ப க்கயிய ம் ப க்கயியன்ற ப க்கவிய கிற

ப க்க ந்த ப க்க கிற ப க்க ம் ப க்கயி ந்தான் ப க்கயி ந்தாள்

280

B.6 MOSES INSTALLATION AND TRAINING

This subsection explains the installation of Moses tool kit and the issues which are

occurred while training the system. Remedies for the issues are also given in detail.

The required packages are in the packages folder.

mkdir smt/moses/tools copy & paste gizapp into tools and extract Then, cd smt/moses/tools/gizapp make if error, then 1) yum install gcc 2) yum install gcc-c++ 3) yum install glibc-static (for can't find -lm error) 4) yum install libstdc++-static (for can't find -lstdc++ error) cd ../ mkdir bin cp giza-pp/GIZA++-v2/GIZA++ bin/ cp giza-pp/mkcls-v2/mkcls bin/ cp giza-pp/GIZA++-v2/snt2cooc.out bin/ copy & paste srilm into tools and extract cd srilm change the path SRILM to srilm dir in srilm/MakeFile in srilm/commom, open makefile.machine.i686 -> under TCL_support --> comment other two options --> add NO_TCL = X yum install automake yum install zlib-devel yum install boost-devel install c shell package i.e., tcsh package make World make all

281

export PATH=/home/anand/smt/moses/tools/srilm/bin/i686:/home/jschroe1/demo/tools/srilm/bin:$PATH cd .. cp&p moses and extract it yum install libtool ./regenerate-makefiles.sh ./configure --with-srilm=/home/anand/smt/moseso/tools/srilm --with-irstlm=/home/anand/smt/moses/tools/irstlm make -j 2 To confirm setup: cd /home/anand/smt/moses mkdir data cp sample-models cd sample-models/phrase-model/ ../../../tools/moses/moses-cmd/src/moses -f moses.ini < in > out two sentences -> o/p: this is a small house . compile moses support scripts- cd ../../../tools/ mkdir moses-scripts cd moses/scripts Then edit makefile 13,14c13,14 < TARGETDIR?=/home/s0565741/terabyte/bin < BINDIR?=/home/s0565741/terabyte/bin --- > TARGETDIR?=/home/anand/smt/moses/tools/moses-scripts > BINDIR?=/home/anand/smt/moses/tools/bin in moses/scripts/makefile, line 79 ./ -> perl check-dependencies.pl then, make release export SCRIPTS_ROOTDIR=/home/anand/smt/moses/tools/moses-scripts/scripts-YYYYMMDD-HHMM

282

Additional Scripts cd ../../ extract scripts also cp mteval.v11b.pl For Training errors Use of uninitialized value $a in scalar chomp at tools/moses-scripts/scripts-20110204-0333/training/train-model.perl line 1079. Use of uninitialized value $a in split at tools/moses-scripts/scripts-20110204-0333/training/train-model.perl line 1082. type perl in line 1019 before $GIZA2BAL in train-model.perl For Tuning errors if error -> sh: /home/anand/smt-moses/tools/moses-scripts/scripts-20101111-0136//training/cmert-0.5/score-nbest.py: /usr/bin/python^M: bad interpreter: No such file or directory in /home/anand/smt/moses/tools/moses-scripts/scripts-20110204-0333/training/mert-moses.pl, type python before $cmertdir i.e., in this line $SCORENBESTCMD = "$cmertdir/score-nbest.py" if ! defined $SCORENBESTCMD; Creating language model ngram-count -order 4 -interpolate -kndiscount -text SMT-project/smt-cmd/lm/monolingual -lm SMT-project/smt-cmd/lm/monolingual.lm ./ngram-count -order 5 -text 300.morph.txt -lm 300.morph.lm Training SMT-project/moses/bin/moses-scripts/scripts-20090302-0358/training/train-factored-phrase-model.perl -scripts-root-dir SMT-project/moses/bin/moses-scripts/scripts-20090302-0358/ -root-dir . -corpus SMT-project/smt-cmd/corpus/corpus -f en -e ma -alignment grow-diag-final -reordering msd-bidirectional-fe -lm 0:4:SMT-project/smt-cmd/lm/monolingual.lm:0

283

Testing SMT-project/moses/moses-cmd/src/moses -config SMT-project/smt-cmd/model/moses.ini -input-file SMT-project/smt-cmd/testing/input > SMT-project/smt-cmd/testing/output Training factored model with alignment and translation factors

bin/moses-scripts/scripts-20100311-1743/training/train-factored-phrase-model.perl -scripts-root-dir bin/moses-scripts/scripts-20100311-1743/ -root-dir running_files -corpus pc/twofactfour -f eng -e tam -lm 0:4:/root/Desktop/D5/srilm/bin/i686/300.lm:0 -lm 2:5:/root/Desktop/D5/srilm/bin/i686/300.pos.lm:0 -lm 3:5:/root/Desktop/D5/srilm/bin/i686/300.morph.lm:0 --alignment-factors 0,1,2,3-0,1,2,3 --translation-factors 0-0+1-1+2-2+3-3 --reordering-factors 0-0+1-1+2-2+3-3 --generation-factors 3-2+3,2-1+1,2,3-0 --decoding-steps t3,t2,t1,g0,g1,g2 Moses Config file ######################### ### MOSES CONFIG FILE ### ######################### # input factors [input-factors] 0 1 2 3 # mapping steps [mapping] 0 T 0 0 T 1 # translation tables: source-factors, target-factors, number of scores, file [ttable-file] 1,2 1,2 5 /media/DISK5/tools/trunk/scripts/running_files/model/phrase-table.1,2-1,2.gz 2,3 3 5 /media/DISK5/tools/trunk/scripts/running_files/model/phrase-table.2,3-3.gz

284

# no generation models, no generation-file section # language models: type(srilm/irstlm), factors, order, file [lmodel-file] 0 1 4 /root/Desktop/D5/srilm/bin/i686/300.lem.lm 0 2 4 /root/Desktop/D5/srilm/bin/i686/300.pos.lm 0 3 4 /root/Desktop/D5/srilm/bin/i686/300.morph_.lm # limit on how many phrase translations e for each phrase f are loaded # 0 = all elements loaded [ttable-limit] 20 0 # distortion (reordering) weight [weight-d] 0.6 # language model weights [weight-l] 0.1667 0.1667 0.1667 # translation model weights [weight-t] 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 # no generation models, no weight-generation section # word penalty [weight-w] -1 [distortion-limit] 6 Testing factored model ./moses-cmd/src/moses -report-all-factors -config ./scripts/running_files/model/moses.ini -input-file ./scripts/test/test.eng > ./scripts/test/test.tam

285

B.7 COMPARISION WITH GOOGLE OUTPUT  

English Sentences Google Output I went to his home. நான் அவர ட் ற்கு ெசன்றார்.

She is playing with her friends. அவள் நண்பர்க டன் விைளயா ெகாண் க்கிறார்.

He is a doctor. அவர் ஒ டாக்டர்.

They are studying in my school. அவர்கள் என் பள்ளியில் பயின் வ கிறார்கள்.

The book is on the table. த்தகம் அட்டவைண உள்ள . They will sing a song. அவர்கள் ஒ பாட்ைட பாட ேபாகிறார். The rat was killed by the cat . எ ைன ெகால்லப்பட்டார். She is studying with me . அவள் என் டன் ப த் ெகாண் க்கிறார். She did not come with me. அவள் என்ைன வரவில்ைல. I deposited money to the bank. நான் வங்கிக்கு பணம் ெடபாசிட். We will study today. இன் நாம் ப ப்ேபாம்.

English Sentences F-SMT Output

I went to his home. நான் அவன ட் ற்கு ேபாேனன்.

She is playing with her friends. அவள் நண்பர்க டன் விைளயா ெகாண் க்கிறாள்.

He is a doctor. அவர் ஒ டாக்டர்.

They are studying in my school. அவர்கள் என் பள்ளியில் ப த்

வ கிறார்கள்.

The book is on the table. த்தகம் ேமைசயின் ேமல் உள்ள .

They will sing a song. அவர்கள் ஒ பாட்ைட பாட ேபாகிறார்கள்.

The rat was killed by the cat . எ ைனயால் ெகால்லப்பட்ட .

She is studying with me . அவள் என் டன் ப த் ெகாண் க்கிறாள்.

She did not come with me. அவள் என் டன் வரவில்ைல.

I deposited money to the bank. நான் வங்கிக்கு பணம் ெசன்ேறன்.

We will study today. இன் நாம் ப ப்ேபாம்.

286

B.8 GRAPHICAL USER INTERFACES  

 

 

Figure B.1 Tamil POS-Tagger GUI

 

 

 

 

 

 

 

 

287

 

 

 

 

Figure B.2 Tamil Morphological Analyzer GUI

 

 

 

 

 

 

 

 

 

288

 

 

 

 

Figure B.3 Tamil Morphological Generator GUI

 

   

 

 

 

 

 

 

 

 

 

 

 

Figure B.4 English to T

289

Tamil Machhine Translation System

 

m GUI