Sunday, August 2, 2015

Loeme araabia keelt! / Let's read Arabic!




Mida ma õppisin araabia keelt õppides teist korda, mida ma ei õppinud esimesel korral

Mõnda aega tagasi kirjutasin, et pole suutnud (sellise meetodi juures, mis mul on) õppida araabia keelt, sest pole piisavalt paindlikku sõnaraamatut, kust ma oma vastused kätte saaksin. Ning, hea küll, olles nõnda konstanteerinud fakti, hakkasin mõtlema, millisel määral on konstanteerimine eeltingimuseks asjale endale? Teisisõnu, kas minu araabia keele õppimise mitte oskamine oli johtuv minu kirjalikust tunnistusest, et ma araabia keelt õppida ei oska. Nõnda üritasin araabia keelt uuesti ja ennäe imet! oskasin küll.

Kuidagi oli ülevalt minu peale langenud teadmine, mis võimaldas mul mõista ja võtta lahti seda, mida ma varem ei suutnud. Järgnevalt kirjutangi analüüsi, mis tegi varem araabia keele õppimise liiga keeruliseks ning mis oli seekord nii selge ja lihtne. Mis on see Saladus™, mis võimaldaks Sul lugeda EKRE#absurdRÜE#toovadhaigusi kiuste Koraani või midaiganes.

Lõppu jõudmiseks peab alustama päris algusest – esimest korda õppisin araabia keelt 2011 kevadel, Tartu Ülikooli ja Faruk Abu-Chacra araabia keele lühikursusel, mis kestis kokku 4 nädalat. Kasutasime selleks sedasama rohelist Routledge'i õpikut, mis on väga hea grammatika poolest, aga „tere“ ütlemiseks mitte nii väga. See kursus ei olnud jaoks lõplikult edukas, seda mitmel erineval põhjusel, millest üheks (aga mitte ainsaks) oli lühikursuse lühisus. Siiski sain 4 nädala jooksul enda jaoks läbi mõelda araabia tähestiku, kuu ja päikese, käänded, asesõnad, (kindla kõneviisi) pööramise perfektis ja imperfektis ning omastavad järelliited. Napilt välja jäi radikaalidel põhinev tuletamissüsteem, erinevad kõneviisid ning suur osa mitmusest.

See on siis see teoreetiline pagas, mille abil hakkasin suure tahtmisega lugema lastejutte ja uudiseid majanduskriisist. Aga mõne aja möödudes (maist pisteliselt septembri lõpuni välja) edasiminekut ei ilmnenud ning asi jäi katki, valdavalt vene ja vanakreeka keele kasuks. Probleem oli eelkõige tehnilist laadi ja peaasjalikult seostud araabia kirjakeele iseärasustega. Võtaksin need probleemid kokku kolme punktina:

1) araabia (aga ka heebrea) tähestikku kirjutatakse peaasjalikult konsonantides, millele vokaalid lisatakse erinevate diakriitiliste märkidena (erinevad täpikesed, mummud või niisama kriipsud tähe ümber). Erandiks on pikad vokaalid, mille jaoks on olemas eraldi tähed. Kuna araabia keele häälikusüsteemis ainult kolm vokaali ongi, siis väga palju erinevaid kriipse vaja polegi: lühikene „a“ o‎n kriipsuke üleval ( َ ), lühike „i“ on kriipsuke all (ِ ) ning lühike „u“ on natukene nagu lipsukene üleval ( ُ). Lisaks sellele on veel paar diakriitilist märki millest olulisimad on ehk ümmargune mummu üleval, mis tähistab vokaali puudumist (ّْْْٓ ) ning tähe kahekordistamist tähistav sinka-vonka ‎(ّ ).

2) iseenesest peaks iga tähega kaasnema vähemalt üks täpsustav diakriitiline märk, mis näitaks, kuidas konkreetset tähte lugeda. Pühakirjas ja väikestele lastele mõeldud tekstides see nii ongi, kuid valdav enamuses araabia-keelsetes tekstides märgitakse diakriitikuid ainult siis, kui see on vajalik sõna eristamiseks (näiteks كَتَبَ/kataba „kirjutamai“ eristamiseks sõnast كُتُب/kutub „raamatud“). Samas on diakriitikud semantiliselt väga olulised, kuna suur osa araabia keele grammatikast ning sõnaloomest on derivatiivne – st, ühest ja samast tüvest (mis koosneb tavaliselt 3-4 tähest ehk radikaalist) saab tuletada palju erinevaid vorme, nii tegu- kui ka nimisõnu.كَتَبَ/kataba „kirjutama“ on üks taolistest tüüpvormidest, millest saab tuletada nii nimisõna كِتَاب/kitāb „raamat“ kui ka tegusõna كَاتَبَ/kātaba „kirjavahetust pidama“. Väga ranged vokaalimuutused toimuvad ka tegusõnade pööramisel (võrdle perfekti 1. isiku ainsust كَتَبْتُ/katabtu „ma kirjutasin“ ning 2. isiku ainsust [meessoos] كَتَبْتَ/katabta „sa kirjutasid“). Tavatekstides kirjutatakse kõike seda minimaalselt, niipalju kui on selguse jaoks vaja.

3) veebipõhised sõnaraamatud (millest enim soovitan, nagu ikka, Vikisõnastiku eri versioone) saavad araabia tähestiku iseärasustega väga halvasti hakkama. Isegi kui algtekstis esinebki täpsustavaid diakriitilisi märke, peab need üldjuhul sõnaraamatus otsides ära kustutama. Probleeme tekib ka sõna erinevatest ees- või järelliidetest (määrav artikkel, omastav järelliide, üldiselt imperfekti tähistav يَ/-ya), kuigi konkreetsed vormid võivad Vikisõnastiku sissekandes ilusti olemas olla.
Kõik see tähendab, et araabia keele lugemine on nõudnud märksa suuremat üldistamist ning sõnade algvormideks lahti võtmist, kui nii mõnigi teine keel. Ilmselt kui ma 2011 aastal araabia keelega esimest korda alustasin, oli mul praegusest ka märksa rohkem vaja teada sõnade täpseid vorme (meeldetuletuseks, artikkel selle kohta, kuidas prantsuse keele grammatika kohta kõik ette ära öeldakse). Näitena, kuidas toimiksin vastukaaluks araabia keeles, loeme koos natukene poliitilist arvamusartiklit ajalehest Al-Hayat
كشفت أزمة النفايات التي غرق فيها لبنان خلال الأسبوعين الماضيين، عن عقم الطبقة السياسية

كشفت on võrdlemisi lihtne ning Vikisõnastik pakub välja mitmeid võimalusi, mis kõik on tegusõna كَشَفَ/kašafa „paljastama, ära koristama, uurima“ erinevad pöörded. Kõige tõenäoliselt on tegemist naissoost 3. isiku ainsusega, aga seda ei tea me kindlalt enne, kui oleme leidnud üles lause aluse.

أزمة /azma „kriis, vähesus“ lause alus ongi ning ühtlasi ka grammatilises mõttes naissoost. Saame seega kinnitust, et esimene sõna on naissoost 3. isiku ainsus.

النفايات on juba keerulisem ning sellises vormis Vikisõnastikus ei esine. Abiks ei ole ka määrava artikli ال eemaldamine sõna algusest. Sellisel juhul on mõttekas heita pilk inglisekeelsesse google'i tõlkesse, mis annab النفايات kohta vasteks „waste“ („jääde/prügi“). Kui sõna lõpust veel tähti kustutada, jõuame lõpuks tegusõnani نَفَا/nafā „eitama, takistama, ära viima“, mis on ka semantiliselt seotud vastega, mida andis meile google'i tõlge (kõige paremini tuleb see läbi inglisekeelsest vastest „to refuse“, kuna „refuse“ nimisõnana tähendab ka inglise keeles „jäädet“ või „prügi“. Aga النفايات täpse algvormi juurde lähemale see seos meid ei vii, niiet järgmiseks sammuks oleks otsida võimalikku tõlget inglise-keelse vaste sissekannete juurest. „Waste'i sissekanne väga meile abiks ei ole, küll aga leidub sissekanne „garbage („prügi“) viimaks ka sobiv õige vaste: نُفَايَة/nufāya.

Eelnev on väga hea näide, miks araabia keele lugemine on seni tekitanud mulle probleeme: otsest vastet lihtsalt ei saa kätte ja peab jõudma selleni ringiga. Põhimõtteliselt võib väita, et päris täpse vasteni me ei jõudnudki, sest النفايات grammatiliselt hoopis naissoost, mis ühildub genitiivkonstruktsionis eelneva nimisõnaga. أزمة النفايات tähendaks kokku panduna „prügi-“ või „jäätmekriisi“, mida kinnitab ka google'i tõlge.

Lahtikirjutatuna tundub see protsess ehk omajagu keeruline ja vaevanõudev, kuid mingist hetkest kaasneb otsingutega teatav vilumus. Enamikel juhtudel esimese otsinguga vastust ei leia, samas pole ka võimatu see, et konkreetset vastet ei leiagi. Siis peab leppima ainult google'i tõlke vastega või, halvemal juhul kui google'i tõlge ka ei tea, elada teadmatuses.

*
التي /allatī on naissoost vorm siduvale asesõnale الذي/allaḏī, mis on grammatiliselt seotud jälle eelneva lauseosa alusega. Siit algab uus kõrvallause ning sõltuvalt järgnevast saab selle eesti keelde tõlkida „kes/mis“, „kelle/mille“, „keda/mida“ jne...

غرق „uppuma“ on sissekandena küll olemas, kuid ainult pärsia keeles („drowned“). Suure tõenäosusega on samatähenduslik sõna olemas ka araabia keeles. Nii ongi: sissekanne „drown annab araabiakeelseks tõlkeks غَرَقَ/ḡaraqa ning viitab tagasi esimesele (hetkele ainult pärsia keele) sissekandele.

فيها eraldi ei esine. فِي /on laialt levinud eessõna „sees“ ning ـهَا/-hā on naissoost 3. isiku omandust näitav järelliide, mis viitab siinkohal ikka samamoodi eelnenud fraasile (أزمة النفايات). Kokkupanduna võiks eesti keeles öelda „selles“.

لُبْنَان/lubnān on „Liibanon“.

خلال/ḵilāla on eessõna „vältel, millegi jooksul“.
الأسبوعين eraldi ei esine, kuid google'i tõlge annab võrdlemisi konkreetse vaste: „two weeks“. Sissekanne „weekviib edasi araabia keele vastele أُسْبُوع/ʾusbūʿ „nädal“. Erinevate vormide tabelist leiab ka konkreetse vormi määrava artikli ning duaaliga الأُسْبُوعَيْن/al-ʾusbūʿayn.

الماضيين eraldi ei esine, kuid google'i tõlkes „the last two“. Kustutades ära määrava artikli ال ning piisavalt tähti sõna lõpust, jõuame viimaks sissekandeni مَاضِي/māḍī ja sealt edasi مَاضٍ/māḍin. المَاضِيَيْن/al-māḍiyayn on jällegi määrava artikliga duaali vorm ning läheb kokku eelneva sõnaga: الأسبوعين الماضيين „viimased kaks nädalat.“

عَنْ/ʿan on teine laialt kasutatav eessõna, mille tähendusväli on märksa ebamäärasem: „eemale, kohta, põhjal jt...“. Antud juhul tõlgin ta eesti keeles lihtsalt sihitise tunnuseks.

عقم toob kaasa teistmoodi probleemi. Vikisõnastikus on tõepoolest olemas sissekanne عَقَّمَ/ʿaqqama „steriliseerima“, aga see ei pruugi antud kontekstis olla täielikult õige. Google'i tõlge pakub vasteks seotud nimisõnavormid „futility, sterility“ ning sissekanne „futiletõlkeks sarnase vormi عَقِيم/ʿaqīm. Minemata üleliia sügavalt araabia keele süntaktikase, tundub ka lauseloogika poolest siia paremini nimisõna kui tegusõna.

الطبقة eraldi ei esine, kuid kustutades ära määrava artikli ال, jõuame samatähendusliku sissekande juurde pärsia keeles. طَبَقَة/ṭabaqa tähendab „klass, kiht, grupp“.

السياسية eraldi ei esine, kuid kustutades ära määrava artikli ال, saame سِيَاسِيَّة/siyāsiyya, mis on naissoost vorm omadussõnale سِيَاسِيّ/siyāsiyy „poliitiline, diplomaatiline“. الطبقة السياسية moodustab kokku „poliitiline klass.“

*
Sõna-sõnalt saame seega kokku midagi sellist:
„Paljastas kriis jäätme, mis uppus sees-selle Liibanon jooksul kahe nädala viimase, kohta/eemale võimetus klass poliitilise“

Ja eesti keeles ehk midagi sellist:
„Jäätmekriis, milles Liibanon viimase kahe nädala jooksul uppus, paljastas poliitilise klassi võimetuse“

Võrdluseks ka google'i tõlke inglisekeelne versioon, mis annab tihti kätte küll õige suuna, kuid lauset tervikuna edastada ei suuda:

Revealed waste that sink in Lebanon during the crisis of the past two weeks, about the futility of the political class“

Olgu öeldud, et eelnev analüüs ei ole grammatilises lõplikult täpne. Nõnda näiteks ei määra ma iga nimisõna käänet, mis formaalses mõttes igal nimisõnal on, kuid sageli eraldi markeeritud pole. Õnneks on araabia keele lauseehitus piisavalt robustne, et segadust mitte tekkida – nominatiiv on üldjuhul alus, genitiiv on kas genitiivtäiend või osaline eessõnafraasides ning akusatiiv sihilise tegusõna objekt või adverbiaal. Rangelt võttes saab nii tegusõna كشفت kui ka غرق puhul spekuleerida, ega kasutatud pole hoopis umbmäärast tegumoodi, mis peaks olema eraldi markeeritud (näiteks, kui tekstis oleks كُشفت/kušifat, kus sõna alguse „u“ on umbmäärase tegumoe tunnusena eraldi välja kirjutatud), aga alati pole ka. Kui ma tavaliselt araabia keelt loen, siis ma tegelikult nii süviti ei lähegi ning eeldan pigem tavalisemat ja tõenäolisemat vormi kui keerulisemat ja ebatavalisemat. Siiski peab ütlema, et lauseosade omavaheliste seoste loomine võib olla omajagu keeruline, kui ma esimese hooga ei hooma, mis suunas lause liikuma peaks. Lauseehituse paremaks mõistmiseks on olnud väga kasulik lugeda araabia-inglise paralleeltekste veebilehel http://readarabic.nflc.org/.
iOtseses tähenduses on tegemist perfekti 3. isiku ainsuse vormiga, mille peaks tõlkima hoopis „[ta] kirjutas“, kuid kuna tegemist sõnaraamatu tüüpvormiga, kasutan siin eesti-keele vasteteks ma-infinitiivi.


What I learned from learning Arabic the second time I did not learn the first time

Some while ago I wrote that I have been unable (with the kind of method I have) to learn Arabic, because there is no dictionary flexible enough for me to get my answers. And, fair enough, having thus stated the fact, I started thinking, to what extent is stating a fact a precondition for the thing itself? In other words, does me being unable to learn Arabic was dependant of me admitting (and writing it down) that I am unable to learn Arabic. So I tried Arabic again and lo and behold! I was able after all.

Somehow, knowledge from above had transpired which allowed me to understand and analyse that which I could not before. So the following is an analysis of what made it too difficult to learn Arabic before and which is now clear and simple. What is the Secret™ that allows you read – despite EKRE#absurdRÜE#bringdiseases to read Koran or whatever.

To reach the end, one has to start from the beginning – the first time I learned Arabic in spring 2011, in intensive Arabic course by Faruk Abu-Chacra and the Tartu University that lasted 4 weeks altogether. We used the same green Routledge textbook, which is very good for grammar, but not so good for saying “hello”. The course was not entirely successful for me, for several reasons, one of which (but not the only one) was the shortness of the short intensive course. Still, during the 4 weeks, I was able to think through the Arabic alphabet, the sun and the moon, the cases, the pronouns, the conjugation of indicative in perfect and imperfect and possessive suffixes. The radical-based derivation system, different voices and much of plural stayed beyond me, just barely.

So that is the theoretical baggage that I had to start reading children stories and news about the economic crisis, which I did with great enthusiasm. But after a while (from May until the end of September, on-and-off), there seemed no progress, and I went on to do other things, mostly Russian and Ancient Greek. The problem was primarily of a technical kind and above all connected to the peculiarities of the Arabic writing system. I'd sum up these problems in three points:

1) Arabic (but also Hebrew) alphabet is solely written in consonants, where vocals are added as as a variety of diacritical marks (different dots, spots and strikes around the letter). The exception are long vocals that have separate letters of their own. Since Arabic only has three different vocals, you don't really need that many different markings: short “a” is the strike above ( َ ), the short “i” is the strike below (ِ ) and the short “u” is something of a small tie above ( ُ). In addition, there a few more diacritical marks, the most important of them being the small dot above which indicates the absence of a vocal (ّْْْٓ ) and the zig-zag to indicate the doubling of the letter ‎(ّ ).

2) in essence, every letter should be accompanied by at least one diacritical marking that would show, how to read a specific letter. In Holy Scriptures and texts intended for small children, that is indeed the case, but in the vast majority of Arabic texts, diacritical marks are added only when they're necessary to tell one word from another (for instance for distinguishing كَتَبَ/kataba “to writei” from كُتُب/kutub “books”). At the same time, diacritics are very important semantically, since the vast majority of Arabic grammar and word-formation is derivative – this means that the same root (usually comprising of 3-4 letters or radicals) can be used to derive many different forms, both verbs as well as nouns. كَتَبَ/kataba “to write” is one of such root forms, which can be used to derive both the noun كِتَاب/kitāb “a book” as well as the verb كَاتَبَ/kātaba “to hold correspondence”. Very strict vocal alterations also occur during verb conjugation (compare the 1. person singular كَتَبْتُ/katabtu “I wrote” and the [masculine] 2. person singularكَتَبْتَ/katabta “you wrote”). In normal everyday texts, all of this is added minimally, only as much is needed for clarity's sake.

3) web-based dictionaries (and as always, I recommend the different versions of Wiktionary) manage the peculiarities of the Arabic alphabet very poorly. Even if the original text does have diacritics to specify something, these usually need to be deleted when searching the dictionary. Problems are also caused different prefixes and suffixes (the definite article, the يَ/-ya that usually denotes imperfect), although specific forms might actually exist in Wiktionary entries.

All this means that reading Arabic has required a greater level of generalisation and dissecting words to their root forms than some other languages might. Most likely, when I first started with Arabic in 2011, I needed much more than now to know the exact word forms (as a reminder, here's an Estonian article on how everything will be told for you about French grammar). As an example, how I rather do things in Arabic, let us read together a short bit of an  opinion article from the newspaper Al-Hayat.
كشفت أزمة النفايات التي غرق فيها لبنان خلال الأسبوعين الماضيين، عن عقم الطبقة السياسية

كشفت is fairly simple and Wiktionary offers many possibilities, which are all different conjugations of the verb كَشَفَ/kašafa “to reveal, to clean up to investigate“.The likeliest choices is feminine 3. person singular, but we won't be knowing this for certain until we'll have found the subject of the sentence.

أزمة /azma „crisis, scarcity“ is the subject of the sentence and grammatically a feminine noun. So we have confirmation that the first word was indeed a feminine 3. person singular.

النفايات is a more difficult case, and no such form exists in Wiktionary. Removing the definite article ال from the beginning of the world does not help either. In such a case, it would make sense to take a look at the English version of Google Translate, which proposes “waste” as a possible translation for النفايات. When we delete additional letters from the end of the word, we finally come across the verb نَفَا/nafā “to deny, to refuse, to take away“, which is also semantically connected to the “waste” proposed by Google Translate (compare the noun form of the English word “refuse” in the sense of “garbage”). But this connection does not bring us closer to finding the exact original form of النفايات, so our next step would be to find a possible translation from the “waste” entry in the Wiktionary. Looking at “waste does not really help us that much, but the entry on “garbage” finally gives a suitable match: نُفَايَة/nufāya.

The previous word is a very good example, why reading Arabic has caused so many problems so far: you just can't find the direct match and have to take a more circular route. Basically we could argue that a direct match we did not even find in the end, because النفايات is grammatically a feminine form that in a genitive construction with the preceding noun. Put together, زمة النفايات would mean “garbage crisis or “waste crisis” as also confirmed by Google Translate.

Taken apart, the entire process might seem quite difficult and exhausting, but after awhile, you'll achieve a certain degree of proficiency when doing the searches. In most cases, the first query will give no results, although it is not impossible that you won't find a match at all. In such cases, Google Translate will have to suffice and sometimes rarely, when even Google Translate has no answers, there's nothing else than to live in ignorance.

*
التي /allatī is a feminine form of the relative pronoun, الذي/allaḏī, which too agrees grammatically with the subject of the previous phrase. This is the start of a subordinate clause and depending on what comes next, could be translated into English as “who, which, what, that” etc...

غرق “to drown” does exist as an entry, but only in Persian. It is likely that a word with the same meaning also exists in Arabic. This proves to be true: the entry for “drown” proposes غَرَقَ/ḡaraqa as the Arabic translation and refers back to the previous (currently Persian-only) entry.

فيها does not exist separately. فِي /is a common preposition with the meaning of “in” and ـهَا/-hā is a possessive suffix for feminine 3. singular, which too refers back to the previous phrase (أزمة النفايات). Put together, the literal meaning would be “in that”.

لُبْنَان/lubnān is “Lebanon”.

خلال/ḵilāla is a preposition “during, in the course of”.
الأسبوعين does not exist separately, but Google Translate gives a rather concise answer: “two weeks“. The entry “week leads forward to the entry for the Arabic word أُسْبُوع/ʾusbūʿ “week”. In the table of different forms there's also specific form with a definite article and a dual, الأُسْبُوعَيْن/al-ʾusbūʿayn.

الماضيين does not exist separately, but Google Translate gives: “the last two”. By deleting the definite article ال and enough from the end of the world, we at last come to the entry مَاضِي/māḍī, and from there مَاضٍ/māḍin. المَاضِيَيْن/al-māḍiyayn is again the form with a definite article and a dual, and goes together with the previous word: الأسبوعين الماضيين “the last two weeks”.

عَنْ/ʿan is another common preposition, whose meaning is a bit more vague: “away from, about, according to” etc... In this case I translate simply as a marker for the object.

عقم brings along a different kind of a problem. Wiktionary indeed has an entry عَقَّمَ/ʿaqqama “to sterilise”, but this need not correct in this context. Goolge translate gives nouns “futility, sterility”, and the entry futile” a similar form عَقِيم/ʿaqīm. Without knowing too well the Arabic sentence structure, a noun would fit here better than a verb.

الطبقة does not exist separately, but by deleting the definite articleال, we reach the same entry in Persian. طَبَقَة/ṭabaqa means “class, group, layer.”

السياسية does not exist separately, but by deleting the definite articlال, we get toسِيَاسِيَّة/siyāsiyya, which is a feminine form of the adjective سِيَاسِيّ/siyāsiyy “political, diplomatical”. الطبقة السياسية together forms “political class”.

*
So word-for-word we have something like this:
“Revealed crisis of waste, which drowned in that Lebanon during the two weeks of past, about/from futility class of political”

And in more proper English perhaps something like this:
“The waste crisis, in what Lebanon was drowning during the past two weeks, revealed the futility of the political class”

In comparison, here's also the English version from Goolge translate which often points you to the right direction, but cannot convey the entire sentence:
“Revealed waste that sink in Lebanon during the crisis of the past two weeks, about the futility of the political class”

Let it be said that the preceding grammatical analysis is not absolutely accurate. For instance, I do not identify the cases, which should formally exist for ever noun, but are seldom marked separately. Fortunately, the Arabic sentence structure is robust enough for there to be minimal confusion – nominative is generally the subject, genitive either a part of the prepositional phrase or a genitive construct and accusative an object of a transitive verb or an adverbial. Strictly speaking both verbs كشفت and غرق leave room for speculation, whether or not passive voice is actually used. Passive voice should be marked separately (for instance, if it were to be written كُشفت/kušifat, the short „u“ at the beginning of the word is added to the text as a marker for passive voice), but actually often is not. When I normally read Arabic, I do not actually go that deep into the grammar and presume a simpler and more likely applies than a more complex and uncommon form. Still, connecting different parts of the sentence can be difficult enough if I don't grasp right at the start, where sentence is going to go. To better understand the syntax, it has been very helpful to read the parallel Arabic-English texts on http://readarabic.nflc.org/.
iLiterally this is the 3. person singular form in perfect which should rather be translated as „he wrote“, but since this is the base form used in dictionaries, I use the English to-infinitive as its counterpart.