Kas sõnu kustutatakse sõnastikust, kui inimesed neid ei kasuta?

Kas sõnu kustutatakse sõnastikust, kui inimesed neid ei kasuta?

Teine väljaanne Oxford inglise sõnaraamat peetakse üldiselt inglise keele eksisteerimise ainukordsemaks kõige ulatuslikumaks. Sellesse töösse kuuluvad arvukad tuhanded sõnad, mida leksikograafid peavad täiesti "iganenuks". Näete, kui keegi on Californias keeleteaduses, kui üks sõna on see OED-i teinud, ei saa ta kunagi lahkuda. Kas sõnastiku eemaldamine sõnastikust või mitte, erineb sõnastikust sõnastikust, kuid suuremate sõnaraamatustena, kes püüavad välja jätta "täielikud" väljaanded, kipuvad järgima selle eeskuju, kui need sõnad ei eemalda kunagi, kui need sõnad on. Kuid kõigi sõnaraamatud on sagedasemad lühendatud versioonid aeg-ajalt eemaldage mitte ainult vananenud sõnad, vaid mõnikord üsna tavalised, mis lihtsalt ei sobi ja mida peetakse vähem oluliseks, kui kaasata teisi sõnu erinevatel põhjustel.

Enne kui jõuame sõnastiku loomise silmade vananemiseni, on kasulik mõista, kuidas sõna esmakordselt sõnaraamatusse siseneb ja mida see tähendab sõna olemasoluks, kusjuures viimane on mõni tavaline väärarusaam .

Kuigi inimestel on väga tavaline midagi öelda: "See pole sõnastikus, nii et see pole sõna", on selline suhtumine harva, kui kunagi varem, professionaalsete sõnastike vahel jagatud. Üks ei pea otsima toimetajad kõigi peamiste sõnastike jaoks, mis mõistaksid seda populaarse mõtteid. Funktsionaalse sõna viite saidi Wordnik ja ühe korra peatoimetaja kaasautorina Ameerika sõnastikud Oxfordi ülikooli pressis, sealhulgas teise väljaande redigeerimine New Oxford American Dictionary, Erin McKean, märgib,

Kõik sõnad (peale tahtmatute vigade ja malapropismide) on sõnad nende sünnil. Kõik, mida peate otsustama, on see, kas kõnealune sõna on töö jaoks õige. Sõnaraamatud ei mõõta tegelikkust; need toimivad sõnade kasutamise ulatust piiravatena.

Või nagu on märgitud Merriami-Websteri veebisaidi KKK-i osas

Enamik ingliskeelsetest sõnaraamatutest on mõeldud nii, et need hõlmaksid ainult neid sõnu, mis vastavad kindlatele kriteeriumidele kogu laias piirkonnas ja pikema aja jooksul. Selle tulemusena võivad nad jätta välja sõnad, mis on veel väljakujunenud, liiga spetsiifilised, või need, mis on nii mitteametlikud, et nad on harva dokumenteeritud professionaalselt toimetatud kirjalikus vormis. Järelejäänud sõnad on sama reaalsed kui need, kes saavad sisenemist; endised ei vasta sõnastikupäringute kriteeriumidele - vähemalt mitte veel (uuemad võivad lõpuks siseneda sõnastikupõhistele lehtedele, kui nad kasutavad piisavalt).

Stanfordi keeleteaduse professor Arnold Zwicky ütleb veelgi, et selles üldises teemas üsna meeldivas lauldes on see,

Alustame ettekirjutusest, et maitse- ja viimistlejad ei peaks X-d kasutama. See on siis liialdatud ja kõrgendatud ettekirjutusena, et inimesed üldiselt ei tohiks kasutada X-d; Mida peaks juhtima meie "parim" käitumist (need on tõelised sneer jutumärgid), peaks teatud olukordades reguleerima kõigi meie käitumist, kogu aeg, kõigis olukordades, kõigil eesmärkidel. (Mis on märkimisväärne nüansi puudumine! Mis lahutus sotsiaalse elu komplekssetest tekstuuridest!)

Justkui see ei ole piisav, püstitab see hüsteeriliselt üht veelgi kiilu väidet, et X ei ole lihtsalt kasutatav; see pole lihtsalt sotsiaalse repertuaari osa. Kallis, see lihtsalt ei ole tehtud.

Aga kui see tõesti ei ole tehtud, ei ole ettekirjutusi vaja.

Ära ütle mulle, et pole sellist sõna. Parandage oma isiklikke eelarvamusi, kui soovite, ja kui teie meel on piisavalt avatud, võime me rääkida oma eelarvamuste (ja ka minu) alustest. Kuid ärge valeta mulle keele seisundist.

(Soovitame ka kaht muud suurepärast samalaadset keelt professorit Mark Lebermani Snoot? Bluck ja Stephen Fry's Keel.)

Selle kergelt filosoofilise vaatepunkti toetamine reaalmaailmas on 2011. aastal avaldatud paber Teadus, "Kultuuride kvantitatiivne analüüs, kasutades miljoneid digiteeritud raamatuid", milles analüüsitakse 5 195 769 raamatut (umbes 4% kõigist avaldatud raamatutest). Muuhulgas leidsid nad, et nende raamatute võrdlemisel OED-i ja Merriami-Websteri Unabridged Dictionaryiga, isegi siis, kui välistada õiged nimisõnad (mida need sõnastikud ei sisalda), on "suur osa meie sõnastikus olevatest sõnadest ( 63%) olid selles madalaima sagedusega prügikastis. Selle tulemusena leiame, et 52% inglise keele leksikonist - enamus ingliskeelsetel raamatutest kasutatavatest sõnadest - koosneb leksilisest "tumedast materjalist", mida dokumenteerimata ei ole standardviidetes. "

Sarnasel märkusel, et mitte ainult see, mis on sõna, vaid ka nõuetekohane kasutamine, jääb ka OED-i kaugemale sellest kleepimisest, öeldes üsna ausalt,

Oxfordi inglise sõnaraamat ei ole õige kasutamise arutleja, hoolimata sellest, et selle levinud maine on vastupidine.Sõnastik on mõeldud kirjeldavaks, mitte ettekirjutuslikuks. Teisisõnu tuleks selle sisu vaadelda kui inglise keele kasutamise objektiivset peegeldust, mitte subjektiivset kogumit "dos" ja "don'ts".

Lõppkokkuvõttes on keel endiselt arenev metsaline ja tõepoolest võib ükski tähtede kombinatsioon lugeda sõnaks, kui nimetatud kombinatsioonil on või on mõni tähendus; ja grammatilised konventsioonid on olemas teenima keel, mitte vastupidi.

Siin leidub vaid auväärne OED * ainult * umbes 600 000 kirjet, kusjuures enim leksikograafide hinnangul on tõenäoliselt umbes kaks korda suurem kui paljud ingliskeelsed sõnad. (Sellest hoolimata on palju arutelu sellepärast, et tegelikult loetakse seda eristatavaks sõnaks. Näiteks Websteri kolmas uus rahvusvaheline sõnastik loetletakse 12 erinevat sõna kirjutatud "postitus". Peale selle on ingliskeelse kõneleja poolt suures osas tundmatuid piirkondlikke slängi mõisteid, mida enamik sõnastikke kunagi enam ei sisalda. Selles kirjas on Wordnik, kes püüab dokumenteerida iga sõna, mis ingliskeelsel kujul esineb, olenemata dialektist või sellest, kuidas see sõna on ebaselge, on praegu peaaegu seitse miljonit unikaalset sissekannet!)

Olgu, nüüd oleme pannud paika panema populaarse mõtte, et sõnaraamatud on bastionid, mis loetakse sõnaks või mitte. Kui isegi OED ei sisalda iga sõna, siis mis on sõna jaoks vajalik, et muuta see inglise keele eristatavaks rekordiks?

Kaks sõna - pidev kasutamine.

Või tsiteerida OED-i nende üldisel meetodil:

OED vajab mitut sõltumatut näitu sõnas kasutatavast sõnast ja ka seda, et sõna on kasutatud mõistliku aja jooksul. Täpne ajavahemik ja näidete arv võivad olla erinevad: näiteks võib ühte sõna lisada ainult mõne näite tõestuseks, mis levib pikka aega, samas kui teine ​​võib koguda hoogu väga kiiresti, mille tulemuseks on lai piiratud aja jooksul. Otsime ka seda, et see sõna jõuaks üldise valuuta tasemele, kus seda kasutatakse eneseteadvustavalt eeldusel, et see on arusaadav: see tähendab, et me otsime näiteid sõna kasutamisest, millele pole kohe järgnenud seletust selle tähenduse kohta lugeja kasu. Meil on pidev ülevaade paljude sõnade kohta ja kui sõnaraamatud on sõnaraamatusse sisestatud, siis peetakse sõnu, mis ei ole veel kogutud piisavalt tõendeid, säilitada toimikus, nii et saaksime nende juurde pöörduda, kui ilmnevad täiendavad tõendid.

Tõendusmaterjali potentsiaalse uue sõna kasutamisest osutavad enamasti vabatahtlikud, kes panevad kõik ajakirjadest üle, et varjata teaduslikke ajakirju osana midagi, mida nimetatakse "lugemisprogrammiks", mis "värbab vabatahtlikke ja tasulisi lugejaid ning need lugejad annavad OED-i toimetajale hinnapakkumisi mis näitavad, kuidas sõnu kasutatakse. "

Need tsitaadid on üksikasjalikult kataloogitud ja kui need sisaldavad uut sõna või "olemasoleva sõna uus tähendus", ei ole redaktorid seda tuttavad, siis on see hõlpsasti ristviide teiste tsitaatidega, et näha, kas seda on vaja lisada sõnastik või uurida veelgi.

Kuna OED ülesandeks on anda "alalise rekord sõna" kohta selles keeles, kui sõna peetakse sõnaraamatu lisamiseks vajalikuks, nagu eespool märgitud, ei eemaldata seda kunagi, olenemata kas see hiljem kasutusest kõrvaldatakse või mitte.

Selle põhjendus on kahekordne - kõigepealt tuleb tagada, et OET jääb sama lähedale, kui on lõplikult sisestatud inglise keel, kui see on praktiliselt võimalik; teiseks, et tagada, et lugeja suudab kindlalt veenduda, et OED-is leidub suurel määral ajast, mis tahes sõna, mida nad ei tunne määratlust või tähendust. Tsiteerida OED-i veebisaiti: "Idee on see, et hämmingus lugeja, kellel on tundmatu sõna, näiteks 1920-ndate romaan, suudab OED-s sõna leida, isegi kui seda on viimase 50 aasta jooksul vähe kasutatud".

Kuigi imetlusväärne on selle pühendumise kõrvalmõju inglise keele üldise dokumenteerimisega, on see, et toimetajad võitlevad võlgu, et pidada kurssi, milles keelt areneb. Näiteks täielik Kolmas väljaanne OED-ist kuus oodatud järelmeetmeid Teine väljaanne, ei ole lõpule viidud kuni 2030. aastate lõpuni ja eeldatav tootmiskulud on ligikaudu 34 miljonit (ligikaudu 45 miljonit dollarit).

Idee sellest, kuidas hoolikalt aeglaselt on see protsess, on 2010 Kolmas väljaanne oli hinnanguliselt 28% täielik. Sel ajal töötasid sellel 21-aastaselt umbes 80 leksikograafi, mille juhtis John Simpson ...

Tegelikult jõudis Simpson 2013. aastal pensionile pärast 24 aastat OED3-s töötamist, kus peatoimetaja töötas seejärel 48-aastasele Michael Proffittile. Arvestades prognooside täitmist Kolmas väljaanne, Proffitt saab umbes 70-aastaseks saamiseni ja võib-olla ise pensionile jääda, selle lõpuleviimise ajaks.

Nii et jah Troonide mäng fännid, kui te arvate, et Throners on seda halvasti ootamas, kui järgmise sarja raamatut lõpetatakse, vabastage meie jaoks OEDersi mõte. (Kuigi vähemalt meie puhul on meil korrapäraselt avaldatud värskendused töös, kuna väikesed lõigud on valmis).

Nüüd, kuigi OED-i poliitika ei võimalda sõnastikust sõnu kunagi eemaldada, vabastavad nad lühendatud versioonid, mis sisaldavad nende tunde, mis peegeldavad samal ajal "elavat ingliskeelset keelt" või mõnes väljaandes mõnda väljaandest välja kirjutatud sõnade komplekti sobib antud vaatajaskonnale.

Sel eesmärgil eemaldatakse OED-i ja muudest sõnaraamatutest korrapäraselt lühendatud versioonide uuemate versioonide abil vananenud sõnad. Seda on ajalooliselt tehtud kulude ja suuruse praktilisuse huvides, kuigi digitaalajastul on see kiirelt murettekitav.

Kuid selleks, et illustreerida, kui suur osa sellest ajalooliselt esinevast probleemist on, arvesta Teine väljaanne OED, mis koosneb kummitavast 20 mahust ja ligikaudu 22 000 lehest; see on palju paberit, siduvat ja laevandust. Tarbijale selle komplekti lõppkulu on omakorda umbes 1100 dollarit. (Ja tuleb märkida, et Oxdi ülikooli pressi tegevjuhi Nigel Portwoodi sõnul ei ole OED kunagi isegi nende hindadega kasumit kasutanud, rääkimata 295-dollarist aastamaksust, kui soovitakse juurdepääsu online-digitaalsele väljaandele. )

Ilmselt on niisuguse tohutu füüsilise toote turg väga nišš, ja enamus nendel päevadel, kes kasutavad toodet, kasutavad digitaalset versiooni, kaasa arvatud end, kuna see on ülimalt hea uurimisvahend. (See on osaliselt miks lõpetatud palju kauem Kolmas väljaanne tõenäoliselt kunagi ei prindita.) Kuid lühikesed trükiseadised on endiselt mõnevõrra tavapäraselt kasutatavad, vähemalt praeguseks, nii et mõne võõrkeelse sisuga materjalide töötlemine on mõttekas ja lühendatud versioon, mis ei maksa nii palju kui lend Hawaii või võtke kogu raamaturiiber.

Niisiis, kuidas otsustada, millised sõnad ei tee nendes lühemates väljaannetes lõiku? Noh, see protsess erineb kirjastajast kirjastajale, kuigi tüüpiline meetod näib olevat lihtsalt eelmise väljaande läbimõõt, kus on hea peenike kamm, et otsida sõnu, mis ei ole enam üsna tavalised selles valdkonnas - loodetavasti leidub rohkem sõnu, mis on vastuvõetavad kui vaja lisada uusi sõnu, kuigi see tundub harva nii.

Näiteks Angus Stevenson, Oxford University Pressi sõnastikuprogrammi juht oli ülesandeks lõigata 200 sõna Lühike Oxfordi inglise sõnaraamat et teha tee ligikaudu 400 uuemale sõnale 2011. aastal. Selle saavutamiseks pidi ta sõnastikus kirjas ja vormingus ümber lükkama, et vältida liiga palju sõnade üleviimist suhteliselt populaarses kasutuses.

Collinsi sõnastiku toimetajad pidid tegema enam-vähem sama asja, kui nad eemaldasid oma 2008. aasta väljaandest umbes 2000 sõna, et anda võimalus uuematele sõnadele, mida tutvustavad kaasaegsed inglise keelt kõnelejad. Sõnastiku vanem toimetaja Cormac McKeown selgitas hiljem seda, et selle saavutamiseks: "Oleme kasutanud trükitähte, et proovida rohkem sisestada, kuid see on küllastumispunktis. Selle saavutamise ja loetavuse vahel on kompromiss. "

Kahjuks viib see paratamatult välja tuttavate, kuid mõnevõrra vananenud sõnade eemaldamiseni. Näiteks eespool nimetatud 12. väljaandes Lühike Oxford inglise sõnaraamat Kõige tähtsamate kannete seas oli "kassettmängija" nagu "mankini" kasuks (kuigi "kassettlint" jäi samaks, vastupidi sellele, mida öeldi paljudes kümnes uudistearuandes, millest me lugesime selle kohta).

See protsess võib muutuda väga vastuoluliseks, nagu näiteks juhtumi korral Oxford Junior Dictionary, kus nad otsustasid välja lõigatud umbes 50 sõnast loodusega seotud sõna, näiteks vabastatud ruumi, et lisada selliseid sõnu nagu "jututuba" ja "blog". Kuna viimased uued tehnoloogiad on võimaldanud kõigil, kellel on nende pahameeleplatvorm (ja meedias, kes armastab hea vastumeelsust, mis ümbritseb suurt kaubamärki klikkide jaoks, mida see toob), põhjustas loomulikult, et see tõi välja sõnade eemaldamise kohta väljakujunenud häbi kirjeldades "välist" maailma kasuks "interjöör, üksildane".

Loomulikult ei eemaldatud neid sõnu inglise keelt (ega tavakasutusest), vaid ainult Juuniine väljaanne sõnastikku, mis võiks sisaldada ainult 10 000 või rohkem OED-is leitud üle 600 000 kirjet. Lõpuks valisid toimetajad lihtsalt sõnad, mis kõige paremini peegeldavad neid, mida tänapäeval lapsed kõige sagedamini kasutavad või kokku puutuvad.

Nii et kokkuvõtteks käesoleva artikli alguses esitatud küsimusele, kui te ütlete teatud peamiste sõnastike, nagu OED-i täielikud väljaanded, lisades sellele sõna, ei eemaldata seda kunagi. Siiski, kui te ütlete sagedamini leitavate erinevate lühendatud sõnastike kohta, eemaldatakse sõnad alati, kui vastajad toimetajad otsustavad, et nad ei ole enam asjakohased kui teised sõnad, isegi kui mõnikord on need lõigatud sõnad suhteliselt sageli kasutusel ... Meie toomine et kõik, kui keegi teine ​​sellist sõnastikku loeb ja ütleb sulle sõna, mida te just kasutasite "ei ole sõna, sest see pole sõnastikus", on teil luba libistada neid peal * teadmistepagas ja siis viisakalt neile öelda, et ei ole see, kuidas sõnastikke või keeli töötavad ...

(* Täielik avalikustamine: me võib sellel teemal pisut liiga tundlik, kuna on avaldanud rohkem kui kuus miljonit sõna, mida loeb miljonid inimesed erinevatest inglise murdest inimestelt ... Teatud grammatika natsid või ma eelistan sellele maitsele nimetada "grammatika natside", erinevalt tavalisest pro sõnasõnad, mida me väga austame ja on enamasti äärmiselt abivalmid ja viisakad - rääkimata üldiselt tunduvalt paindlikuma keelega kui nende grammatika natside kolleegid - loomulikult on loomulikult loonud midagi sellist pidevalt avatud haavast sellel aastaid. Näiteks on "kõikvõimalik" sõna "kahjutu", inglise keelest vähemalt 13. sajandist, ja meil pole kavatsust selle ära kasutada - kui mitte mingil muul põhjusel kui mitte pettunud pisikest vaimust.;-))

Boonus faktid:

  • Erin McKean ei ole mitte ainult eristatav keeleteadlane, kellel on natuke nõrk, vaid ka Mckeani seaduse looja. "Kõikide teiste kõne või kirjade korrigeerimine sisaldab vähemalt ühte grammatilist, õigekirja või tüpograafilist viga."
  • 2008. aastal püüdsid Collinsi sõnastik, et püüda tähelepanu pöörata vananenud sõnade raskusele, kuulujutud ja avalikkust "võtma" arhailise sõna, et vältida selle langetamist selle aasta väljaande sõnastikust. Mõned vastuvõetamatumad sõnad, mis pääsevad lapsendamisele, on "niddering", mis tähendab "argpüks", "fusby", mis tähendab "rasva, lühike või kükitatav", "Vilipend" tähendab "põlguse raviks või lugupidamiseks", "threequel" tähendab " kolmas film, raamat, sündmus jms; teine ​​järge "ja" wittol ", mis tähendab" mees, kes talub oma naise truudust ".

Jäta Oma Kommentaar