Lingvisme

En blogg om språk – skrevet av lingvistikere

Archive for september 2008

En Sisyfosansk oppgave

with 2 comments

Jeg har alltid likt Animaniacs, og kom over dette klippet på youtube forleden dag:

Morsomt, men jeg klarer ikke la være å være en kjip festbæsjer. Tittelen på klippet er «All the words in the English language». En bedre tittel ville vært «all the words in an English dictionary». Hvorfor det? Rett og slett fordi ingen ordbok inneholder absolutt alle ordene i et språk. Det fins ordbøker med større og mindre utvalg, men å inkludere ALLE ord er en håpløst ambisiøs oppgave. Hvis en slik ordbok hadde eksistert, ville den vært uhorvelig diger. Kanskje ikke uendelig stor, men såpass at den absolutt ikke ville latt seg trykke i noe bokformat vi kjenner.

Hva skyldes dette? Med ett ord: produktivitet. Da snakker jeg ikke om den typen produktivitet man vanligvis mangler i dagene før man skal levere en oppgave, når FreeCell og minesveiper framstår som forlokkende og meningsfulle aktiviteter. Nei, jeg snakker om lingvistisk produktivitet, den egenskapen ved språk som gir oss muligheten til å si ting som ikke har blitt sagt før (noen vil hevde at dette er en ganske viktig egenskap, andre ser ikke ut til å benytte seg av den særlig mye). Poenget er i alle fall at ordene i et språk ikke er en fast mengde: vi er i stand til å benytte oss av mønstre for å lage nye ord etter hvert som vi får behov for dem, ved hjelp av forskjellige teknikker. En slik teknikk er affigering, der man setter et prefiks eller et suffiks på et ord. Ta et ord som snill. Et pent og pyntelig adjektiv. Legg til suffikset –het, og vi ender opp med substantivet snillhet. Gjenta med alle adjektiv du kan komme på, og vips har du dobbelt så mange ord som du hadde til å begynne med. Suffikset –het er relativt produktivt, det vil si at vi kan feste det på mange ord. Andre suffikser er mindre produktive, som –ne, som lager verb av visse adjektiver:

gul –> gulne
svart –> svartne
blå –> blåne

men ikke:

lilla –> *lillane
brun –> *brunne
(asterisken betyr at et ord ikke er mulig, det er ugrammatisk)

I tillegg til affigering som en kilde til nye ord, har mange språk muligheten til å lage sammensetninger, der to eller flere selvstendige ord settes sammen til ett. I norsk er denne prosessen ekstremt produktiv. For å bevise dette har jeg gått inn på vg.no og notert alle sammensetningene jeg ikke har hørt før:

pornoprins
nettpornoprins
forsvarsrot
spillmonster
uroby
flyporno
hockeystart
blåtungesmitte
gassbilregler
smugrøykeslåsskamp

Hører disse ordene hjemme i ei ordbok? Umiddelbart vil jeg si nei. Ordene er fullt ut forståelige på grunnlag av de enkelte ordene de er bygd opp av (og der man er usikker vil man ha konteksten til å hjelpe seg). Kun hvis et ord blir etablert, det vil si at det blir brukt av flere, over en viss tid, vil det kunne bli oppført i ordboka. Og ord som ikke brukes, vil forsvinne.

Reklamer

Written by Eli Anne

september 15, 2008 at 17:59

Publisert i ord, produktivitet

Nesten, men ikke helt

leave a comment »

Oversettelse er som tidligere nevnt vanskelig. Ikke bare skal man velge et ord som er leksikalsk riktig, men man bør også overveie å bruke et ord i samme register som man forsøker å oversette fra.

Written by Eli Anne

september 5, 2008 at 14:37

Publisert i grovt, oversettelse

Det er ikke ræger alt som lukter

with one comment

I et tidligere innlegg var jeg inne på snowclones, eller fru Blom-uttrykk som vi kan kalle dem på norsk — faste uttrykk der ett eller flere av ordene kan fylles ut med det som måtte behage taleren. Ofte kommer disse uttrykkene fra forskjellige former for populærkultur, selv om selve uttrykket kan overleve lenge etter at opphavet har sunket ned i glemselen. Fru Blom-uttrykket er selv et ypperlig eksempel på dette; det lever i beste velgående selv om lystspillet det opprinnelig kom fra er ukjent for de aller fleste.

Et uttrykk som (i alle fall for meg) fremdeles er lett å koble til sitt opphav, kommer fra Ringenes herre, og lød opprinnelig det er ikke gull alt som glimrer. Et google-søk gir oss følgende gullkorn:

  • Det er ikke fluer alt som flyr
  • det er ikke Google alt som glimrer.
  • det er ikke hyperaktivt alt som beveger seg
  • Det er ikke fett alt som glinser
  • Det er dessverre ikke lydløst alt som lukter.
  • det er ikke ost alt som smelter.
  • Det er ikke ræger alt som lukter

Sist men ikke minst:

  • Det er ikke rompehull alt som promper

Den foreløbig hypotetiske norske snowclones-databasen kommer i alle fall ikke til å mangle grove eksempler, takk og pris.

Written by Eli Anne

september 5, 2008 at 14:02

Publisert i snowclones

You should never buttume anything!

with one comment

Geoffrey Pullum posta på Language Log i går om det som refereres til som clbuttic idiocy. Hva slags idioti er det snakk om? La meg presentere noen setninger jeg har funnet på internettet:

  • Congratulations on your self-fulfilling buttumption.
  • Let me first explore its buttumption, and then consider its factual claims.
  • Please pardon this post if it came out sounding sbutty.
  • She was too clbutty for that sh*t and never belonged.
  • YOU made the buttertion thus the burden of proof is on YOU.
  • Good news for the Consbreastution on Australia Day.

Hva er det som foregår her? Den oppvakte leser har allerede skjønt det: overivrige leksikalske filtre, også kalt nanny-bots, har vært på ferde. Mange nettsider sensurerer automatisk ord som av ulike grunner oppfattes som grove, blant dem ass og tit, og bytter dem ut med mer «familievennlige» ord, i disse tilfellene butt og breast. Problemet oppstår når slike filtre ikke bare bytter ut tekststrenger som har mellomrom før og etter seg, men strenger med de aktuelle bokstavene som er del av andre, helt uskyldige ord.

Det fins mange eksempler på nettet, som man kan finne ved å ta et ord som inneholder en av de aktuelle tekststrengene, bytte den ut med sin mindre grove motpart, og bruke google. En god del av treffene er omtale av slike fenomener, ikke bruk av selve ordene, men også selve bruken av ordene er lett å finne fram til. En av mine favoritter er buttbuttinate (og den beslektede buttbuttination), som vi ser under. En klbuttiker!

  • [D]o the acts of the human plants validate buttbuttination and torture?
  • [W]hy did the Iraq regime try to buttbuttinate George Bush?

Les mer om the clbuttic mistake her.

Written by Eli Anne

september 3, 2008 at 09:28

Publisert i ord, sensur, wtf?

Destroyed in the translation

with 2 comments

Jeg kom over ei stilig nettside i dag (som jeg forøvrig la til i listen av linker på høyre side av bloggen). Lost in translation består av et program som lar deg taste inn ord, fraser og setninger, som den så oversetter til fem forskjellige språk, og tilbake til engelsk igjen, med en tur innom engelsk mellom hvert av de fem språkene. Frasen lost in translation ender for eksempel opp som destroyed in the translation. Prosessen er som følger:

English: Lost in translation

French: Détruit dans la traduction

English: Destroyed in the translation

German: Zerstört in der Übersetzung

English: Destroyed in the translation

Italian: Distrutto nella traduzione

English: Destroyed in the translation

Portuguese: Destruído na tradução

English: Destroyed in the translation

Spanish: Destruido en la traducción

English: Destroyed in the translation

Det er det første steget, fra engelsk til fransk, som er ansvarlig for forskjellen mellom den opprinnelige og den «ødelagte» frasen. Når frasen oversettes til fransk, kommer det inn en bestemt artikkel «la», som ikke er idiomatisk i engelsk. Valget av verbet détruit, som kan oversettes tilbake til engelsk «destroyed», er den andre tingen som gjør frasen uidiomatisk når den oversettes til engelsk igjen.

Språkene programmet sender frasene og setningene gjennom, er veldig like hverandre, noe som kan forklare hvorfor frasen over ikke led en verre skjebne enn den tross alt gjorde. Hva hvis vi i tillegg tvinger en uskyldig frase gjennom virkelig fremmede språk, som kinesisk, japansk og koreansk? Heldigvis for oss er dette en mulighet hos Lost in translation:

English Text:
Lost in translation

Japanese: 変換で失われる

English: It is lost with conversion

Chinese: 它丢失以转换

English: It loses converts

French: Il détruit des convertis

English: It destroys converted

German: Es zerstört umgewandelt

English: It destroys converted

Italian: Distrugge convertito

English: It destroys converted

Portuguese: Destrói convertido

English: It destroys converted

Spanish: Destruye convertido

English: It destroys turned

Her har det skjedd mye mer på veien enn da vi bare oversatte mellom nært beslekta språk – ingen overraskelse. Hvis vi prøver oss på en setning som can I have a cup of coffee?, får vi I can have a coffee cup? Sammensetning istedenfor den vanlige preposisjonsfrasen, og noe underlig ordstilling, men fullt forståelig for den velvillige. Med kinesisk, japansk og koreansk med på veien, blir setninga til I possibly make the examinación of the coffee?

Vi prøver oss til slutt på en litt lengre setning, et sitat fra Albert Einstein:


Only two things are infinite, the universe and human stupidity, and I’m not sure about the former.

Resultatet blir:

Only two citizens of infinites, are the empty person of the external
time from the layer to others are stupid, I were not emergency before
an interested party.


Written by Eli Anne

september 2, 2008 at 15:09

Publisert i maskinoversettelse