Posthümanist Uygulamalı Dilbilimde Dil Ölçme ve Değerlendirme

Tan Gedik & Başak Ağın

Bu yazı, Tan Gedik ve Başak Ağın’ın şu an üzerinde çalışmayı sürdürdükleri bir makalenin, daha açıkça belirtmek gerekirse posthümanist uygulamalı dilbilimin teorik altyapısı ve bunun yabancı dil öğretimine etkilerini ele alan ortak çalışmalarının ön gösterimi niteliğindedir.

Klasik dilbilim ile uygulamalı dilbilim bakış açıları arasında yadsınamaz bir bağlantı olduğu, bu bağlantılar ister teori ve pratikten, ister öğreti ve uygulamadan kaynaklansınlar, bu iki alanın aralarında kopmayan bir ilişki bulunduğu açıktır. Buradan hareketle, pek çok (uygulamalı) dilbilimci, doğru dil ölçme ve değerlendirme prosedürlerinin dili öğretirken etkili ve gerekli olduğunu savunmaktadır (aynı zamanda positive backwash effect olarak da bilinir, bkz. Hughes, 2003). Daha önceki yazılarımızdan da yola çıkacak olursak, Gedik’in (2020) de ifade ettiği gibi, klasik dilbilim anlayışı özetle pozitivist paradigmanın içinde takılı kalmış bir anlayıştır. Posthümanist bir bakış açısının dilbilime katabileceklerini düşünecek olursak, bu klasik yaklaşımı da aşmamızın gerekliliği aşikârdır. Bu sitedeki diğer yazılarımızda ve başka makalelerde (Gedik, 2020; Gedik & Arpaözü, yayın sürecinde) incelediğimiz üzere, posthümanist düşüncenin dil ölçme ve değerlendirme (DÖD) alanına da neler katabileceği önemli bir sorudur. Burada neden bir paradigma değişikliğine ihtiyaç duyulduğuna, öncelikle, klasik dilbilim ve DÖD gibi alanlardaki temel sorunlara eğilerek bakabiliriz.

Klasik dilbilim anlayışı pozitivist paradigma ile yoğrulduğuna göre, DÖD gibi uygulamalı bir alanın da klasik dilbilimden beslenirken bu paradigmadan izler taşıması olağandır. Bu izlerin ne gibi sorunlara yol açtığı konusuna değinmeden önce, yabancı dil olarak İngilizce öğretimine aşina olmayan okuyucularımız için, kısa bir bilgi vermek yerinde olacaktır. DÖD araçları ve teknikleri aslında öğrenicinin dili ne kadar bildiğini değil, öğretilen materyale puansal/istatistiksel bir oranla ne kadar hâkim olduğunu ölçer. Bu tekniklerden bazıları (özellikle değerlendirme) her ne kadar dili öğrenen kişiye kendini geliştirmesi için dönüt sağlamak üzere tasarlanmışsa da, pratikte kabul edilen tüm uygulamalarda bu araçlar mutlaka puansal/istatistiksel ölçüm birimleri taşımak zorundadır. Bunun bir örneği olarak bu paragrafın sonunda linkini bulabileceğiniz şablona bir göz atmanız önerilebilir. ODTÜ İngilizce Yeterlik Sınavı (English Proficiency Exam) için hazırlanan öğrencilerine destek olmak ve onların öğrenim çıktısı olarak ürettikleri paragrafları değerlendirmek amacıyla, Gedik’in, ODTÜ İngilizce Öğretmenliği Bölümü’nde henüz kendileri de öğrenci oldukları sıralarda Elif Genç ile birlikte hazırladıkları yazı değerlendirme ölçeği, DÖD içinde bulunan araçların bir yansımasını sunmaktadır. (Ölçeğin orijinal biçimini görmek için lütfen tıklayınız).

DÖD kapsamına giren ve benzer nitelik taşıyan neredeyse tüm araçlar, dilin her özelliğini ayrı ayrı ele alıp inceleyerek puanlandırabilmeyi amaç edinmişlerdir. Bu biçimiyle ele alındığında, DÖD’ün beşerî bilimler kapsamında değil de niceliğe dayalı çalışma yürüten, pozitivist bir bakış açısıyla harmanlanmış bir çalışma alanına benzediğini görmek mümkündür. Hatta tıpkı doğa bilimlerinde çalışan araştırmacılar gibi, DÖD çalışmaları yürüten kişinin üzerinde de beyaz bir laboratuvar önlüğü hayal edebilirsiniz. Nasıl ki bu önlüğün araştırmacıyı dış dünyadaki tüm etkenlerden ayırdığına, kişiye yüzde yüz objektivite kazandırdığına inanmışsak, DÖD kapsamındaki ölçeklerin de benzer bir işlev taşıdığına inanıyoruz. Oysa posthümanist kuramlar, özellikle de Karen Barad’ın eyleyici gerçekçilik kuramı, ölçek ve aygıtların nerede başlayıp araştırmacının kimliğinin nerede bittiğini tespit etmenin olanaksızlığından söz ederler.

Daha açıkça söyleyecek olursak, akademik kimliğiniz ile kişisel olarak sizi siz yapan detaylar, yaptığınız çalışmadan bağımsız değildir. Tıpkı o meşhur Stern ve Gerlach deneyinin Barad’cı posthümanist yorumlarında olduğu gibi, nasıl ki Stern’in içtiği ucuz puronun yaptığı çalışmaya etkisini gözlemlerken aslında bu ucuz puronun Stern’in ulusal, sınıfsal, cinsiyete dayalı kimliklerinden bağımsız olmadığını da anlıyorsak, DÖD araçlarına bakarken de birden fazla şeyi anlıyoruz: Bu araçlar, ne onları geliştiren araştırmacılardan, ne onları kullananların ulusal, sınıfsal, cinsiyete dayalı kimliklerinden, ne dili konuşan/yazan öğrencinin kimliği veya kimliklerinden, ne de bu unsurların her birinin içerisinde bulunan ve onları çevreleyen doğakültürlerden bağımsızdır.

Bir başka deyişle, dil, dış dünyadan soyutlanmış bir biçimde, nesnel araştırmaya tabi tutularak irdelenebilir ve her bir parçasına ayrılarak incelenebilir bir madde değildir. Gözlemlendiğinde davranış değiştiren atom altı parçacıklarını bir metafor olarak kullanacak olursak, dil üretim pratiklerinin de gözlemlendikçe davranış değiştirdiğini söyleyebiliriz. Dil öğrenen kişinin öğrenim çıktılarında tespit ettiğimiz sözcük seçkisinden tutun, kendini ifade etmek için kullandığı söz dizimine ve tonlamalara kadar her şey, hem üretim anındaki duygudurumu ve çevresel faktörlerle, hem de kendi anlam dünyası ile yakından ilişkilidir. Dışarıdan bir gözlemcinin ürettiği ve nesnellik iddiasındaki bir puanlama ölçeği de ancak tüm bu süreçleri göz önüne alırsa başarılı bir ölçek sayılabilir. Şu durumda, posthümanist bir bakış açısının elinin değmediği hiçbir DÖD aracını, ölçme ve değerlendirme konusunda yetkin, nesnel ve güvenilir saymamız mümkün olmayacaktır.

Bir başka deyişle, mevcut DÖD araçlarında var olduğu öne sürülen pozitivist objektivitenin aslında var ol(a)mayışı temel bir sorundur. Yabancı dil olarak İngilizce öğreten ve hepsi de benzer geçmişlere, benzer eğitimsel arka planlara sahip üç öğretim elemanının, yani bu yazıyı kaleme alan Başak Ağın ve Tan Gedik ile Gedik’in eş zamanlı eğitim yürüttüğü meslektaşı Elif Genç’in değerlendirme kriterleri, aynı ölçeği kullansalar ve standardizasyon prosedürlerinden geçseler dahi, birbirleriyle aynı olmayabilir. Örneğin Genç ve Gedik için bir öğrencinin gramer kısmından 6.0 alması için gerekli olan kriterler ile başka birinin (mesela Ağın’ın) ölçeğindeki kriterler değişebileceği gibi, aynı ölçeği kullanarak değerlendirme yapan başka öğretim elemanlarının da aynı kıstaslara ne kadar uyduğu/uyabildiği bir tartışma konusudur. Bunu açmak gerekirse, her dil öğretmeninin (veya dil öğrenen kişinin) dil öğrenme serüveni kendine has, tecrübelerine dayalı (Dabrowska, 2015; Divjak, 2019), yani bir diğer deyişle, kendi doğakültürlerine bağlı olduğu için, her ne kadar öğretim elemanları kıstasları ortak bir payda belirlemeye çalışsa da, onların doğakültürleri de bir şekilde onların beklentilerini değiştirip, kıstaslara uyamama durumları yaratabilir.

Dahası, bir bireyin X dili sınavından (örneğin İngilizce-TOEFL) en üst seviyedeki puanı alması onun her zaman günlük hayatta da aynı performansı gösterebileceği anlamına gelmemektedir. Çoğunlukla yaşanan şey, bireyin anlık performansının ölçülmesidir ki bu da bireyin o sınavdaki soru tiplerine ne kadar maruz kaldığı (yani ne kadar aşina olduğu) ve soruları beklenen hızda ve ölçekte yanıtlamaya ne kadar alışık olduğuyla ilgilidir.

DÖD’ün bir diğer sorunu da indirgemeci doğasıyla yakından ilgilidir. Evrensel bir DÖD olarak CEFR’ı baz alalım (Common European Framework of Reference). İngilizce için konuşacak olursak, A1’den başlayıp C2’ye kadar uzanan ve C2’de de bittiği savunulan bir yol haritasından bahsediyoruz. Burada ele alınması gereken iki unsur bulunmaktadır: i) CEFR’a göre kim, yani hangi anadil konuşucusu, C2 seviyesidir, ii) öğrenme gibi sürekli içten-etkime yaşanan (yani iç ve dış kabul ettiğimiz oysa birbirine dolanık pek çok faktörün rol oynadığı) bir aktivitenin nasıl sonu olabilir?

Özetle, aslında ideal “anadil konuşucusu” diye bir kavram yoktur ki bu da birinci sorunun yanıtını doğrudan vermektedir. Anadil konuşucusu dediğimiz kavram, yalnızca anlık (veya uzun soluklu) bir illüzyon veya varsayımdan oluşur. Kendi anadilimizde dahi bazen anlamını bilmediğimiz sözcüklerle karşılaşabilir, yöresel veya bölgesel farklılıklar nedeniyle değişen ifade ve deyimlere rastlayabilir, farklı aksan veya şiveleri (ya da ağızları) (bazen anlayabilir) bazen anlamayabiliriz. Karadeniz Bölgesi’nde doğup büyümüş birinin Ege Bölgesi’ne ait bir deyişi bilmemesinden daha doğal ne olabilir? O halde, CEFR temelinde düşünerek, bu kişilerden birinin C2 düzeyinde Türkçe bilmediğini öne sürebilir ve bu kişilerin anadil konuşucusu olmadıklarını savlayabilir miyiz?

Yine İngilizce örneğinden devam edelim. C2 olarak tanımlanan anadil konuşucuları sadece WEIRD (Henrich et al. 2010) diye adlandırdığımız gruptan kişiler midir? Bu gruptan olsalar dahi WEIRD kategorisinin hangi unsurunu anadil konuşucusunun standart dili olarak ele almalıyız? Örneğin bu kategoriye giren Britanya’yı ve içerisinde barındırdığı birden fazla etnik ve ulusal kimliği düşünelim. Standart olarak kabul gören biçimi “child” olan çocuk sözcüğü yerine “bairn[e]” diyen, oysa geri kalan tüm cümleleri söz dizimsel ve gramatik olarak İngilizceyle uyumlu olan bir İskoçyalının İngilizce bilmediğini ileri sürmek mümkün müdür? Biraz daha ileri gidecek olursak, gramer açısından doğru kabul edilen biçimi “this car needs to be washed” veya “this car needs washing” olan bir ifadeyi, “this car needs washed” biçiminde kullanan Pittsburgh’lünün Amerikalı olmadığını söyleyebilir miyiz? Bu kişilerin her birini C2 düzeyinde kabul etmek ya da etmemek— işte bütün mesele bu.  

İkinci sorun ise aslında dil öğrenme sürecinin asla bitmemesi ile alakalıdır. Posthümanist kuramlara göre içten-etkime sonsuz bir süreğenliktedir. İnsanlar ve insan-dışı bedenler (ki bunlar insanın hem içinde hem çevresindedir; insanın kendisini oluşturan kümelerin tamamı insan-dışı bedenlerdir), sürekli bir içten-etkime halindelerse, hem birbirine içten-etkiyen hem de dil ile sonsuz dolanıklıklara girerek bağlantısal bir biçimde var olan evrenler kümesinin sonlu olduğunu düşünmek zordur. Tüm bu dolanıklıklar yeni dilsel kullanımların ortaya çıkmasına olanak sağlayacağına, üstelik de öğrenme sürecimiz, yukarıda da belirttiğimiz üzere sürekli devam edeceğine göre, ölçeğin sonlandırılması mümkün değildir. CEFR’ın C2’de bittiğini öne sürdüğü nokta, aslında sonsuz bir C3’ler meclisidir.

Ölçmüyoruz, değerlendiriyoruz!

Posthümanist uygulamalı dilbilim (PUD), kendinden önce gelen DÖD araç ve ölçeklerini tamamen silmeyi veya bunları bir kenara kaldırıp yerine bambaşka bir yapı sunmayı amaçlamamaktadır. Bundan dolayı, gramer/kelime ve pek çok diğer mekanik şekilde (kurbağa gibi kesilip biçilip puanlanabilecek) ölçülebilecek alanların ölçümlerinden çıkan sonuçlar da önem taşır. Bunlar, hem öğrenciye hem de öğretmene önemli bilgiler sunmaktadır. Ancak, PUD, DÖD’e yeni bir yol açmakla birlikte, dil öğrenme sürecine gerçekten DÖD’ün ilk amaçladığı şekilde, öğrenciye gerçekten dönüt vermeyi hedefler. Onların dil süreçlerini sürekli olarak kesip biçip puanlandırmak amacıyla değil yardımcı olabilmek amacıyla hareket eder.

Teori ve pratiği birleştirecek olursak, aslında PUD bakış açısıyla beslenen DÖD araçlarının temelinde difraktif okuma tekniği ve öğrenciyle bir olma (becoming-with) yatmaktadır. Bu süreçler sayesinde ise hem öğrencilerin hem de kendimizin doğakültürlerini kaynaştırabiliriz. Bu tekniği teoride dilin dört ana yeteneğine (okuma, dinleme, yazma, konuşma) uygulayabileceğimizi düşünsek de henüz üzerinde yürüttüğümüz çalışmalar net bir veri sağlamadığı için, hiçbir zaman tek bir doğru yanıtın olmadığı açık uçlu soru yanıtlama biçimlerine ve yazma becerisine değinerek bir örnek verebiliriz.

Bir öğretmen, belli bir düzeydeki öğrencilerine bir yazma ödevi verdiğinde, her ne kadar bu yazının tek bir doğru yanıtı, yani kıstaslar üstü ve mükemmel bir modeli bulunmasa da, kafasında (veya hatta yazılı olarak elinde) beklentilerini gösteren örnek bir şablon yazı bulunur (sample paragraph). Bu yazı, öğretmenin ölçeğinde yine aynı öğretmenin kıstaslarına göre tam puan almış bir yazıdır. Normal şartlar altında, öğretmen, öğrencilerin yazılarını, kendi kafasındaki şablon yazıya göre değil, kendisine önceden bağlı olduğu kurumca geliştirilip sunulmuş veya duruma göre kendisinin hazırladığı bir değerlendirme ölçeği ışığında okur ve puanlar. Ancak yukarıda bahsettiğimiz nedenlerle ölçeğin her zaman güvenilirliği bulun(a)madığı için, PUD açısından önereceğimiz yöntem kırınımsaldır. Bunun için birinci çıkar yol, aynı öğrenim çıktısını birden fazla ölçek ışığında okumak ve değerlendirmek, çıkan sonuçları karşılıklı birbirine ayna tutacak biçimde ele almak ve buradan çıkan sonuçlarla öğrenciye dönüt vermektir. Bir başka deyişle, iki ya da daha fazla ölçeğin, her birinin kriter olarak belirlediği ortak ve farklı noktalara bakılarak öğrencinin hangi alanlarda gelişmeye ihtiyaç duyduğu sabit bir puanlama veya istatistiksel veri olmadan da yapılabilir; böyle bir değerlendirme, uzun vadede öğrencinin portföyü içerisinden seçilen yazıların aynı ölçeklerle tekrar okunması yoluyla nesnelleştirilebilir.

Bu okumalar sırasında açığa çıkan benzerlik ve farklılıklar değerlendirme açısından önem taşımaktadır çünkü okumalar, aslında Barad’ın ‘agential cut’ yani eyleyici kesik olarak ifade ettiği kesitlere odaklanmakta, dilin merkeze alınmış sabit ve insan-odaklı bir değer olarak değil, eyleyicilerden biri olarak ele alınmasına yardımcı olmaktadır. Burada dilin evrendeki diğer tüm eyleyicilerle iş birliğine ve buradan iç ve dış dünyalar arasındaki geçişliliğine önem veren bir değerlendirme söz konusudur.

Bu kesitler bizlere yazarların o sırada anlam üretirken hangi eyleyicilerden, o anlamı yaratırken hangi doğakültürlerin yazar(lar)ın yazma sürecinde aktif olduğunu gösterecektir. Aynı zamanda, bu okuma sayesinde okuyucu/DÖD yapan kişinin de incelemesi sırasında hangi doğakültürlerin bu kesitlerle içten-etkimeye girdiğini görebiliriz. Böylece, pozitivist düzlemden daha farklı, bizim de ‘birlikte-olduğumuz’ ve sorumluluğunu üstlenebileceğimiz (hem DÖD yapan kişi hem de öğrenciler) bir objektivite içinde buluruz kendimizi.

İkinci çıkar yol ise, diyaloğa dayalı bir difraktif okumadır. Burada, öğrenci ve öğretmen bir iletişim halinde bulunmalı birbiriyle alışveriş ve etkileşim kanalları açık şekilde konuşmalıdır. Yapılacak şey, öğrenciden kendi yazdığı öğrenim çıktısı ile, öğretmenin şablon yazısını karşılaştırmasını istemektir. Bu kırınımın boyutları genişletilebilir; öğrenciden birden fazla farklı şablon yazıya bakması, mümkünse diğer öğrencilerin öğrenim çıktılarını da kullanması, böylelikle kendi üretim çıktısı ile diğer (standarda göre iyi veya kötü olması farketmeksizin) çıktılar arasındaki benzerlik ve farklılıkları tespit etmesi beklenir. Bu diyaloğun sonucunda hedeflenen amaç öğrenciye herhangi bir puan vermek değildir (farklı yazılımlar kullanılıp yazının gramer/kelime gibi envanter oranları incelenebilir, bkz. TTR seviyesi, L2SCA gibi[1]); öğrenciyle bir olup, onunla ortak bir payda oluşturmaktır. Burada yazıdaki anlam yaratma süreçleri hangi doğakültürlerden etkilenmiş, hangisi daha kabul edilebilir veya edilemez gibi tartışmalar yer alabilir. Bu gibi etkileşimlerin sonucunda oluşacak portföy, posthümanist bir düzlemde yarattığımız ortak paydanın ve kat edilen yolun, ek olarak da sorumluluğunu üstlendiğimiz objektivitenin bir dolaşıklığı olacaktır.

Dil öğrenimi gerçekten de ‘embodied’ (bedenlerimize ilişik) bir tecrübe ise, doğakültürlerin dilin anlam yaratımında ve edinimindeki rolünü, daha doğrusu bunların birbiri ile iç içe geçmişliğini görmezden gelmek imkânsızdır. Bundan dolayı, ortak payda yaratma süreci her zaman yarı yarıya (öğretmen ve öğrenci de eşit katkı sağlar) gibi gitmeyebilir. Yarattığımız anlamlardaki dolaşıklıklara ve kesitlere baktıkça, sorumluluğunu aldığımız bir objektivitenin içerisinde belki de DÖD’ün en başından beri yapmayı amaçladığı şeyi daha net ve gelişmiş şekilde yapabiliriz: Öğrencilerin dil gelişimi konusunda yardımcı olabilmek.

Referanslar

Dąbrowska, E. (2015). What exactly is Universal Grammar, and has anyone seen it?. Frontiers in psychology6, 852.

Divjak, D. (2019). Frequency in language: memory, attention and learning. Cambridge University Press.

Gedik, T. A. (2020). Posthümanist Uygulamalı Dilbilim Bakış Açısının Dil Öğretmenliği Programlarında Gerekliliği. Pasajlar: Posthümanizm Özel Sayısı. 199-214.

Gedik, T. A. & Arpaözü, Z. (yayın aşamasında). Entangled Humans, Entangled Languages: A Citizen Sociolinguistics Analysis of COVID-19. Posthuman Pathogenesis: Contagion in Literature, Arts, and Media, B. Ağın ve Ş. Horzum (Editörler). Brill, Critical Posthumanism Series (derleme kitap).

Goldberg, A. E. (2013). Constructionist approaches. The Oxford handbook of construction grammar1.

Henrich, J., Heine, S. J., & Norenzayan, A. (2010). The weirdest people in the world?. Behavioral and brain sciences, 33(2-3), 61-83.

Hughes, A. (2003). Testing for language teachers. Ernst Klett Sprachen.

Lu, X. (2010). Automatic analysis of syntactic complexity in second language writing. International Journal of Corpus Linguistics, 15 (4): 474-496.


[1] Bu tarz araçlar bir yazının gramatik anlamda ne kadar gelişmiş/kompleks olduğunu ölçmede kullanılabilirken, aynı zamanda da bir öğrencinin ne kadar dil yeterliliğine sahip olduğunu anlamada da kullanılabilir (Lu, 2010).

Bir Cevap Yazın