24 Aralık 2024 Salı English Abone Ol Giriş Yap

Katalog

Teknoloji 3CBT 1449/26 Aralık 2014 Bilgisayarlarla anında sesli çeviri gerçek oluyor! Yaşamımızın pek çok alanında bu teknolojileri kullanıyor olacağız; çok uluslu ortamdaki iş hayatında, eğitimde ve özellikle yabancı dil öğrenmede, tıpta, turizmde, çok dilli toplum ve ailelerde, internette yabancı dilde haber, belge ve video izlemek, görsellere anında ve otomatik altyazı eklemek için, görme ve işitme engelilerin yaşamlarına, yazıyı söze ve sözü yazıya çevirip büyük destek sağlayarak... Daha ilk aşamada bile akla gelenler baş döndürücü. Erdal Musoğlu (emusoglu@gmail.com) 2014 ün aralık ayında, Microsoft, hemen hepimizin bildiği ve kullandığı Skype uygulamasına gerçek zamanlı çeviri olanağı ekledi. Halen yalnızca İngilizceİspanyolca arasında tercüme yapabilen ‘Skype Translator’ uzantısının ilk denemeleri çok umut verici. Uzay yolu türü bilim kurgu filmlerinde gördüğümüz uygulamaların, bilgisayarlarla, makinelerle, robotlarla doğal dille konuşabilmenin yanında, çok daha önemlisi, birbirlerinin dilini bilmeyen insanların, akıllı telefonları aracılığı ile, konuşmalarının kapısı açılıyor. (1) Bilgisayarla konuşma tanıma ve konuşma sentezi (speech recognition & synthesis), üzerinde on yıllardır çalışılan bir konu. Kolayca tahmin edilebileceği gibi de işin en zor kısmı konuşmayı tanıyabilmek. Tabii, bununla, sesleri, kelimeleri ve cümleleri bilişimi (health informatics) çerçevesinde, AB de, tıbbi raporlama amaçlı konuşma tanıma sistemleri üzerinde epey çalıştım. Bu uygulamalar aracılığı ile, tıbbi görüntüleme, patoloji, acil tıp gibi dalların uzmanı hekimler, raporlarını bilgisayara dikte etmekte ve konuşmaları o anda yazıya çevrilerek önlerindeki ekranda görüntülenmekte, doktorun kontrol ettiği ve onayladığı raporlar da anında yerine iletilmekte. Başlangıçta bu tür uygulamalar, kullanıcının, epey uğraşarak, sisteme sesini ve konuşmasını tanıtmasını gerektiriyordu. Yani bilgisayarın önüne oturup hemen konuşmaya başlamak olası değildi. Ayrıca, konuşma tanıma, ancak kelime sayısı sınırlı özel alanlarda sonuç verebiliyordu. Özetle, klasik bilişim yöntemleri ve teknolojileri ile alınan sonuçlar pek iç açıcı değildi. Günümüzde ise, geçen yazılarımızda değindiğimiz, sinir ağları ve derin öğrenim (neural networks, deep learning) teknolojileri ile bu sınırlar hızla aşılmakta. tanıma denilmek isteniyor, konuşmanın içeriğini anlama değil. Henüz bundan çok uzağız! Hedeflenen, bilgisayarın, karşısında konuşan bir insanın söylediklerini yazıya dökmesi. Konuşma yazıya çevrildiği anda da, onu saklamak, iletmek ve işlemek mümkün oluyor. Bunun sonucunda da, konuşanın söylediklerinin karşısındaki ekranda yazılı olarak çıkması, bir başkasına iletilmesi, bilgisayara çeşitli komutlar vermek için kullanılması, bir tercüme programı aracılığı ile başka bir dile çevrilmesi ve yazıyı konuşmaya dönüştüren bir ses sentezi sistemi aracılığı ile aynı ya da başka bir dilde bilgisayar tarafından söze dökülmesi mümkün oluyor. (2) UZUN YILLARIN ÇABASI Konuşma tanıma ve üretme teknolojileri üzerinde araştırmalar 1980’li yıllarda başladı. Ben de, uzmanlık alanım olan sağlık BÜYÜK YARIŞ BAŞLADI Son yıllarda bütün büyük bilişim firmaları, bu dalın müthiş potansiyelinden dolayı, birbiri ardına konuşma tanıma ürünleri geliştirmekteler. Apple’ın SİRİ ve Google’un NOW adlı ses tanıma ve arama asistanlarına paralel olarak, bu dala en uzun süredir yatırım yapmış olan Microsoft da, bu yıl, Cortana adlı asistanının benzer yeteneklerini duyurdu. Son olarak, Çin’in Google’ı diyebileceğimiz Baidu firması da yapay zeka ve konuşma tanıma alanına ciddi bir giriş yaptı (3). Bazıları, bu gelişmelere, Konuşma Tanıma 2.0 (Voice Recognition 2.0) diyorlar. Microsoft’un 2011 yılında 8.5 milyar dolara satın aldığı Skype’a eklediği bu yeteneğin, yukarıda sözünü ettiğimiz diğer firmaların da bu daldaki çaışmalarını ivmelendireceği kuşkusuz Bu büyük ilgi ve çaba tabii ki sebepsiz değil. Bir yandan, devrim yaratıcı bir uygulama alanı ve yepyeni bir pazar açılıyor, diğer yandan, geliştirilen yapay zekâ teknolojileri, görüntü tanıma (pattern recognition) gibi uygulamalar aracılığı ile, hızla gelişen bir diğer dal olan görüntü işleme ve tanıma alanına da uygulanabilecekler. Microsoft, Skype yazılımına eklediği anında sesli tercüme özelliğini, hızla diğer diller için de hazır edeceğini vurguluyor, ayrıca Skype ile anında kısa mesaj gönderme özelliğinin de artık 40 dan fazla dile çeviri yapabildiğini belirtiyor. Sistem, bilgisayara hiçbir ön tanıtma ve eğitim verilmesini gerektirmeden, kullanıcının sesini ve konuşmasını tanıyor, analiz ediyor ve ekranda yazıyor. Ardından bu yazı tercüme edileceği dile dönüştürülerek, Skype’da görüntülü olarak konuştuğumuz kişinin ekranında, kendi dilinde çıkıyor ve aynı anda da, ses sentezleyici bir uygulama aracılığı ile ses (konuşmaya) dönüştürülüyor. Görüldüğü gibi, yapılan işlemlerin herbiri kendi başına birer teknoloji başyapıtı ve hepsinin bir arada, elimizdeki bir telefon ya da tabletten kullanılabilmeleri olağanüstü bir başarı. Ses ve konuşma tanıma, bilgisayarlı tercüme, ses sentezi, öğrenen makineler ve bulut bilişim teknolojierinin hepsi bir arada ve neredeyse gerçek zamanlı (real time) olarak kullanılıyorlar! Skype’daki uygulama ayrıca sesinizi, şivenizi ve sıkça kullandığınız kelimeleri öğrenerek giderek daha hatasız çeviriler yapıyor. UYGULAMA ALANLARI SAYMAKLA BİTMİYOR Gerek sesli çeviri, gerek konuşmayı yazıya ya da yazıyı konuşmaya dönüştürme ve bunu aynı ya da farklı dillerde, anında ve karşılıklı yapabilme gerçekten çığır açıcı nitelikte bir gelişme. Bilişim ve iletişim endüstrilerinin baş aktörlerinin bu dala verdikleri önem ve sürdürdükleri yoğun çabalara ve almaya baş ladıkları sonuçlara bakılırsa yakında tam anlamı ile kullanılır hale gelebilecek. O zaman da yaşamımızın pek çok alanında bu teknolojileri kullanıyor olacağız; çok uluslu ortamdaki iş hayatında, eğitimde ve özellikle yabancı dil öğrenmede, tıpta, turizmde, çok dilli toplum ve ailelerde, internette yabancı dilde haber, belge ve video izlemek, görsellere anında ve otomatik altyazı eklemek için, görme ve işitme engelilerin yaşamlarına, yazıyı söze ve sözü yazıya çevirip büyük destek sağlayarak... Daha ilk aşamada bile akla gelenler baş döndürücü. Son olarak, her teknolojik sıçramada olduğu gibi, konuşma tanıma ve çeviri sistemlerinin de, günlük kullanıma girdiklerinde, önemli toplumsal değişikliklere yol açacaklarını ve birçok alanda çalışan kişilerin işleri için önemli bir tehdit oluşturacaklarını da vurgulayalım. Ayda bir yayımlanan yazılarımız kapsamında, genel anlamıyla otomasyonun istihdama ve toplumdaki (zaten hiç de adil olmayan..) gelir dağılımına karşı oluşturduğu tehditleri ve önde gelen ekonomistlerin önerilerini de inceleyeceğiz. Kaynaklar: 1http://www.skype.com/en/translatorprevi ew/ 2 http://en.wikipedia.org/wiki/Speechrecog nition hsayısına göre bilimcilerin başarı listesine 12 kişi daha Dergimizin önceki sayılarında yayımladığımız h değerini dikkate alan başarı listelerimize erkek ve kadın 12 bilim insanımız daha eklendi.. Artık toplantılarda ve takdimlerde konuşmacılar h sayısı da verilir oldu. Yayın yapanın Adı Tayfun Tezduyar E. Murat Tuzcu Kemal Kazan Hakan F. Öztop Betül Demirci Murat Akova Erdal Karapınar İsmail Hakkı Ulus Süleyman Akman Nilhan KayamanApohan Nurhayat Tabanca Mine Kürkçüoglu Bilim Dalı Mak MABD TıpABD BioAvustralya Makine M Ecza Tıp Matematik Tıp Kimya Kimya Ecza Ecza Toplam yayın sayısı 260 580 91 166 244 98 197 89 91 92 104 118 En çok atıf alan 3 yayına atıf sayısı Toplam AtıfSelf dışı atıf h Değeri 410397352 93355347 13231221991 1689416050 55 51 796411358 321132106 908063 149105104 48344531 21401777 21251943 1751691 32 24 24 22 1016759 1476543 624442 806054 904137 1456158 1447859 1257953 1131953 1137995 891777 10881051 21 21 20 20 17 17
Abone Ol Giriş Yap
Anasayfa Abonelik Paketleri Yayınlar Yardım İletişim English
x
Aşağıdaki yayınlardan bul
Tümünü seç
|
Tümünü temizle
Aşağıdaki tarih aralığında yayınlanmış makaleleri bul
Aşağıdaki yöntemler yoluyla kelimeleri içeren makaleleri bul
ve ve
ve ve
Temizle