Kian Hooshmand ve Ajay Raj
Kian Hooshmand ve Ajay Raj, açık kaynaklı sesli yapay zeka altyapısı sunan Vocode şirketinin kurucularıdır. İnsan-bilgisayar sesli iletişimini kusursuz algoritmalarla dönüştürmektedirler.
Kian Hooshmand ve Ajay Raj, yapay zekanın sadece metin tabanlı bir araç olmaktan çıkıp tıpkı bir insan gibi duraksamalarla, nefes alışlarla ve doğru tonlamalarla gerçek zamanlı sesli iletişim kurabilmesini sağlayan, açık kaynaklı (open-source) sesli yapay zeka çerçevesi Vocode şirketinin kurucu ortaklarıdır. Telefon görüşmelerini, müşteri hizmetlerini ve toplantı asistanlarını insanlardan ayırt edilemeyecek bir akıcılığa kavuşturan bu dâhi mühendisler, karmaşık yapay zeka modellerini sadece 10 satır kodla yazılımcıların kullanımına sunarak insan-bilgisayar etkileşiminin kurallarını kökünden baştan yaratmaktadır.
Brex Yılları, UC Berkeley ve Ses Teknolojilerinin Zorluğu
Kaliforniya Üniversitesi, Berkeley'de (UC Berkeley) eğitim alırken teknoloji dünyasının yüksek tempolu ekosistemine dahil olan Kian Hooshmand, kariyerinin ilk dönemlerinde milyarlarca dolarlık finansal teknoloji devi Brex bünyesinde çalışarak kurumsal düzeyde (enterprise-grade) yazılım mimarilerinin nasıl ölçeklendirileceğini derinlemesine öğrenmiştir. Ajay Raj ile bir araya geldiklerinde, büyük dil modellerinin (LLM) inanılmaz derecede akıllandığını ancak bu modelleri sese dönüştürmenin hala bir kabus olduğunu analiz etmişlerdir. Gerçekçi bir sesli yapay zeka yapmak için sesi metne çeviren (STT), metni algılayıp cevap üreten (LLM) ve cevabı tekrar sese dönüştüren (TTS) üç farklı devasa motorun milisaniyeler içinde ve birbiriyle eşzamanlı çalışması gerekiyordu. İnsanlar konuşurken araya girdiğinde veya lafı böldüğünde (interruption) sistemler çöküyordu. Bu devasa darboğazı çözmek için 2023 yılında San Francisco'da Vocode girişimini kurmuşlardır.
Y Combinator ve Vocode Mimarisinin Kurulması
Hooshmand ve Raj, bu karmaşık senkronizasyon problemini çözen açık kaynaklı bir "orkestrasyon" (orchestration) altyapısı tasarlamıştır. Geliştiricilerin saniyeler içinde hiper-gerçekçi sesli ajanlar (Voice Agents) oluşturmasını sağlayan bu platform, teknoloji dünyasında inanılmaz bir viral başarı yakalamıştır. Bu eşsiz mühendislik çözümü, dünyanın en prestijli kuluçka merkezi olan Y Combinator'ın (YC) 2023 Kış (W23) programına kabul edilmelerini sağlamıştır.
Accel Yatırımı ve Geleceğin Sesli Otoyolu
Accel, AngelList ve Kindred Ventures gibi dev kurumlardan milyonlarca dolar tohum (seed) yatırımı alan ve açık kaynak vizyonuyla on binlerce yazılımcının güvenini kazanan Kian Hooshmand ve Ajay Raj, cihazlarla konuştuğumuz dijital geleceğin sesli altyapısını sarsılmaz bir mühendislik felsefesiyle yeniden inşa etmektedir.