Speech Recognation adalah suatu sistem mengidentifikasi
seseorang dari suaranya. Voice Recognition/Verivication mengidentifikasi
siapa yang berbicara, sedangkan Speech Recognition karena mengidentifikasi apa yang diucapkannya.
Alat pengenal ucapan, sering disebut speech recognizer, membutuhkan
sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan
didigitalisasi, disimpan dalam komputer, dan kemudian digunakan sebagai
basis data dalam mencocokkan kata yang diucapkan selanjutnya. Sebagian
besar alat pengenal ucapan sifatnya masih tergantung kepada pengeras
suara. Alat ini hanya dapat mengenal kata yang diucapkan dari satu atau
dua orang saja dan hanya bisa mengenal kata-kata terpisah, yaitu
kata-kata yang dalam penyampaiannya terdapat jeda antar kata. Hanya
sebagian kecil dari peralatan yang menggunakan teknologi ini yang
sifatnya tidak tergantung pada pengeras suara. Alat ini sudah dapat
mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenal
kata-kata kontinu, atau kata-kata yang dalam penyampaiannya tidak
terdapat jeda antar kata.
1. latar belakang
Alat pengenal ucapan banyak digunakan dalam bidang kesehatan untuk
membantu para penyandang cacat dalam beraktivitas. Contohnya pada
aplikasi Antarmuka Suara Pengguna atau Voice User Interface (VUI) yang
menggunakan teknologi pengenal ucapan dimana pengendalian saklar lampu
misalnya, tidak perlu dilakukan secara manual dengan menggerakkan saklar
tetapi cukup dengan mengeluarkan perintah dalam bentuk ucapan sebagai
saklarnya. Metode ini membantu manusia yang secara fisik tidak dapat
menggerakkan saklar karena cacat pada tangan misalnya. Penerapan VUI ini
tidak hanya untuk lampu saja tapi bisa juga untuk aplikasi-aplikasi
kontrol yang lain.
2. TEKNOLOGI KOMUNIKASI
Voice User Interface (VUI) adalah suatu metode komunikasi
antara komputer dengan manusia dengan menggunakan suara[6]. VUI ini
merupakan pengembangan dari Graphical User Interface (GUI) yang menggunakan visualisasi gambar atau tulisan untuk berkomunikasi antara komputer dengan manusia.
Aplikasi Voice User Interface bukanlah aplikasi yang berdiri
sendiri. Aplikasi VUI tersusun atas eknologiteknologi lainnya yang
memungkinkan aplikasi ini berjalan sebagaimana mestinya.
Teknologi-teknologi yang mendasari Aplikasi VUI ini adalah :
1. Natural Language Processing (NLP).
2. Automatic Speech Recognition (ASR).
3. Speech Synthesis.
4. Object Linking and Embedding (OLE).
5. Windows Application Programming Interface (API).
3. Prinsip Kerja Aplikasi VUI
Prinsip kerja secara umum dari Aplikasi Voice User Interface adalah Aplikasi VUI ini akan mendengarkan perintah dari user dan kemudian memberikan respon sesuai dengan perintah yang diberikan. Proses pengenalan suara user dilakukan oleh Speech Recognizer yang berada di dalam Speech API, kemudian Speech Recognizer memberikan kata atau kalimat yang diucapkan user kepada
Aplikasi VUI dalam bentuk teks. Teks tersebutlah yang diproses oleh
Aplikasi VUI untuk menentukan respon apa yang akan dilakukan atas
perintah yang diberikan oleh user.
Aplikasi VUI ini juga dapat memberikan pesan atau respon berupa
suara, hal ini dilakukan Aplikasi VUI dengan cara memberikan kata atau
kalimat yang akan disuarakan kepada Speech Synthesizer yang berada di dalam Speech API. Proses selanjutnya Speech Synthesizer akan mensintesis suara sesuai dengan kata atau kalimat yang diberikan kepadanya.
3. ALGORITMA YANG DIGUNAKAN
Windows Application Programming Interface (API)
Windows Application Programming Interface (API) adalah sekumpulan fungsi dan konstanta yang
terdapat dalam file-file DLL yang menyusun Sistem Operasi Windows[14]. Karena terdapat dalam file library (DLL) maka fungsi-fungsi dan konstantakonstanta tersebut dapat digunakan oleh aplikasi atau library lainnya. Windows API biasanya disusun dalam bahasa pemrograman C/C++. Bahasa C dipilih karena kecepatan dan kedekatannya dengan hardware.
Windows menyediakan banyak sekali API yang memiliki fungsi berbedabeda.
Berikut ini adalah beberapa API yang disediakan oleh Sistem Operasi
Windows :
1. Win32 API,
API yang disediakan Windows untuk melakukan pemrograman Windows
secara umum. Fungsi-fungsi yang terdapat dalam Win32 API ini sangat
lengkap mulai dari menu, button, window,
eksekusi program dan lain-lain.
2. Telephony API (TAPI),
API yang digunakan untuk melakukan fungsifungsi telephony dengan menggunakan Sistem Operasi Windows.
3. Messaging API (MAPI),
API yang digunakan untuk melakukan pengiriman pesan (termasuk pengiriman email) dengan menggunakan Sistem Operasi Windows.
4. Speech API (SAPI),
API yang disediakan Windows untuk menambahkan fungsi speech ke dalam aplikasi yang berjalan di atas Sistem Operasi Windows.
5. Cryptography API,
API untuk melakukan fungsi-fungsi enkripsi dan dekripsi. Banyak sekali metode enkripsi/dekripsi yang disediakan oleh cryptography API ini.
6. dan masih banyak API lainnya (termasuk yang tidak didokumentasikan
oleh Microsoft). Seperti telah disinggung sebelumnya bahwa API
sebenarnya hanyalah sebuah fungsi. Seperti halnya fungsi-fungsi lainnya,
fungsi tersebut dapat memiliki parameter-parameter dan dapat
mengembalikan nilai. Bedanya hanyalah fungsi-fungsi tersebut ditulis
dalam bahasa C/C++ sehingga bagi yang belum familiar dengan bahasa
C/C++ biasanya akan mengalami kesulitan.
http://diazup.blogspot.com/2010/11/speech-recognition.html
http://contohprogramsourcecodemetodealgoritma.com/2011/10/14/perancangan-aplikasi-voice-user-interface-dengan-menggunakan-microsoft-speech-api/
Tidak ada komentar:
Posting Komentar