Sabtu, 12 November 2011

VOICE RECOGNITION

Speech Recognation adalah suatu sistem mengidentifikasi seseorang dari suaranya. Voice Recognition/Verivication mengidentifikasi siapa yang berbicara, sedangkan Speech Recognition karena mengidentifikasi apa yang diucapkannya.

Alat pengenal ucapan, sering disebut speech recognizer, membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalam komputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang diucapkan selanjutnya. Sebagian besar alat pengenal ucapan sifatnya masih tergantung kepada pengeras suara. Alat ini hanya dapat mengenal kata yang diucapkan dari satu atau dua orang saja dan hanya bisa mengenal kata-kata terpisah, yaitu kata-kata yang dalam penyampaiannya terdapat jeda antar kata. Hanya sebagian kecil dari peralatan yang menggunakan teknologi ini yang sifatnya tidak tergantung pada pengeras suara. Alat ini sudah dapat mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenal kata-kata kontinu, atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar kata.
 1. latar belakang

Alat pengenal ucapan banyak digunakan dalam bidang kesehatan untuk membantu para penyandang cacat dalam beraktivitas. Contohnya pada aplikasi Antarmuka Suara Pengguna atau Voice User Interface (VUI) yang menggunakan teknologi pengenal ucapan dimana pengendalian saklar lampu misalnya, tidak perlu dilakukan secara manual dengan menggerakkan saklar tetapi cukup dengan mengeluarkan perintah dalam bentuk ucapan sebagai saklarnya. Metode ini membantu manusia yang secara fisik tidak dapat menggerakkan saklar karena cacat pada tangan misalnya. Penerapan VUI ini tidak hanya untuk lampu saja tapi bisa juga untuk aplikasi-aplikasi kontrol yang lain.

2. TEKNOLOGI KOMUNIKASI

Voice User Interface (VUI) adalah suatu metode komunikasi antara komputer dengan manusia dengan menggunakan suara[6]. VUI ini merupakan pengembangan dari Graphical User Interface (GUI) yang menggunakan visualisasi gambar atau tulisan untuk berkomunikasi antara komputer dengan manusia.

Aplikasi Voice User Interface bukanlah aplikasi yang berdiri sendiri. Aplikasi VUI tersusun atas  eknologiteknologi lainnya yang memungkinkan aplikasi ini berjalan sebagaimana mestinya. Teknologi-teknologi yang mendasari Aplikasi VUI ini adalah :
1. Natural Language Processing (NLP).
2. Automatic Speech Recognition (ASR).
3. Speech Synthesis.
4. Object Linking and Embedding (OLE).
5. Windows Application Programming Interface (API).

3. Prinsip Kerja Aplikasi VUI 

Prinsip kerja secara umum dari Aplikasi Voice User Interface adalah Aplikasi VUI ini akan mendengarkan perintah dari user dan kemudian memberikan respon sesuai dengan perintah yang diberikan. Proses pengenalan suara user dilakukan oleh Speech Recognizer yang berada di dalam Speech API, kemudian Speech Recognizer memberikan kata atau kalimat yang diucapkan user kepada Aplikasi VUI dalam bentuk teks. Teks tersebutlah yang diproses oleh Aplikasi VUI untuk menentukan respon apa yang akan dilakukan atas perintah yang diberikan oleh user.
Aplikasi VUI ini juga dapat memberikan pesan atau respon berupa suara, hal ini dilakukan Aplikasi VUI dengan cara memberikan kata atau kalimat yang akan disuarakan kepada Speech Synthesizer yang berada di dalam Speech API. Proses selanjutnya Speech Synthesizer akan mensintesis suara sesuai dengan kata atau kalimat yang diberikan kepadanya.

3. ALGORITMA YANG DIGUNAKAN

Windows Application Programming Interface (API) 
Windows Application Programming Interface (API) adalah sekumpulan fungsi dan konstanta yang
terdapat dalam file-file DLL yang menyusun Sistem Operasi Windows[14]. Karena terdapat dalam file library (DLL) maka fungsi-fungsi dan konstantakonstanta tersebut dapat digunakan oleh aplikasi atau library lainnya. Windows API biasanya disusun dalam bahasa pemrograman C/C++. Bahasa C dipilih karena kecepatan dan kedekatannya dengan hardware. Windows menyediakan banyak sekali API yang memiliki fungsi berbedabeda. Berikut ini adalah beberapa API yang disediakan oleh Sistem Operasi Windows :
1. Win32 API,
API yang disediakan Windows untuk melakukan pemrograman Windows secara umum. Fungsi-fungsi yang terdapat dalam Win32 API ini sangat lengkap mulai dari menu, button, window,
eksekusi program dan lain-lain.

2. Telephony API (TAPI),
API yang digunakan untuk melakukan fungsifungsi telephony dengan menggunakan Sistem Operasi Windows.

3. Messaging API (MAPI),
API yang digunakan untuk melakukan pengiriman pesan (termasuk pengiriman email) dengan menggunakan Sistem Operasi Windows.

4. Speech API (SAPI),
API yang disediakan Windows untuk menambahkan fungsi speech ke dalam aplikasi yang berjalan di atas Sistem Operasi Windows.

5. Cryptography API,
API untuk  melakukan fungsi-fungsi enkripsi dan dekripsi. Banyak sekali metode enkripsi/dekripsi yang disediakan oleh cryptography API ini.

6. dan masih banyak API lainnya (termasuk yang tidak didokumentasikan oleh Microsoft). Seperti telah disinggung sebelumnya bahwa API sebenarnya hanyalah sebuah fungsi. Seperti halnya fungsi-fungsi lainnya, fungsi tersebut dapat memiliki parameter-parameter dan dapat mengembalikan nilai. Bedanya hanyalah fungsi-fungsi tersebut ditulis dalam bahasa C/C++ sehingga bagi yang belum familiar dengan bahasa C/C++ biasanya akan mengalami kesulitan.


http://diazup.blogspot.com/2010/11/speech-recognition.html
http://contohprogramsourcecodemetodealgoritma.com/2011/10/14/perancangan-aplikasi-voice-user-interface-dengan-menggunakan-microsoft-speech-api/



Tidak ada komentar:

Posting Komentar