Pengenalan Karakter Optikal Aksara Jawa Menggunakan Connectionist Temporal Classification
Abstract
Aksara Jawa memiliki sejarah panjang dan penting di Pulau Jawa. Sampai saat ini aksara Jawa banyak digunakan untuk obyek penelitian. Salah satunya menggunakan aplikasi OCR. Penelitian ini bertujuan mengembangkan model OCR untuk aksara Jawa menggunakan Metode CTC (Connectionist Temporal Classification. Pengumpulan dataset diambil dari Wikipedia, kemudian diubah ke dalam aksara Jawa menggunakan aplikasi transliterasi. Selanjutnya teks aksara Jawa diubah menjadi gambar dan pelatiha menggunakan Metode CTC. Penelitian ini memilih Metode CTC karena mampu mengatasi masalah pelabelan urutan yang tidak sejajar, dengan memprediksi urutan karakter langsung dari input gambar. Dataset akhir terdiri dari 25.038 buah teks yang diubah ke dalam gambar dengan resolusi acak dan seragam. Model seragam menunjukkan kinerja lebih baik dari pada model acak dalam pengenalan gambar aksara Jawa, dengan mean edit distance, train loss, dan validation loss yang lebih rendah. Model seragam efektif dan baik untuk data gambar seragam, sementara model acak lebih fleksibel untuk data berbagai ukuran gambar. Peningkatan ukuran dataset meningkatkan performa kedua model.
References
Chao, L., Chen, J., & Chu, W. (2020). Variational Connectionist Temporal Classification. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 12373 LNCS, 460–476. https://doi.org/10.1007/978-3-030-58604-1_28
Fakhruddin, D., Sachari, A., & Haswanto, N. (2019). Pengembangan Desain Informasi dan Pembelajaran Aksara Jawa Melalui Media Website. ANDHARUPA: Jurnal Desain Komunikasi Visual & Multimedia, 5(01), 1–23. https://doi.org/10.33633/andharupa.v5i01.1990
Feng, X., Yao, H., & Zhang, S. (2019). Focal CTC Loss for Chinese Optical Character Recognition on Unbalanced Datasets. Complexity, 2019. https://doi.org/10.1155/2019/9345861
Gaido, M., Cettolo, M., Negri, M., & Turchi, M. (2021). CTC-Based Compression for Direct Speech Translation. EACL 2021 - 16th Conference of the European Chapter of the Association for Computational Linguistics, Proceedings of the Conference, 690–696. https://doi.org/10.18653/v1/2021.eacl-main.57
Ganesh, A. S. (2019). OCR based Image Processing with Audio Output for Visually Challenged People. International Journal for Research in Applied Science and Engineering Technology, 7(3), 599–604. https://doi.org/10.22214/ijraset.2019.3104
Graves, A., Fernández, S., Gomez, F., & Schmidhuber, J. (2006). Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks. ACM International Conference Proceeding Series, 148, 369–376. https://doi.org/10.1145/1143844.1143891
Hanindria, I. S., & Hendry. (2022). Pengklasifikasian Aksara Jawa Metode Convolutional Neural Network. Jurnal Teknik Informatika Dan Sitem Informasi, 9(3), 2727–2737. https://jurnal.mdp.ac.id/index._php/jatisi/article/view/2177
Hou, Y., Kong, Q., & Li, S. (2020). Audio Tagging With Connectionist Temporal Classification Model Using Sequentially Labelled Data. Lecture Notes in Electrical Engineering, 516, 955–964. https://doi.org/10.1007/978-981-13-6504-1_114
Khatavkar, V., Velankar, M., & Petkar, S. (2024). Segmentation-Free Connectionist Temporal Classification Loss Based OCR Model for Text Captcha Classification. ArXiv Preprint ArXiv:2402.05417.
Kusnantoro, Rohana, T., & Sulistya Kusumaningrum, D. (2022). Implementasi Metode Tesseract Optical Character Recognition untuk Deteksi Plat Nomor Kendaraan Pada Sistem Parkir. Scientific Student Journal for Information, Technology and Science, 3(1), 59–67.
Lindenberg, N. (2022). Implementing Javanese. 1–14. https://www.unicode.org/notes/tn47/UTN47-Implementing-Javanese-1.pdf
Lu, B. R., Shyu, F., Chen, Y. N., Lee, H. Y., & Lee, L. S. (2017). Order-Preserving Abstractive Summarization for Spoken Content Based on Connectionist Temporal Classification. Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH, 2017-Augus, 2899–2903. https://doi.org/10.21437/Interspeech.2017-862
Lu, S., Lu, J., Lin, J., & Wang, Z. (2019). A Hardware-Oriented and Memory-Efficient Method for CTC Decoding. IEEE Access, 7, 120681–120694. https://doi.org/10.1109/ACCESS.2019.2937680
Mahakarti, D. C., Sulanjari, B., & Werdiningsih, Y. K. (2023). Kemampuan Menulis Paragraf Aksara Jawa Menggunakan Metode Cycle Learning Kelas XI SMKN 1 Sayung Demak Tahun Ajaran 2022. JISABDA: Jurnal Ilmiah Sastra Dan Bahasa Daerah, Serta Pengajarannya, 4(2), 28–36. https://doi.org/10.26877/jisabda.v4i2.15106
Mäs, S., Henzen, D., Bernard, L., Müller, M., Jirka, S., & Senner, I. (2018). Generic Schema Descriptions for Comma-Separated Values Files of Environmental Data. Agile, 1–5.
Mulyanto, A., Susanti, E., Rossi, F., Wajiran, W., & Borman, R. I. (2021). Penerapan Convolutional Neural Network pada Pengenalan Aksara Lampung Berbasis Optical Character Recognition. Jurnal Edukasi Dan Penelitian Informatika (JEPIN), 7(1), 52. https://doi.org/10.26418/jp.v7i1.44133
Nisha, K., Wahyuni, T., & Hayat, M. A. M. (2024). Arus Jurnal Sains dan Teknologi Pemeriksaan KTP Menggunakan Optical Character Recognition dan Pengenalan Background serta Komponen KTP. Arus Jurnal Sains Teknologi (AJST), 2(2), 490–495.
Okta, M. D. U., Aulia, S., & Burhanuddin, B. (2021). Pengenalan Pola Berbasis OCR untuk Pengambilan Data Bursa Saham. Jurnal Rekayasa Elektrika, 17(2), 100–106. https://doi.org/10.17529/jre.v17i2.19656
Standard, T. U. (n.d.). Japanese.
Susetianingtias, D. T., Arianty, R., Rodiah, R., & Patriya, E. (2023). Pembentukan Model Recirrent Neural Network dan Connectionist Temporal Classification Pada Pengenalan Kata Tulisan Tangan Offline. 3(2), 161–171.
Zenkel, T., Sanabria, R., Metze, F., Niehues, J., Sperber, M., Stüker, S., & Waibel, A. (2017). Comparison of Decoding Strategies for CTC Acoustic Models. Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH, 2017-Augus, 513–517. https://doi.org/10.21437/Interspeech.2017-1683
Zhan, H., Wang, Q., & Lu, Y. (2017). Handwritten Digit String Recognition by Combination of Residual Network and RNN-CTC. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 10639 LNCS, 583–591. https://doi.org/10.1007/978-3-319-70136-3_62
Copyright (c) 2024 Ridwan Hidayatullah, Wahju Tjahjo Saputro, Dewi Chirzah
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.