Pengenalan Karakter Optikal Aksara Jawa Menggunakan Connectionist Temporal Classification

  • Ridwan Hidayatullah Universitas Muhammadiyah Purworejo
  • Wahju Tjahjo Saputro Universitas Muhammadiyah Purworejo
  • Dewi Chirzah Universitas Muhammadiyah Purworejo
Keywords: Optical Character Recognition, Connectionist Temporal Classification, Aksara Jawa

Abstract

Aksara Jawa memiliki sejarah panjang dan penting di Pulau Jawa. Sampai saat ini aksara Jawa banyak digunakan untuk obyek penelitian. Salah satunya menggunakan aplikasi OCR. Penelitian ini bertujuan mengembangkan model OCR untuk aksara Jawa menggunakan Metode CTC (Connectionist Temporal Classification. Pengumpulan dataset diambil dari Wikipedia, kemudian diubah ke dalam aksara Jawa menggunakan aplikasi transliterasi. Selanjutnya teks aksara Jawa diubah menjadi gambar dan pelatiha menggunakan Metode CTC. Penelitian ini memilih Metode CTC karena mampu mengatasi masalah pelabelan urutan yang tidak sejajar, dengan memprediksi urutan karakter langsung dari input gambar. Dataset akhir terdiri dari 25.038 buah teks yang diubah ke dalam gambar dengan resolusi acak dan seragam. Model seragam menunjukkan kinerja lebih baik dari pada model acak dalam pengenalan gambar aksara Jawa, dengan mean edit distance, train loss, dan validation loss yang lebih rendah. Model seragam efektif dan baik untuk data gambar seragam, sementara model acak lebih fleksibel untuk data berbagai ukuran gambar. Peningkatan ukuran dataset meningkatkan performa kedua model.

References

Chao, L., Chen, J., & Chu, W. (2020). Variational Connectionist Temporal Classification. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 12373 LNCS, 460–476. https://doi.org/10.1007/978-3-030-58604-1_28

Fakhruddin, D., Sachari, A., & Haswanto, N. (2019). Pengembangan Desain Informasi dan Pembelajaran Aksara Jawa Melalui Media Website. ANDHARUPA: Jurnal Desain Komunikasi Visual & Multimedia, 5(01), 1–23. https://doi.org/10.33633/andharupa.v5i01.1990

Feng, X., Yao, H., & Zhang, S. (2019). Focal CTC Loss for Chinese Optical Character Recognition on Unbalanced Datasets. Complexity, 2019. https://doi.org/10.1155/2019/9345861

Gaido, M., Cettolo, M., Negri, M., & Turchi, M. (2021). CTC-Based Compression for Direct Speech Translation. EACL 2021 - 16th Conference of the European Chapter of the Association for Computational Linguistics, Proceedings of the Conference, 690–696. https://doi.org/10.18653/v1/2021.eacl-main.57

Ganesh, A. S. (2019). OCR based Image Processing with Audio Output for Visually Challenged People. International Journal for Research in Applied Science and Engineering Technology, 7(3), 599–604. https://doi.org/10.22214/ijraset.2019.3104

Graves, A., Fernández, S., Gomez, F., & Schmidhuber, J. (2006). Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks. ACM International Conference Proceeding Series, 148, 369–376. https://doi.org/10.1145/1143844.1143891

Hanindria, I. S., & Hendry. (2022). Pengklasifikasian Aksara Jawa Metode Convolutional Neural Network. Jurnal Teknik Informatika Dan Sitem Informasi, 9(3), 2727–2737. https://jurnal.mdp.ac.id/index._php/jatisi/article/view/2177

Hou, Y., Kong, Q., & Li, S. (2020). Audio Tagging With Connectionist Temporal Classification Model Using Sequentially Labelled Data. Lecture Notes in Electrical Engineering, 516, 955–964. https://doi.org/10.1007/978-981-13-6504-1_114

Khatavkar, V., Velankar, M., & Petkar, S. (2024). Segmentation-Free Connectionist Temporal Classification Loss Based OCR Model for Text Captcha Classification. ArXiv Preprint ArXiv:2402.05417.

Kusnantoro, Rohana, T., & Sulistya Kusumaningrum, D. (2022). Implementasi Metode Tesseract Optical Character Recognition untuk Deteksi Plat Nomor Kendaraan Pada Sistem Parkir. Scientific Student Journal for Information, Technology and Science, 3(1), 59–67.

Lindenberg, N. (2022). Implementing Javanese. 1–14. https://www.unicode.org/notes/tn47/UTN47-Implementing-Javanese-1.pdf

Lu, B. R., Shyu, F., Chen, Y. N., Lee, H. Y., & Lee, L. S. (2017). Order-Preserving Abstractive Summarization for Spoken Content Based on Connectionist Temporal Classification. Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH, 2017-Augus, 2899–2903. https://doi.org/10.21437/Interspeech.2017-862

Lu, S., Lu, J., Lin, J., & Wang, Z. (2019). A Hardware-Oriented and Memory-Efficient Method for CTC Decoding. IEEE Access, 7, 120681–120694. https://doi.org/10.1109/ACCESS.2019.2937680

Mahakarti, D. C., Sulanjari, B., & Werdiningsih, Y. K. (2023). Kemampuan Menulis Paragraf Aksara Jawa Menggunakan Metode Cycle Learning Kelas XI SMKN 1 Sayung Demak Tahun Ajaran 2022. JISABDA: Jurnal Ilmiah Sastra Dan Bahasa Daerah, Serta Pengajarannya, 4(2), 28–36. https://doi.org/10.26877/jisabda.v4i2.15106

Mäs, S., Henzen, D., Bernard, L., Müller, M., Jirka, S., & Senner, I. (2018). Generic Schema Descriptions for Comma-Separated Values Files of Environmental Data. Agile, 1–5.

Mulyanto, A., Susanti, E., Rossi, F., Wajiran, W., & Borman, R. I. (2021). Penerapan Convolutional Neural Network pada Pengenalan Aksara Lampung Berbasis Optical Character Recognition. Jurnal Edukasi Dan Penelitian Informatika (JEPIN), 7(1), 52. https://doi.org/10.26418/jp.v7i1.44133

Nisha, K., Wahyuni, T., & Hayat, M. A. M. (2024). Arus Jurnal Sains dan Teknologi Pemeriksaan KTP Menggunakan Optical Character Recognition dan Pengenalan Background serta Komponen KTP. Arus Jurnal Sains Teknologi (AJST), 2(2), 490–495.

Okta, M. D. U., Aulia, S., & Burhanuddin, B. (2021). Pengenalan Pola Berbasis OCR untuk Pengambilan Data Bursa Saham. Jurnal Rekayasa Elektrika, 17(2), 100–106. https://doi.org/10.17529/jre.v17i2.19656

Standard, T. U. (n.d.). Japanese.

Susetianingtias, D. T., Arianty, R., Rodiah, R., & Patriya, E. (2023). Pembentukan Model Recirrent Neural Network dan Connectionist Temporal Classification Pada Pengenalan Kata Tulisan Tangan Offline. 3(2), 161–171.

Zenkel, T., Sanabria, R., Metze, F., Niehues, J., Sperber, M., Stüker, S., & Waibel, A. (2017). Comparison of Decoding Strategies for CTC Acoustic Models. Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH, 2017-Augus, 513–517. https://doi.org/10.21437/Interspeech.2017-1683

Zhan, H., Wang, Q., & Lu, Y. (2017). Handwritten Digit String Recognition by Combination of Residual Network and RNN-CTC. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 10639 LNCS, 583–591. https://doi.org/10.1007/978-3-319-70136-3_62

Published
2024-11-29
How to Cite
Hidayatullah, R., Saputro, W. T., & Chirzah, D. (2024). Pengenalan Karakter Optikal Aksara Jawa Menggunakan Connectionist Temporal Classification. INTEK : Jurnal Informatika Dan Teknologi Informasi, 7(2), 74-82. https://doi.org/10.37729/intek.v7i2.5750
Section
Articles

Most read articles by the same author(s)

1 2 3 > >>