Latar Belakang dan Definisi Syntax dalam ilmu pemrograman

Dalam ilmu komputer, syntax dari bahasa pemrograman adalah seperangkat aturan yang menentukan kombinasi simbol yang dianggap program terstruktur dengan benar dalam bahasa itu. Syntax bahasa mendefinisikan bentuk permukaannya. Bahasa pemrograman berbasis teks didasarkan pada urutan karakter.

Tata bahasa leksikal bahasa tekstual menentukan bagaimana karakter harus dibenamkan menjadi token. Aturan syntax lainnya menentukan urutan yang diizinkan dari token-token ini dan proses pemberian makna pada urutan token ini adalah bagian dari semantik. Analisis syntax kode sumber biasanya melibatkan transformasi urutan linear token menjadi pohon syntax hirarkis (pohon sintaksis abstrak adalah salah satu bentuk sintaksis pohon yang nyaman). Proses ini disebut parsing, karena dalam analisis sintaksis dalam linguistik. Alat telah ditulis yang secara otomatis menghasilkan parser dari spesifikasi tata bahasa bahasa yang ditulis dalam bentuk Backus – Naur.

Syntax

Istilah “syntax” mengacu pada struktur bahasa pemrograman, khususnya, rangkaian simbol dan kata yang berbeda yang membentuk bagian dasar bahasa. Cara paling umum untuk menentukan syntax bahasa adalah menggunakan notasi yang dikenal sebagai Backus-Naur Form.

Backus-Naur Form

Formulir Backus-Naur, BNF untuk pendek, adalah notasi yang digunakan untuk menggambarkan tata bahasa. Notasi memecah tata bahasa menjadi serangkaian aturan – yang digunakan untuk menggambarkan bagaimana bahasa struktur leksikal dan sintaksis digunakan untuk membentuk unit logis yang berbeda Kata-kata yang dilindungi yang sebenarnya, simbol, dll … dari tata bahasa diwakili “terminal” . Dalam Backus-Naur Form, terminal biasanya dibiarkan tanpa format khusus atau hanya dibatasi oleh tanda kutip tunggal atau ganda. Contohnya meliputi: if, while, ‘=’ dan identifier. Aturan sintaksis diwakili dengan “non-fisik” – yang merupakan nama struktur. Biasanya, nonderminals dibatasi oleh sudut-kurung, tetapi ini tidak selalu terjadi. Contohnya meliputi dan. Kedua terminal dan nonterminals disebut secara umum sebagai “simbol”.

Produksi

Syntaxsebenarnya dari tata bahasa ditentukan dengan menggabungkan terminal dan nonterminals menjadi aturan sintaksis yang dikenal sebagai “produksi”. Mereka memiliki format berikut: di mana N adalah nonterminal dan s adalah serangkaian nol atau lebih terminal dan nonterminals. Alternatif yang berbeda dapat ditentukan dalam Backus-Naur Form. Agar mudah dibaca, seringkali produksi dikelompokkan bersama dan dipisahkan oleh simbol “pipa” – yang dibaca sebagai kata “atau”. Pada dasarnya, produksi memiliki sifat-sifat berikut.

  • Produksi dimulai dengan nonterminal tunggal, yang merupakan nama struktur yang ditentukan
  • Nonterminal ini diikuti oleh simbol :: = yang berarti “sebagaimana didefinisikan sebagai”. Simbol :: = sering digunakan secara bergantian dengan simbol. Keduanya memiliki arti yang sama.
  • Simbol ini diikuti oleh serangkaian terminal dan nonterminals.