Data science dan machine learning saat ini sudah digunakan untuk mendongkrak performa bisnis. Untuk itu dibutuhkan development machine learning yang memenuhi standar kualitas di level production. Model machine learning yang bisa mendongkrak bisnis adalah yang bisa dideploy dengan mudah dan dioperasikan secara mandiri.

Setiap data scientist memiliki workflow masing-masing saat memecahkan persoalan analitik. Ketika harus bekerja dalam tim, aturan bersama harus disepakati agar kolaborasi bisa berjalan secara efisien. Namun, distraksi dan deadline bisa menimbulkan friksi, yang berujung kepada proses yang tidak koheren dan kualitas code yang buruk.

Hal seperti ini bisa dihindari dengan mengadopsi coding standard yang tidak bias dan mengelaborasi best practice yang ada.

Lebih-lebih jika data scientist yang ada memiliki background non software engineering, seperti matematika dan statistik. Bagi data scientist seperti ini, code dipandang lebih sebagai tool yang digunakan untuk memecahkan masalah, alih-alih sebagai produk akhir. Akibatnya, effort yang dihabiskan untuk menghasilkan code yang mematuhi prinsip software engineering, semisal:

  • bisa direproduksi
  • modular
  • mudah dimonitor
  • Teruji, sehingga mencegah kegagalan di level production
  • Terdokumentasi dengan baik

Code yang dibuat pada fase awal biasanya tidak mematuhi prinsip-prinsip di atas, sehingga dibutuhkan re-engineering agar bisa digunakan di level production.

Disinilah Kedro hadir, untuk mengatasi persoalan tersebut.

Apa itu Kedro?

Kedro adalah development workflow framework yang membentuk standar development, agar menghasilkan code yang production-ready.

Kedro membantu membuat pipeline berdasarkan prinsip-prinsip software engineering. Kedro menyediakan pendekatan terstandar yang membantu developer berkolaborasi dalam tim, untuk membangun data pipeline yang robust, scalable, deployable dan reproducible.

Fitur yang ada pada Kedro antara lain:

  • Project template
  • Data abstraction
  • Configuration management
  • Test-driven development
  • Modularity
  • Visualisasi pipeline
  • Packaging
  • Versioning

Untuk informasi lebih lanjut anda bisa mengunjungi link berikut:

LEAVE A REPLY

Please enter your comment!
Please enter your name here