Apa itu LASSO?

LASSO, kependekan dari Least Absolute Shrinkage and Selection Operator, adalah rumus statistik yang tujuan utamanya adalah pemilihan fitur dan regularisasi model data. Metode ini pertama kali diperkenalkan pada tahun 1996 oleh Profesor Statistik Robert Tibshirani. LASSO memperkenalkan parameter ke jumlah model, memberinya batas atas yang bertindak sebagai pembatas untuk jumlah tersebut agar menyertakan parameter absolut dalam rentang yang diizinkan.

laso

Metode LASSO mengatur parameter model dengan mengecilkan koefisien regresi, mengurangi beberapa di antaranya menjadi nol. Fase pemilihan fitur terjadi setelah penyusutan, di mana setiap nilai bukan nol dipilih untuk digunakan dalam model. Metode ini penting dalam meminimalkan kesalahan prediksi yang umum dalam model statistik. Analisis Kuantitatif Analisis kuantitatif adalah proses pengumpulan dan evaluasi data terukur dan dapat diverifikasi seperti pendapatan, pangsa pasar, dan upah untuk memahami perilaku dan kinerja suatu perusahaan. bisnis. Di era teknologi data, analisis kuantitatif dianggap sebagai pendekatan yang disukai untuk membuat keputusan berdasarkan informasi. .

LASSO menawarkan model dengan akurasi prediksi tinggi. Akurasi meningkat karena metode ini menyertakan penyusutan koefisien, yang sebagai gantinya mengurangi varians dan meminimalkan bias. Ini berfungsi paling baik ketika jumlah pengamatan rendah dan jumlah fitur tinggi. Hal ini sangat bergantung pada parameter λ yang merupakan faktor pengendali penyusutan. Semakin besar λ, maka semakin banyak koefisien yang dipaksa menjadi nol.

Jika λ sama dengan nol, maka model tersebut menjadi regresi Ordinary Least Squares. Akibatnya, ketika λ meningkat, varians berkurang secara signifikan, dan bias hasil juga meningkat. Lasso juga merupakan alat yang berguna dalam menghilangkan semua variabel yang tidak relevan dan yang tidak terkait dengan variabel respon.

LASSO dalam Model Linear Statistik

Model statistik adalah representasi matematis kehidupan nyata dari suatu masalah. Model harus mengungkapkan masalah sedekat mungkin dengan dunia nyata sekaligus membuatnya sederhana dan mudah dipahami. Sebuah model terdiri dari variabel penjelas dan respon.

The variabel penjelas merupakan variabel independen yang pada kebijaksanaan peneliti. Variabel independen merupakan masukan dalam model yang dapat diukur oleh peneliti untuk mengetahui pengaruhnya terhadap hasil model.

The variabel respon adalah variabel dependen Dependent Variable Variabel Dependent adalah salah satu yang akan berubah tergantung pada nilai variabel lain, yang disebut variabel independen. yang menjadi fokus utama percobaan. Ini membentuk hasil eksperimen, yang dapat berupa hasil tunggal dalam kasus model univariat, atau, dalam kasus model multivariat, hasil ganda.

LASSO merupakan bagian integral dari proses pembangunan model, terutama menggunakan pemilihan fitur. Fase pemilihan fitur membantu dalam pemilihan variabel penjelas, yang merupakan variabel independen dan, karenanya, variabel input dalam model.

Variabel masukan adalah elemen penting yang menentukan keluaran model dan yang membantu dalam mengukur pengaruhnya terhadap variabel tanggapan. Memilih variabel yang tepat menentukan keakuratan model. Fase pemilihan fitur LASSO membantu dalam pemilihan variabel yang tepat.

Estimasi dengan LASSO

Model statistik mengandalkan LASSO untuk pemilihan variabel dan regularisasi yang akurat. Dalam regresi linier Analisis Regresi Analisis regresi adalah sekumpulan metode statistik yang digunakan untuk memperkirakan hubungan antara variabel dependen dan satu atau lebih variabel independen. Ini dapat digunakan untuk menilai kekuatan hubungan antara variabel dan untuk memodelkan hubungan masa depan di antara mereka. , misalnya, LASSO memperkenalkan batas atas untuk jumlah kuadrat, sehingga meminimalkan kesalahan yang ada dalam model. Estimator LASSO bergantung pada parameter λ.

Parameter λ mengontrol kekuatan susut, dimana kenaikan λ menghasilkan peningkatan susut. Batas atas dari jumlah semua koefisien berbanding terbalik dengan parameter λ. Ketika nilai batas atas meningkat, parameter λ berkurang. Ketika batas atas berkurang, parameter λ meningkat secara bersamaan.

Ketika batas atas meningkat menuju tak terhingga, parameter λ mendekati nol, sehingga mengubah percobaan menjadi Kuadrat Terkecil Biasa, di mana parameter λ selalu sama dengan nol. Ketika koefisien batas atas mendekati nol, nilai parameter λ meningkat menuju tak terhingga.

Geometri LASSO

LASSO membentuk bentuk berlian di plot untuk wilayah pembatasnya, seperti yang ditunjukkan pada gambar di bawah ini. Bentuk berlian mencakup sudut, tidak seperti bentuk lingkaran yang dibentuk oleh regresi punggung bukit. Kedekatan titik pertama dengan sudut menunjukkan bahwa model tersebut hadir dengan satu koefisien, yang sama dengan nol.

Wilayah batasan regresi ridge membentuk bentuk melingkar yang tidak mencakup sudut yang mirip dengan yang dibentuk oleh wilayah batasan LASSO ketika diplot. Oleh karena itu, koefisien regresi ridge tidak boleh sama dengan nol.

LASSO berbobot

Weighted LASSO adalah hasil dari seorang peneliti yang menghukum koefisien regresi secara terpisah. Ini berarti bahwa alih-alih menghukum parameter umum λ ke semua koefisien, koefisien akan diberi penalti secara individual, menggunakan parameter yang berbeda.

Bobot dapat ditentukan dengan menggunakan algoritma LASSO untuk menetapkan bobot secara tepat untuk pemodelan yang akurat. Pembobotan serupa dari koefisien regresi adalah koperasi LASSO, di mana koefisien diberi hukuman dalam kelompok yang dianggap serupa.

Sumber daya tambahan

Keuangan adalah penyedia resmi Sertifikasi Perbankan & Analis Kredit (CBCA) ™ CBCA ™ Akreditasi Perbankan & Analis Kredit Bersertifikat (CBCA) ™ adalah standar global untuk analis kredit yang mencakup keuangan, akuntansi, analisis kredit, analisis arus kas, model perjanjian, pembayaran kembali pinjaman, dan banyak lagi. program sertifikasi, yang dirancang untuk mengubah siapa pun menjadi analis keuangan kelas dunia.

Untuk terus mempelajari dan mengembangkan pengetahuan Anda tentang analisis keuangan, kami sangat merekomendasikan sumber daya Keuangan tambahan di bawah ini:

  • Metode Peramalan Metode Peramalan Metode Peramalan Atas. Pada artikel ini, kami akan menjelaskan empat jenis metode peramalan pendapatan yang digunakan analis keuangan untuk memprediksi pendapatan di masa depan.
  • Variabel Independen Variabel Independen Variabel independen adalah input, asumsi, atau pendorong yang diubah untuk menilai dampaknya terhadap variabel dependen (hasil).
  • Regresi Linier Berganda Regresi Linier Berganda Regresi linier berganda mengacu pada teknik statistik yang digunakan untuk memprediksi hasil suatu variabel terikat berdasarkan nilai variabel bebas.
  • Analisis Skenario Analisis Skenario Analisis skenario adalah teknik yang digunakan untuk menganalisis keputusan dengan berspekulasi berbagai kemungkinan hasil dalam investasi keuangan. Dalam pemodelan keuangan, ini

Direkomendasikan

Apakah Crackstreams dimatikan?
2022
Apakah pusat komando MC aman?
2022
Apakah Taliesin meninggalkan peran penting?
2022