Boosting adalah algoritme yang membantu mengurangi varians dan bias dalam ansambel machine learning. Algoritma Algoritma (Algos) Algoritma (Algos) adalah sekumpulan instruksi yang diperkenalkan untuk melakukan suatu tugas. Algoritma diperkenalkan untuk mengotomatiskan perdagangan untuk menghasilkan keuntungan pada frekuensi yang tidak mungkin bagi seorang pedagang manusia membantu dalam konversi pelajar yang lemah menjadi pembelajar yang kuat dengan menggabungkan N jumlah peserta didik.
Sumber: Sirakorn [CC BY-SA]
Boosting juga dapat meningkatkan prediksi model untuk algoritma pembelajaran. Pelajar yang lemah dikoreksi secara berurutan oleh pendahulunya dan, dalam prosesnya, mereka diubah menjadi pelajar yang kuat.
Bentuk Meningkatkan
Boosting dapat berupa beberapa bentuk, termasuk:
1. Peningkatan Adaptif (Adaboost)
Adaboost bertujuan untuk menggabungkan beberapa pelajar yang lemah untuk membentuk satu pelajar yang kuat. Adaboost berkonsentrasi pada pelajar yang lemah, yang seringkali merupakan pohon keputusan dengan hanya satu bagian dan biasanya disebut sebagai keputusan tunggul. Tunggul keputusan pertama di Adaboost berisi pengamatan yang berbobot sama.
Kesalahan sebelumnya dikoreksi, dan setiap pengamatan yang diklasifikasikan secara tidak benar diberi bobot lebih dari pengamatan lain yang tidak memiliki kesalahan dalam klasifikasi. Algoritma dari Adaboost sangat populer digunakan dalam prosedur regresi dan klasifikasi. Kesalahan yang diketahui pada model sebelumnya disesuaikan dengan pembobotan sampai prediktor yang akurat dibuat.
2. Meningkatkan Gradien
Peningkatan gradien, sama seperti prosedur pembelajaran mesin ansambel lainnya, secara berurutan menambahkan prediktor ke ansambel dan mengikuti urutan dalam mengoreksi prediktor sebelumnya untuk sampai pada prediktor yang akurat di akhir prosedur. Adaboost mengoreksi kesalahan sebelumnya dengan menyesuaikan bobot untuk setiap pengamatan yang salah di setiap iterasi, tetapi peningkatan gradien bertujuan untuk menyesuaikan prediktor baru dalam kesalahan sisa yang dilakukan oleh prediktor sebelumnya.
Peningkatan gradien menggunakan penurunan gradien untuk menunjukkan tantangan dalam prediksi pelajar yang digunakan sebelumnya. Kesalahan sebelumnya disorot, dan, dengan menggabungkan satu pelajar yang lemah ke pelajar berikutnya, kesalahan berkurang secara signifikan dari waktu ke waktu.
3. XGBoost (Peningkatan Gradien Ekstrem)
XGBoostimg mengimplementasikan pohon keputusan dengan peningkatan gradien, peningkatan kinerja, dan kecepatan. Implementasi mesin yang diperkuat gradien relatif lambat, karena pelatihan model harus mengikuti suatu urutan. Oleh karena itu, mereka kekurangan skalabilitas. Skalabilitas Skalabilitas dapat jatuh dalam konteks strategi keuangan dan bisnis. Dalam kedua kasus tersebut, ini berarti kemampuan entitas untuk menahan tekanan karena kelambatannya.
XGBoost bergantung pada kinerja model dan kecepatan komputasi. Ini memberikan berbagai manfaat, seperti paralelisasi, komputasi terdistribusi, pengoptimalan cache, dan komputasi out-of-core.
XGBoost menyediakan paralelisasi dalam pembangunan pohon melalui penggunaan inti CPU selama pelatihan. Ini juga mendistribusikan komputasi saat melatih model besar menggunakan kluster mesin. Komputasi out-of-core digunakan untuk kumpulan data yang lebih besar yang tidak sesuai dengan ukuran memori konvensional. Pengoptimalan cache juga digunakan untuk algoritme dan struktur data guna mengoptimalkan penggunaan perangkat keras yang tersedia.
Pro dan Kontra Meningkatkan
Sebagai model ansambel, boosting hadir dengan algoritme yang mudah dibaca dan ditafsirkan, membuat interpretasi prediksinya mudah ditangani. Kemampuan prediksi menjadi efisien melalui penggunaan metode klonnya, seperti bagging Bagging (Bootstrap Aggregation) Ensemble machine learning dapat dikategorikan menjadi bagging dan boosting. Teknik bagging berguna untuk regresi dan statistik atau hutan acak, dan pohon keputusan. Meningkatkan adalah metode tangguh yang mengekang pemasangan berlebih dengan mudah.
Salah satu kelemahan boosting adalah sensitif terhadap pencilan karena setiap pengklasifikasi berkewajiban untuk memperbaiki kesalahan pada pendahulu. Jadi, metode ini terlalu bergantung pada pencilan. Kerugian lainnya adalah metode ini hampir tidak mungkin untuk ditingkatkan. Ini karena setiap estimator mendasarkan kebenarannya pada prediktor sebelumnya, sehingga membuat prosedur sulit untuk disederhanakan.
Apa itu Pohon Opsi?
Pohon opsi adalah pengganti pohon keputusan. Mereka mewakili pengklasifikasi ansambel sambil memperoleh struktur tunggal. Perbedaan antara pohon opsi dan pohon keputusan adalah bahwa yang pertama mencakup simpul opsi dan simpul keputusan, sedangkan yang terakhir hanya mencakup simpul keputusan.
Klasifikasi sebuah instance membutuhkan pemfilteran melalui pohon. Sebuah node keputusan diperlukan untuk memilih salah satu cabang, sedangkan node pilihan diperlukan untuk mengambil seluruh kelompok cabang. Ini berarti bahwa, dengan node opsi, salah satunya akan berakhir dengan beberapa daun yang perlu digabungkan menjadi satu klasifikasi untuk menghasilkan prediksi. Oleh karena itu, diperlukan pemungutan suara dalam prosesnya, di mana suara mayoritas berarti node tersebut telah dipilih sebagai prediksi untuk proses tersebut.
Proses di atas memperjelas bahwa node opsi tidak boleh datang dengan dua opsi karena mereka akan kehilangan suara jika mereka tidak dapat menemukan pemenang yang pasti. Kemungkinan lainnya adalah mengambil rata-rata perkiraan probabilitas dari berbagai jalur dengan mengikuti pendekatan seperti pendekatan Bayesian atau metode rata-rata tanpa bobot.
Pohon opsi juga dapat dikembangkan dari memodifikasi pelajar pohon keputusan yang ada atau membuat simpul opsi di mana beberapa pemisahan berkorelasi. Setiap pohon keputusan dalam tingkat toleransi yang diperbolehkan dapat diubah menjadi pohon opsi.
Sumber Daya Lainnya
Keuangan adalah penyedia resmi Sertifikasi Perbankan & Analis Kredit (CBCA) ™ CBCA ™ Akreditasi Perbankan & Analis Kredit Bersertifikat (CBCA) ™ adalah standar global untuk analis kredit yang mencakup keuangan, akuntansi, analisis kredit, analisis arus kas, model perjanjian, pembayaran kembali pinjaman, dan banyak lagi. program sertifikasi, yang dirancang untuk mengubah siapa pun menjadi analis keuangan kelas dunia.
Untuk terus mempelajari dan mengembangkan pengetahuan Anda tentang analisis keuangan, kami sangat merekomendasikan sumber daya Keuangan tambahan di bawah ini:
- Fintech (Financial Technology) Fintech (Financial Technology) Istilah fintech mengacu pada sinergi antara keuangan dan teknologi, yang digunakan untuk meningkatkan operasi bisnis dan penyampaian layanan keuangan
- Keuangan Kuantitatif Pembiayaan Kuantitatif Pembiayaan kuantitatif adalah penggunaan model matematika dan kumpulan data yang sangat besar untuk menganalisis pasar keuangan dan sekuritas. Contoh umum termasuk (1) penetapan harga sekuritas derivatif seperti opsi, dan (2) manajemen risiko, terutama yang berkaitan dengan manajemen portofolio
- Spoofing Spoofing Spoofing adalah praktik perdagangan algoritmik yang mengganggu yang melibatkan penempatan tawaran untuk membeli atau menawarkan untuk menjual kontrak berjangka dan membatalkan tawaran atau penawaran sebelum eksekusi kesepakatan. Praktik tersebut bermaksud untuk membuat gambaran palsu tentang permintaan atau pesimisme palsu di pasar.
- Panduan Gaji Insinyur Perangkat Lunak Panduan Gaji Insinyur Perangkat Lunak Dalam panduan gaji insinyur perangkat lunak ini, kami mencakup beberapa pekerjaan insinyur perangkat lunak dan gaji titik tengahnya yang sesuai untuk tahun 2018. Seorang insinyur perangkat lunak adalah seorang profesional yang menerapkan prinsip-prinsip rekayasa perangkat lunak dalam proses desain, pengembangan, pemeliharaan, pengujian, dan evaluasi perangkat lunak yang digunakan di komputer