Bilim insanları karmaşık güneş verilerini verimli bir şekilde etiketlemek için bir makine öğrenimi (Machine learning /ML) aracı geliştirdi.
Günümüzde makine öğrenimi, büyük ve karmaşık verilerin sorgulanması için kritik bir araç haline gelirken; anlamlı açıklamalar ekleme süreci olarak tanımlanan etiketleme, denetimli makine öğreniminin önemli bir adımı olarak ön plana çıkıyor. Bununla beraber ML tekniklerinden yararlanmak için insanların önce tüm verileri etiketlemesi gerekiyor ki bu da oldukça zaman alıyor. Buradan hareketle yola çıkan Southwest Araştırma Enstitüsü (Southwest Research Institute /SwRI)bilim insanları, derin öğrenme modellerinin potansiyel olarak tehlikeli güneş olaylarını incelemesine ve tanımlamasına izin vermek için büyük, karmaşık veri kümelerini verimli bir şekilde etiketlemek için bir makine öğrenimi aracı geliştirdi. Bu yeni etiketleme aracı, geniş veri kümelerini içeren diğer zorlukların üstesinden gelmek için uygulanabilecek veya uyarlanabilecek.
Araştırma bulgularının yer aldığı makale Nature Astronomy dergisinde yayınlanırken; makalenin başyazarı olan Dr. Subhamoy Chatterjee, verileri anlamlı açıklamalarla etiketlemenin denetimli makine öğreniminin çok önemli bir adımı olduğunu söyledi. Ancak veri kümelerini etiketlemenin sıkıcı ve zaman alıcı olduğunu vurgulayan Chatterjee şu bilgileri aktardı: “Yeni araştırmalar, kabaca etiketlenmiş astronomik videolar üzerinde eğitilmiş konvolüsyonel sinir ağlarının (convolutional neural networks /CNNs), veri etiketlemenin kalitesini ve genişliğini iyileştirmek ve insan müdahalesi ihtiyacını azaltmak için nasıl kullanılabileceğini gösteriyor.”
Çalışma kapsamında SwRI ekibi, uzay hava olaylarının ana habercisi olan güneş yüzeyinde güçlü, karmaşık manyetik alanların ortaya çıktığı alanları belirlemek için güneş manyetik alanının videolarını kullandı. Makalenin ortak yazarı Dr. Andrés Muñoz-Jaramillo çalışma hakkında şu bilgileri verdi: “CNN’leri kaba etiketler kullanarak eğittik, yalnızca makineyle olan anlaşmazlıklarımızı manuel olarak doğruladık. Ardından algoritmayı düzeltilmiş verilerle yeniden eğittik ve bu işlemi hepimiz anlaşana kadar tekrarladık. Akı ortaya çıkış etiketlemesi tipik olarak manuel olarak yapılırken; insan ve ML algoritması arasındaki bu yinelemeli etkileşim, manuel doğrulamayı %50 oranında azaltır.”
Çalışmaya göre aktif öğrenme gibi yinelemeli etiketleme yaklaşımları zamandan önemli ölçüde tasarruf sağlayabilir ve büyük veri (Big Data) ML’yi hazır hale getirme maliyetini azaltabilir. Ayrıca, videoları kademeli olarak maskeleyerek ve ML algoritmasının sınıflandırmasını değiştirdiği anı arayan SwRI bilim insanları, daha da zengin ve daha kullanışlı bir veri tabanı sağlamak için eğitimli makine öğrenimi algoritmasından yararlandı.