Sobol Dizisi: sadece başka bir örnekleme yöntemi değil.

Deney Tasarımı (DOEDesigns of Experiment), girdiler ve çıktılar arasındaki neden-sonuç ilişkilerini belirlemek için kullanılan sistematik örnekleme desenleri oluşturan istatistik dalıdır. DOE, çeşitli deneysel durumlarda kullanılabilen güçlü bir veri toplama ve analiz aracıdır.

Deney Tasarımı iki ana şemaya ayrılır: Faktöriyel ve Boşluk-doldurma (Space-filling) tasarımları. Faktöriyel DOE’ler (Tam Faktöriyel, Kesirli Faktöriyel, Taguchi, vb.) sağlam bilgiler sağlar, ancak genellikle doğrusal olmayan (nonlinear) sistemlerde neden ve sonuç ilişkilerini keşfetmek için gerekenden daha fazla örnek gerektirebilirler. Modern boşluk-doldurma tasarımları, simülasyonlar ve yüksek derecede doğrusal olmayan yanıtlar içeren karmaşık fiziksel deneyler için genellikle en verimli DOE’lerdir. Modern yöntemlerden biri olan Sobol Sequence, Altair HyperStudy 2022.3 versiyonuna eklenmiştir ve bu yazının konusudur.

Sobol Dizisi, düşük tutarsızlıklı yarı rastgele örnekleme ailesine aittir ve mükemmel korelasyon ve düzgün dağılım performansı sağlar. Bu dizi ilk olarak 1967 yılında Rus matematikçi Ilya M. Sobol tarafından önerilmiştir. Her örnekleme şemasının kendi avantajları ve dezavantajları vardır ve en iyi yöntemi seçmek söz konusu olduğunda, hangi özelliklerin arandığına bağlıdır. Korelasyon ve tekdüzelik performansı tipik olarak belirleyici unsurlar olsa da, çalışmanın karmaşıklığına bağlı olarak başka yeteneklere de ihtiyaç duyulabilir. Örneğin, sabit bir örneklem büyüklüğü için, Hammersley ve Latin Hypercube, Tablo 1’de gösterildiği gibi, saf korelasyon sonuçlarına dayanarak hem MELS (Modified Extensible Lattice Sequence) hem de Sobol’dan daha iyi performans gösterebilir. Ancak, genişletilebilirlik veya tasarım değişkeni desteği ya da her ikisi birden arandığında korelasyon performansı tek önemli faktör değildir.

Tablo 1. Korelasyon performansı, 7 tasarım değişkeni ve 20 örnek.

Yüksek doğrulukta bir tahmin modeli oluşturmak amacıyla örnekleme yapılması gerekiyorsa, mevcut veri seti yeterli olmayabileceğinden ve daha fazla verinin eklenmesi gerektiğinden, yöntemin genişletilebilirliği son derece önemli olabilir. Bu durum özellikle genişletilebilir örnekleme stratejisine dayanan Örnekleme Uyumu için geçerlidir. Bu nedenle, Örnekleme Uyumu’nda mevcut yöntemler MELS ve Sobol ile sınırlıdır. Her ikisi de genişletilebilir olmasına ve tasarım değişkeni kısıtlamalarını desteklemesine rağmen, Sobol, boyut sayısına ve örneklem boyutuna bağlı olarak, Şekil 1’de gösterildiği gibi daha iyi korelasyon performansı (bkz. Tablo 1) ve tasarım alanının daha düzgün kullanımını gösterebilir.

Şekil 1. 7 tasarım değişkeni ve 20 örnek, solda MELS, sağda Sobol.

Tekdüze dağılıma sahip veri seti, Örnekleme Uyumunda durdurma doğruluğu ölçütü olan çapraz doğrulama R-kare değerinin hesaplanmasında önemli bir rol oynar. Herhangi bir yöntemdeki sıra, örneklenen noktaların düzenini tanımlar ve bu düzen R-kare değerinin genel güvenilirliğini etkiler. Örneğin MELS’te kafes diziliminin doğası gereği noktalar birbirine yakın yerleştirilir ve bu da doğrulama noktaları eğitim noktalarının yakınında olduğu için yanlı hesaplamalara yol açabilir. Şekil 2’de yedi tasarım değişkeni ve 0,95 çapraz doğrulama R-kare değerini hedefleyen bir yanıt ile Örnekleme Uyumuna dayalı takas çalışmasının bir örneği gösterilmektedir. MELS ile Örnekleme Uyumu dokuz değerlendirme alırken, Sobol ile hedefe ulaşmak için otuz yedi çalışma gerekir. İlk başta, MELS kullanımı sadece dokuz çalıştırma gerektirdiği için daha verimli görünmektedir, ancak yukarıda belirtildiği gibi, çapraz doğrulama R-kare değerinin yanlı hesaplanması nedeniyle örnekleme zamanından önce sonlandırılmıştır. Verilen tasarım değişkeni değerleri kümesi için, Sobol Dizisi tahmin modeli, daha yüksek kalite değerine (daha az ekstrapolasyon miktarı) göre daha güvenilir çıktı sağlar. Bu çıkarımlar, tasarım değişkenlerinin tek bir kombinasyonuna dayanılarak yapılmıştır. Başka herhangi bir kombinasyon için MELS ve Sobol benzer performans gösterebilir.

Şekil 2. Örnekleme Uyumu ile takas çalışması. Solda MELS tabanlı ve sağda Sobol tabanlı.

Sobol, mevcut yöntemleri tamamlamak için eklenmiştir ve mükemmel korelasyon performansına sahip mükemmel bir genişletilebilir alan doldurma DOE’sidir.

Altair HyperStudy yazılımını denemek için Altair ONE Marketplace‘den indirebilir, sorularınız için iletişim formunu kullanabilirsiniz.