İçeriğe geç
KAMPANYA Kurumsal Web Paketi — $499'dan başlayan fiyatlar Web & Logo Tasarımı · Kurumsal E-posta · LiteSpeed + CloudLinux · Imunify360 Güvenlik · cPanel Yönetim · 3 Gbps DDoS Koruması 00 Gün 00 Saat 00 Dk 00 Sn
AIOR

PaDiM, PatchCore, EfficientAD: which anomaly model actually wins on

Sektör topluluğu — sorularınız, deneyimleriniz ve duyurularınız için.

PaDiM, PatchCore, EfficientAD: which anomaly model actually wins on

Aior

Administrator
Staff member
Joined
Apr 2, 2023
Messages
895
Reaction score
2
Points
18
Age
40
Location
Turkey
Website
aior.com
1/3
Thread owner

500


Üç aile, üç ödünleşme​

Denetimsiz anomali tespiti alanı az çok üç mimari aileye yakınsadı. Aralarında seçim yapmak, MVTec lider tablosunda hangisinin önde olduğundan çok, sizin hücrenizin kısıtlarına — bellek bütçesi, yeniden eğitim sıklığı, gecikme, ve anomalilerinizin ne kadar egzotik olduğu — hangisinin uyduğuyla ilgilidir.

İşte kullandığımız pratik karar matrisi.

Memory-bank yöntemleri (PaDiM, PatchCore)​

PaDiM atılımdı; PatchCore üretime giren rafinasyondur. İkisi de dondurulmuş bir backbone'dan (WideResNet-50, EfficientNet) özellik çıkarır ve temsili "iyi" patch'leri bir bellek bankasında saklar. Inference'da test patch'inin bankadaki en yakın komşusuna uzaklığı anomali skorudur.

Kazandıkları yer: küçük veri kümeleri (200-500 iyi örnek), ince kusurlarda yüksek doğruluk, klasik anlamda eğitim yok (sadece banka inşası).

Acı verdikleri yer: bellek bankası hızla büyür — tam çözünürlükte 5.000 görüntülük bir banka rahatlıkla 4 GB'ı geçer. Greedy coreset sub-sampling ile PatchCore çalışan versiyondur. Inference gecikmesi en yakın komşu aramasıyla sınırlı; FAISS yardım eder ama sorunu çözmez.

Damıtma (EfficientAD, RD4AD)​

Bir öğrenci ağı yalnızca iyi örnekler üzerinde dondurulmuş bir öğretmenin özelliklerine uyacak şekilde eğitilir. Inference'da öğrenci ile öğretmen farklılaştığında → anomali.

Kazandıkları yer: inference gecikmesi. EfficientAD bir 3060'ta görüntü başına <10 ms ile çalışır. Bellek izi sabittir (sadece öğrenci ağırlıkları).

Acı verdikleri yer: zorlu MVTec kategorilerinde biraz daha düşük tepe doğruluk ve eğitim hyperparametrelere makaledekinden daha hassastır.

Yeniden inşa ve akış (FastFlow, DRAEM)​

Eski soydan. Autoencoder, normalizing flow veya diffusion modelleri "iyi"nin dağılımını öğrenir ve sapmaları işaretler.

Kazandıkları yer: dokulu yüzeyler (kumaş, ahşap, deri). Özellikle DRAEM, eğitim sırasında görülmeyen kusur türlerini herhangi bir memory-bank yönteminden daha iyi ele alır.

Acı verdikleri yer: eğitim kararlılığı, hyperparametre hassasiyeti ve "iyi" kümeniz kirliyse anomalileri ezberleme eğilimi.

Nasıl seçiyoruz​

  • Küçük veri kümesi, keskin kusurlar, gecikme >100 ms tolere edilebilir → PatchCore.
  • Gecikme bütçesi < 30 ms → EfficientAD.
  • Dokulu yüzey, görülmeyen kusur tipleri beklenir → DRAEM.
  • "Sadece bir benchmark'ta en yüksek skoru ver" → PatchCore (ve tam da bu nedenle her zaman üretime gitmez).

Liderlik tablolarının söylemediği şey​

Bu modellerin hiçbiri drift'i ele almaz. Onları Mart'ta eğitin, dağıtın, ve Ağustos'a kadar fabrikanızdaki ışıklandırma kaymış, operatörleriniz parçaları biraz farklı yüklüyor ve anomali skor dağılımınız yarım standart sapma sürüklenmiştir. Liderlik tablosu modeli doğru model değildir — en temiz yeniden eğitim hikâyesine sahip model doğru modeldir.

Varsayılanınız nedir? Birden çok kullanım örneğinde tek bir mimariye yakınsayan olup olmadığını merak ediyoruz.


500


Three families, three tradeoffs​

The unsupervised anomaly detection space has more or less converged on three architectural families. Picking between them is less about which one tops the MVTec leaderboard and more about which one fits the constraints of your cell — memory budget, retrain cadence, latency, and how exotic your anomalies are.

Here's the practical decision matrix we use.

Memory-bank methods (PaDiM, PatchCore)​

PaDiM was the breakthrough; PatchCore is the refinement that actually shipped. They both extract features from a frozen backbone (WideResNet-50, EfficientNet) and store representative "good" patches in a memory bank. At inference, the test patch's distance to its nearest neighbour in the bank is the anomaly score.

Where they win: small datasets (200-500 good samples), high accuracy on subtle defects, no training in the classical sense (just bank construction).

Where they hurt: memory bank gets large fast — a 5000-image bank at full resolution can blow past 4 GB. PatchCore with greedy coreset sub-sampling is the workable version. Inference latency is bounded by nearest-neighbour search; FAISS helps but doesn't fix the problem.

Distillation (EfficientAD, RD4AD)​

A student network is trained to match a frozen teacher's features on good samples only. At inference, where student and teacher disagree → anomaly.

Where they win: inference latency. EfficientAD on a 3060 runs at <10 ms per image. Memory footprint is fixed (it's just the student weights).

Where they hurt: slightly lower top-line accuracy on the harder MVTec categories, and training is more sensitive to hyperparameters than it sounds in the paper.

Reconstruction & flow (FastFlow, DRAEM)​

Older lineage. Autoencoders, normalising flows, or diffusion models that learn the distribution of "good" and flag deviations.

Where they win: textured surfaces (fabric, wood, leather). DRAEM in particular handles defect types not seen at training time better than any memory-bank method.

Where they hurt: training stability, hyperparameter sensitivity, and a tendency to memorise anomalies if your "good" set is dirty.

How we pick​

  • Small dataset, sharp defects, latency >100 ms is fine → PatchCore.
  • Latency budget < 30 ms → EfficientAD.
  • Textured surface, expecting unseen defect types → DRAEM.
  • "Just give me the highest score on a benchmark" → PatchCore (and that's exactly why it doesn't always ship).

The thing the leaderboards don't tell you​

None of these models handle drift. Train them in March, deploy them, and by August the lighting in your factory has shifted, your operators are loading parts slightly differently, and your anomaly score distribution has drifted half a standard deviation. The leaderboard model isn't the right model — the model with the cleanest retrain story is.

What's your default? Curious whether anyone has converged on a single architecture across multiple use cases.
 

Forum statistics

Threads
891
Messages
898
Members
27
Latest member
AIORAli

Members online

No members online now.

Featured content

AIOR
AIOR TEKNOLOJİ

Tüm ihtiyaçlarınız için Teklif alın

Hosting · Domain · Sunucu · Tasarım · Yazılım · Mühendislik · Sektörel Çözümler

Teklif al

7/24 Destek · Anında yanıt

Back
Top