Computer vision-on és machine-learning-en alapuló image classification project

Ez a projekt egy olyan képfeldolgozáson alapuló automatikus osztályozó rendszer megvalósítását célozza, amely képes megkülönböztetni a hibátlan és hibás termékeket. A rendszer lelke egy EfficientNetB0 alapú, TensorFlow Lite (TFLite) formátumú neurális hálózat, amelyet transfer learning és fine-tuning technikákkal képeztünk ki a feladatra. A modell bináris osztályozóként működik, a kimeneti réteg sigmoid aktivációt használ a két osztály – hibás és hibátlan – szétválasztásához. A fine-tuning során a hálózat utolsó 10 rétege került újratanításra, hogy a modell jobban alkalmazkodjon a konkrét feladathoz.

A képi adatok forrását maga az eszköz szolgáltatja, amely élőben készít képeket a termékekről. Ez azt jelenti, hogy a modell ugyanazon környezeti és technikai feltételek mellett rögzített képeken tanul, mint amelyeket élesben osztályoznia kell. Ez a megközelítés jelentősen csökkenti az adatdisztribúcióbeli eltérések kockázatát, és lehetővé teszi, hogy a modell az „életszerű” mintákhoz optimalizálódjon. Ilyen esetben az overfitting nem tekinthető negatív jelenségnek, sőt, kifejezetten előnyös lehet, hiszen a cél az adott eszköz adott környezetében való minél pontosabb felismerés.

Javaslat a képadatok előkészítésére:

  1. Képformátum és felbontás: Egységes, lehetőleg RGB formátum, a modell input méretéhez (224×224 px) igazítva.
  2. Adatgyűjtés: Minden osztályból (hibás, hibátlan) több száz kép rögzítése különböző terméktípusokból, fényviszonyok és pozíciók mellett.
  3. Augmentáció (opcionális): Kis mértékű forgatás, fényerőváltoztatás, eltolás vagy zoomolás növelheti a robusztusságot, de mivel a cél az adott kameraállás szerinti pontos felismerés, ez csak óvatosan alkalmazandó.
  4. Adatok szétválasztása: A képek egy része kerüljön validációs halmazba (pl. 80–20% arány), a tanítási hatékonyság ellenőrzésére.

Ez a megközelítés egy célirányosan optimalizált, gyors és megbízható beágyazott rendszert eredményez, amely valós időben képes az ipari folyamatokba integrálódni.

Rubik Pi

​A RUBIK Pi 3 egy fejlett, kompakt fejlesztői platform, amelyet a Qualcomm Dragonwing™ QCS6490 SoC hajt. Kifejezetten mesterséges intelligencia (AI), gépi tanulás (ML), számítógépes látás és beágyazott rendszerek fejlesztésére tervezték. A 12 TOPS AI számítási teljesítményével és a Raspberry Pi ökoszisztémával való kompatibilitásával ideális választás fejlett alkalmazásokhoz.​community.rubikpi.ai+6rubikpi.ai+6GitHub+6Electronics-Lab.com+3Electronics-Lab.com+3GitHub+3


🔧 Főbb jellemzők

  • Processzor: Qualcomm Kryo 670 (1x Cortex-A78 @ 2.7 GHz, 3x Cortex-A78 @ 2.4 GHz, 4x Cortex-A55 @ 1.9 GHz)
  • GPU: Adreno 643L, támogatja az OpenGL ES 3.2, Vulkan 1.x és OpenCL 2.0 szabványokat
  • AI teljesítmény: 12 TOPS, támogatja a Qualcomm AI Hub-ot és a Hexagon DSP-t
  • Memória: 8 GB LPDDR4X
  • Tárhely: 128 GB UFS 2.2, bővíthető M.2 M-Key SSD-vel
  • Videó kimenetek:
    • 1x HDMI 1.4 (4K @ 30 Hz)
    • 1x DisplayPort USB Type-C-n keresztül (4K @ 60 Hz)
  • Kamera interfészek: 2x MIPI-CSI D-PHY (4 sávos)
  • Hálózati kapcsolatok:
    • Gigabites Ethernet (RJ45)
    • Wi-Fi 5 (802.11ac)
    • Bluetooth 5.2
  • USB portok:
    • 1x USB Type-C (USB 3.1 Gen 1)
    • 2x USB 3.0 Type-A
    • 1x USB 2.0 Type-A
  • GPIO: 40 tűs Raspberry Pi-kompatibilis fejléc (28x GPIO, I2S, PWM, I2C, SPI, UART)
  • További funkciók:
    • Valós idejű óra (RTC)
    • RGB LED
    • PWM ventilátor csatlakozó
    • 12V/3A USB Type-C PD tápegység
  • Méret: 100 mm x 75 mm x 25 mm​rubikpi.ai+4Electronics-Lab.com+4Electronics-Lab.com+4rubikpi.ai+3GitHub+3Electronics-Lab.com+3community.rubikpi.ai+3Electronics-Lab.com+3Electronics-Lab.com+3

🧠 Fejlesztői támogatás és szoftvereszközök

  • Támogatott operációs rendszerek:
    • Qualcomm Linux
    • Android 13
    • Debian 12
    • Canonical Ubuntu a Qualcomm platformokhoz
  • Fejlesztői eszközök:
    • GCC/G++, Make, I2C-Tools, Minicom, iperf2, iperf3, Tcpdump, Imbench, Wget, Adduser, iproute2, Python3-pip
  • GStreamer-alapú AI/ML alkalmazások:

🎯 Alkalmazási területek

  • Edge AI: Valós idejű képfeldolgozás és döntéshozatal helyben, felhőkapcsolat nélkül
  • Ipari automatizálás: Minőségellenőrzés, hibafelismerés, robotvezérlés
  • Autonóm rendszerek: Önjáró járművek, drónok, robotkarok
  • Okos eszközök: Kamerarendszerek, IoT alkalmazások, multimédiás eszközök​

🌐 További információk

hu_HUMagyar