BilgisayarlarBilgi teknolojisi

Modern bilgisayarla görme. Görevler ve bilgisayar görme teknolojisi. Python programlama Bilgisayar Görme

Nasıl resim veya resimler tasvir anlamak için bir bilgisayar öğretmek? Bu basit gibi görünüyor ama bir bilgisayar için bu sıfırların ve önemli bilgileri ayıklamak istediğiniz olanlardan oluşan bir matristir.

bilgisayar vizyonu nedir? Bilgisayarınızı "görmek" yeteneğidir

Vizyon - kullanmadan kişi için önemli bir bilgi kaynağıdır, biz 70 tüm bilgilerin% 90, çeşitli tahminlere göre, elde ederiz. Biz akıllı araba oluşturmak istiyorsanız Ve tabii ki, biz aynı beceri ve bilgisayar uygulamak gerekir.

bilgisayar görme problemi oldukça açık bir şekilde ifade edilebilir. "Görmek" nedir? Bakarak sadece olduğu yerde anlaşılmaktadır. O bilgisayar vizyonu ve insan görme farklılıkları sonucuna vardı. Bizim için Vizyon - bu dünya hakkında bir bilgi kaynağı, hem de metrik bilgi kaynağı - yani, yetenek mesafeleri ve boyutları anlamak için.

Semantik çekirdek imajı

Resme baktığımızda anlamsal bilgiyi ayıklamak için, tabiri caizse, niteliklerin bir dizi tanımlayabiliriz.

Örneğin, bu resme bakacak olursak, açık havada olduğunu söyleyebiliriz. şehir trafiği nedir. Yani arabalar var. Bu bina ve hiyeroglif yapılandırmasına Güneydoğu Asya olduğunu tahmin edebilirsiniz. Mao Zedong portresi bu Pekin olduğunu anlamak ve herkes canlı video gördüm ya kendisi olsaydı, bu ünlü Tiananmen Meydanı olduğunu tahmin ediyorum.

Ne biz onu görerek, resimle ilgili daha fazla söyleyebiliriz? çit - Biz insanlar burada daha yakın olduğunu söylemek, görüntüdeki nesneleri tespit edebilir. İşte şemsiyeler, o binanın afişleri. Bu sınıfların örnekleri, şu an için arama yapan çok önemli nesneleri olarak düzenlenmiştir.

Hala özellikleri veya nesnelerin niteliklerinin bazılarını öğrenebilirsiniz. Örneğin, burada bu yani sıradan Çin, Mao Zedong portresi olmadığını belirleyebilir.

Araca göre bir hareketli nesne olduğunu tespit ve hareket esnasında deforme olmadığı, zor olabilir. bayraklar o nesneleri söylenebilir Hakkında, onlar da hareket ediyor, ancak, sert sürekli deforme değildir. Ve olay orada bayrakları geliştirerek belirlenebilir rüzgar, ve hatta rüzgarın yönü, örneğin, soldan sağa doğru üfleme belirleyebilir.

Yapay görme alanında mesafeleri ve uzunlukları

Çok önemli bilgisayar görme bilim hakkında metrik bilgidir. Bu mesafelerin her türlü olduğunu. Takımlar Dünya'dan yaklaşık 20 dakika olurlar Ve cevap çünkü Örneğin, gezici için özellikle önemlidir. Buna göre, orada ve geri bağlantı - 40 dakika. Dünya'yla hareketi komutları için bir plan yaparsanız, siz bunu göz önüne almak gerekir.

Başarıyla video oyunları bilgisayar görme teknolojisi entegre. Videoya göre, nesneler, insanlar üç boyutlu modeller oluşturabilir ve kullanıcı fotoğrafları şehirlerin üç boyutlu modellerini geri yükleyebilirsiniz. Sonra onlara yürümek.

bilgisayarla görme - Oldukça geniş. Yakından çeşitli diğer bilimler ile iç içedir. bilgisayar görme Bölüm Bu görüntü işleme alanı yakalar ve bazen tarihsel olarak, bilgisayarla görme ayırır.

Analiz, örüntü tanıma - Üstün zekalı yaratılmasına yol

Bize ayrı ayrı bu kavramları inceleyelim.

Görüntü İşleme - Görüntü ve biz ona bir şey yapmak zorunda - bu giriş ve çıkış hangi algoritmaların bir alandır.

görüntü analizi - iki boyutlu görüntü ile çalışan ve bundan bir sonuç yapmak odaklanır bilgisayar görme, alanıdır.

Desen Tanıma - vektörlerin biçimde veri tanır soyut matematiksel disiplin. Yani giriş de vardır - vektör ve onunla ilgili bir şey var. vektör olduğu durumlarda, biz bilmek çok önemli değildir.

Bilgisayar vizyon - başlangıçta iki boyutlu görüntülerin yapısını yeniden sağlamaktı. Bugün bu alanda daha geniş hale geldi ve resme göre, yapım fiziksel nesnelerin tüm kabulü olarak yorumlanabilir. Yani o iştir yapay zeka.

tamamen farklı bir alanda bilgisayar vizyonu paralelinde jeodezide, fotogrametri gelişti - nesneler arasında mesafe ölçümü iki boyutlu görüntülerde.

Robotlar "görebilir"

Ve nihayet - bu makine vizyondur. Makine görme altında robotların bir vizyon demektir. Yani bazı üretim sorunlarının karardır. büyük bir bilimdir - O bilgisayarla görme söyleyebiliriz. Diğer bilim kısmının bazı birleştirir. bilgisayarla görme herhangi bir uygulamayı alır ve çıktığında da her bir makine vizyonu dönüşür.

Bilgisayar vizyon bölge pratik uygulamaların bir kütleye sahiptir. Bu üretimin otomasyonu ile ilişkilidir. işletmelerin de makine tarafından el emeği yerine daha verimli hale gelir. Makine o düzensiz çalışma takvimi vardı, uyumuyor, doyum olmuyor, o yılda 365 gün çalışmaya isteklidir. Yani, makine işi kullanarak, biz belirli bir zamanda garantili sonucu alabilirsiniz ve oldukça ilginç. Tüm görevler bilgisayarla görme sistemleri için açık bir kullanımı vardır. Ve ancak hesaplama aşamasında resme sonuçları hemen görmek için daha iyi bir şey yoktur.

Yapay zeka dünyanın eşiğinde

Artı alanı - çok zor! görmeden sorumlu beyin önemli bir kısmı, ve bunu öğretmek eğer bilgisayarınız bu, tam kullanım bilgisayarla görme, tam yapay zeka hedeflerinden biridir, "görmek" için inanılmaktadır. İnsan düzeyde sorunu çözebilecek biri varsa, aynı anda büyük olasılıkla, biz AI sorununu çözecektir. Bu çok iyi! Ya çok iyi değil, eğer bakarsanız, "Terminatör 2".

Neden vizyon - bu zor? Aynı nesnenin görüntüsü değişebilir için büyük ölçüde dış etkenlere bağlı olarak değişir. gözlem noktalarının nesne bağlı farklı görünüyor.

Örneğin, bir ve aynı şekil, farklı açılardan. Ve bir göz, iki göz ve bir buçuk olabilir Şekilde en ilginç şeydir. Ve Bağlama göre (boyalı gözlü bir gömlek adamın bu görüntü ise), göz ikiden olabilir.

Bilgisayar hala anlamıyor ama "görür"

zor kılan bir diğer faktör - bu aydınlatma bulunuyor. Farklı aydınlatma ile aynı sahneyi farklı görünecektir. Nesne büyüklüğü değişebilir. Herhangi bir sınıfın Ayrıca nesneler. Eğer 2 metre olduğunu onun boyu bir adam hakkında nasıl söylersin? Hiçbir şey. İnsan büyüme ve 2,3 m ve 80 cm olabilir. Nesnelerin diğer türleri ile de, bununla birlikte, aynı sınıfın nesneleridir.

Özellikle yaşayan nesneler suşların çeşitli geçer. Saç insanlar, sporcular, hayvanlar. Onların yele ile oluyor ve kuyruk basitçe imkansız olduğunu belirlemek, çalışan atların resimleri bak. Bir resimde bir örtüşen nesneleri? Bir bilgisayar görüntüsü, hatta en güçlü makineyi kıpırdamak ise doğru karar vermek için zorluk bulabilirsiniz.

Sonraki görünüm - bir kılık değiştirme. Bazı nesneler, hayvanlar oldukça ustaca çevre gibi davrandığından, vb. Aynı noktalar ve renklendirici. Yine de, her zaman olmasa da uzaktan onları.

Başka bir sorun - hareketi. düşünülemez, hareket eden nesnelerin bir deformasyona uğrar.

Nesnelerin çoğu çok değişkendir. Burada, örneğin, "sandalye" nesneler altında iki fotoğraflarda.

Ve bu konuda size oturabilir. Ama şekil, renk, malzeme içinde farklı şeyler, her şey bir nesne "sandalye" olacak şekilde bir makine, öğretmek - çok zordur. Bu meydan okuma. Bilgisayarla görme yöntemlerini entegre etmek - spekülasyon, anlama, analiz için bir makine öğretmektir.

çeşitli platformlarda bilgisayar görme Entegrasyonu

Bilgisayarla görme kütlesi o ilk yüz dedektörü oluştururken, 2001 yılında daha nüfuz etmeye başladı. Viola Jones: Biz bunu iki yazar yaptı. Bu makina öğrenme yöntemler gücünü gösteren ilk hızlı ve güvenilir yeterince algoritması, oldu.

Şimdi bilgisayarla görme yeterince yeni pratik uygulamalara sahip - insan yüzüne tanınmasını.

Ama filmlerde olduğu gibi adamı tanımak - rasgele açılarda, farklı aydınlatma koşullarında - bu imkansızdır. Ama sorunu ya da farklı aydınlatma ile veya pasaport içinde fotoğraftaki gibi benzer farklı bir poz, farklı insanları olanı çözmek için, bu güven yüksek derecede mümkündür.

yüz tanıma algoritmaları özelliği büyük ölçüde Bir vesikalık fotoğraf gereksinimleri.

Eğer bir biyometrik pasaportu varsa Örneğin, bazı modern havaalanlarında, otomatik pasaport kontrol sistemini kullanabilirsiniz.

bilgisayar görme çözülmemiş sorun - herhangi bir metin tanıma yeteneği

Belki birisi OCR sistemini kullandı. Bunlardan biri - bir Güzel Reader RuNet sisteminde çok popüler. veri doldurmak birçok biçimi, bunlar mükemmel taranır bilgiler çok iyi sistem tarafından tanınan vardır. Ama resimde herhangi bir metin ile durum çok daha kötü. Bu sorun çözümsüz kalmaktadır.

bilgisayar vizyonu içeren Oyunları, hareket yakalama

Ayrı geniş alanı - üç boyutlu modeller ve (oldukça başarılı bir bilgisayar oyunlarında uygulanmaktadır) hareket yakalama yaratılmasıdır. Bilgisayar görme kullanan ilk program, - Bilgisayar hareketlerini kullanarak ile etkileşim sistemi. oluşturulduğu zaman açık bir çok şey oldu.

Algoritma oldukça basit tasarlanmış, ama bir milyon fotoğraflarını almak için insanların sentetik görüntülerinin bir jeneratör oluşturmak aldı yapılandırmak için kullanın. onlarla Süper bilgisayar o şimdi iyi çalışıyor bunun için algoritma, parametrelerini seçin.

Yani bir milyon görüntüleri ve olası hafta sayılabilen süper süresi gerçek zamanlı olarak konumunu algılamak için bir kişiyi bir işlemcinin kapasitesinin% 12'sini tüketir ve izin veren bir algoritma oluşturmak için bu. Bu, Microsoft Kinect sistemi (2010).

içeriğe göre görsel araması sisteme fotoğraf yüklemek için izin verir ve bunun sonuçları aynı içeriğe sahip tüm resimleri vermek ve aynı açıda yapılmış olacaktır.

Bilgisayarla görme örnekler: üç boyutlu ve iki boyutlu haritalar şimdi bununla yapılıyor. Navigasyon otomobiller için Haritalar düzenli DVR göre güncellenir.

coğrafi etiketli fotoğraflar milyarlarca bir veritabanı var. veritabanında resmini indirerek, o yaptı ve hatta bazı perspektifle nerede belirleyebilir. Tabii ki, yer turist bir anda yeterli olduğu popüler olması koşuluyla ve bölgenin fotoğraflardan oluşan bir dizi olmuştur yaptı.

robotlar her yerde

hiçbir şekilde onsuz her yerde günümüzde en Robotik. Şimdi sürücü (bu bir bilgisayar programı görüntülemek için bir bakıma, sürücünün yardımcı olur) komut göndermek için yayaların ve yol işaretlerini tanıması özel kameralar var araçlar vardır. Ve orada tam otomatik robot araçlar, ama bunlar ek bilgilerin büyük miktarda kullanmadan video kamera sistemine güvenmek mümkün değil.

Modern kamera - Bu bir analog karanlık kutu

dijital görüntünün bahsedelim. Modern dijital kameralar camera obscura esasına düzenlenir. Sadece yerine ışık ışını girer ve söz konusu devrenin bölmesinin arka duvarı üzerine yansıtılan olan deliğin, bir özel optik sistem lens adı sahiptir. Bu amacı, büyük ışık ışınını almak ve tüm ışınları görüntüyü elde ve film veya matris üzerinde bir görüntü oluşturmak üzere sanal bir noktaya geçirilmiş, böylece bunu dönüştürülmesidir.

Modern dijital kameralar (matris), ayrı ayrı elemanlardan oluşmaktadır - piksel. Her piksel piksel toplam gelen ışığın enerji ölçümü ve bir çıkış numara verebilir. Bu nedenle, bir dijital kamerada, bunun yerine tek bir piksel yakalandı görüntü parlaklığı ayarlamak ışık ölçümlerinin ait olsun - Bilgisayar görüş alanını. Bu nedenle, gördüğümüz görüntü hatları ve net hatlarını ve farklı renklerdeki renkli kareler oluşan bir ızgara akan değilken - piksel.

Dünyada ilk dijital görüntüyü görmek görebilirsiniz.

Ama bu resimde değil mi? Renk. renk nedir?

rengin psikolojik algı

Renk - Bu gördüğümüz budur. İnsanlarda ve kediler için birinin rengi ve aynı şey farklı olacaktır. biz (insanlarda) ve hayvan optik sisteme beri - vizyon farklıdır. Bu nedenle, renk - bu nesneleri ve ışık gözlemleyerek oluşur vizyonumuzun psikolojik kalitesidir. Ve nesne ve ışık fiziksel özellik. Renk - ışık bileşenlerinin etkileşimi ve bizim görme sisteminin sahnenin sonucudur.

Python kullanarak kütüphanelerde Programlama Bilgisayar Görme

Eğer bilgisayar görme çalışmada ciddi bir şekilde rol karar verdiyseniz, hemen zorluklar bir dizi hazırlanması gerektiğini, bu bilim kolay değildir ve tuzaklar bir dizi gizler. Ama Jan Erik Solema yazarının "Python üzerinde Programlama Bilgisayar Görme" - tüm en basit dili ana hatlarıyla bir kitap. Burada 3D çeşitli nesnelerin tanınması yöntemleriyle ilgili bilgi edinecekler, stereo görüntü, sanal gerçeklik ve bilgisayar görüşü birçok diğer uygulamalarla çalışmayı öğrenirler. Kitapta Python yeterli örneklerdir. Fakat açıklamalar çok fazla araştırma ve sabit verileri aşırı etmemek için, böylece genelleşmiş, deyim yerindeyse, sunulmuştur. Öğrencilerin, amatör ve meraklıları için uygundur çalışın. bilgisayarla görme (pdf-formatında) hakkında bu kitabı ve diğerlerini indirin ağda olabilir.

Şu anda, bilgisayar vizyonu ve görüntü işleme ve sayısal algoritmalar OpenCV açık kaynak kütüphanesi vardır. Çoğu modern programlama dilleri üzerine uygulanan, açık kaynaklıdır. Biz bilgisayar vizyonu hakkında konuşursak, Python o da kütüphane desteği vardır, bir programlama dili olarak kullanır, ek olarak, sürekli gelişen ve büyük bir topluluk vardır.

Şirket "Microsoft" hizmetlerini Api-muktedir insanların görüntüleri ile çalışmak için sinir ağı eğitmek için sağlar. bilgisayar vizyonu uygulamak için fırsat da vardır, Python programlama dili olarak kullanır.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 tr.delachieve.com. Theme powered by WordPress.