Python’da Veri Görselleştirme (Matplotlib)

Verilerin görselleştirilmesi, veri analizinde omurgasıdır. Veriler ile görselleştirmeleri arasındaki bağın sağlam kurulmasında verilerin ön işleme evresi önem arz etmektedir. Veri görselleştirme temel olarak dört başlık altında toplanabilir. Bir popülasyonun özetlenmesi, Popülasyonların karşılaştırılması, İki özellik arasındaki ilişkiyi araştırmak, Görsel boyutlar ekleme, Trendleri gösterme ve karşılaştırmadır.

Veri nesnesinin popülasyonları genelinde bir veri kümesi içerisindeki bir sütununun değerlerindeki varyasyonları görselleştirmek için histogram, kutu grafiği veya çubuk grafik gibi basit araçlar kullanılmaktadır. Sayısal ve kategorik özellikler, her bir özellik türüne göre farklı görselleştirme araçları gerektirmektedir. Örneğin; kategorik olan bir özellik için çubuk grafik kullanıyor olmak verimli iken, sayısal olan özellikler için histogram ve kutu grafiğini kullanıyor olmak verimlidir. Matplotlib'in mimarisi mantıksal olarak üç farklı seviyeye yerleştirilmiş üç katman halinde yapılandırılmıştır. Bu üç katman aşağıdaki gibidir. Scripting, Artist, Backend şeklindedir.

İlkel sınıf: 2D, dikdörtgen veya geometrik şekillerin hatta metinlerin grafiksel olarak temsil edilmesinde temel ögeleri oluşturan sınıftır.

Kompozit sınıf: Bir grafik içerisinde birden fazla ilkel sınıf ögesinin bulunmasıyla oluşan sınıftır. Kompozit sınıf içerisinde “Axis, Ticks, Axes ve Figures” bulunmaktadır. Genel olarak veriler kompozit sınıfa uygundur.

Figure: Hiyerarşide en yüksek seviyede bulunur. Tüm grafik gösterimlerine karşılık gelen alanı ifade etmektedir. İçerisinde birden fazla Axes bulundurmaktadır.

Axes: Genellikle çizim veya grafik olarak ifade edilmektedir. Her Axis nesnesi bir şekle aittir. 2 boyutlu yapıda iki Axis ve bir başlıktan oluşan yapıya Axes denilmektedir. Boyut sayısı artırıldıkça Axis sayısı artmaktadır.

Ticks: Axis üzerindeki işaretlemelerin (ticks) ifade edildiği alanları göstermektedir. Ticklerin pozisyonu “Locator” olarak adlandırılmaktadır. Ticklerin formatları ise “Formatter” olarak tanımlanmaktadır.

Pyplot’da aksi durumlar belirtilmediği sürece çizgiler düz bir eksen üzerinde gösterilmektedir. Dolayısıyla eğer aksi bir durum belirtilmez ise Pyplot; Eksenlerin boyutunu veri giriş aralığına göre ayarlamaktadır. Başlık ve Ticks eklenmeden bastırılır. Noktalar mavi bir çizgi ile çizilir. Herhangi bir özel işaret belirtmez.

Çizilen grafikler için başlıklar açıklayıcı ifadeler sağlamaktadır. Bir çizimin içeriğinin hangi konuda olduğunu belirtmek için başlık kullanılmalıdır. Çizilen grafiğin başlığı belirlenirken “title()” komutu kullanılmaktadır.

Bir grafiği oluşturan nesnelerin birden fazla karakteristik özelliği bulunmaktadır. Bu özelliklerin tümü başlangıçta varsayılan olarak atanır ve grafikler bu varsayılan değerlere göre oluşturulmaktadır. Eğer bu özellikler kullanıcılar tarafından dizayn edilmek isteniyorsa “kwargs” komutu ile ilgili varsayımlar kaldırıp, kullanıcıların isteği şekilde yeniden dizayn edilebilir. Kwargs’lar “args” anahtar kelimesi ile birlikte kullanılmaktadır.