
1. Python Nedir?
Python, kolay okunabilir ve güçlü bir programlama dilidir. Veri analizi, makine öğrenimi, otomasyon ve web geliştirme gibi birçok alanda kullanılır. SQL ve Power BI ile entegrasyonu sayesinde, veri analitiği süreçlerinde büyük rol oynar.
Python’un Avantajları
- Kolay Sözdizimi: Öğrenmesi ve yazması kolaydır.
- Geniş Kütüphane Desteği: Pandas, NumPy, Matplotlib, Scikit-learn gibi birçok kütüphane barındırır.
- Çok Yönlülük: Veri analizi, web geliştirme, otomasyon gibi birçok alanda kullanılabilir.
- Topluluk Desteği: Geniş bir kullanıcı topluluğu ve bol dokümantasyon desteği sunar.
2. Python’un Temel Kavramları
2.1 Değişkenler ve Veri Tipleri
Python’da en yaygın kullanılan veri tipleri şunlardır:
# String (Metin)
isim = "Ali"
# Integer (Tam sayı)
yas = 25
# Float (Ondalıklı sayı)
maas = 7500.50
# Boolean (Mantıksal değer)
aktif_mi = True
2.2 Listeler ve Sözlükler
Python’da veri saklamak için listeler ve sözlükler sıkça kullanılır.
# Liste
sehirler = ["İstanbul", "Ankara", "İzmir"]
print(sehirler[0]) # İstanbul
# Sözlük
calisan = {"isim": "Ali", "departman": "IT", "maas": 7500}
print(calisan["departman"]) # IT
3. Veri Analizinde Kullanılan Kütüphaneler
3.1 NumPy: Sayısal İşlemler
NumPy, büyük veri kümeleri üzerinde hızlı matematiksel işlemler yapmak için kullanılır.
import numpy as np
data = np.array([10, 20, 30, 40])
print(np.mean(data)) # Ortalama hesaplar
3.2 Pandas: Veri İşleme ve Manipülasyon
Pandas, tablolar halinde veri işlemek için en yaygın kullanılan kütüphanelerden biridir.
import pandas as pd
df = pd.DataFrame({
"isim": ["Ali", "Veli", "Ayşe"],
"maas": [7000, 8000, 7500]
})
print(df.head())
3.3 Matplotlib ve Seaborn: Veri Görselleştirme
Matplotlib ve Seaborn, verileri görselleştirmek için kullanılır.
import matplotlib.pyplot as plt
import seaborn as sns
data = [5, 10, 15, 20, 25]
plt.plot(data)
plt.show()
4. Python ile Veri Analizi
4.1 Veri Okuma
Pandas ile CSV dosyalarını okuyabiliriz.
df = pd.read_csv("veri.csv")
print(df.head())
4.2 Veri Temizleme
Eksik verileri doldurmak veya kaldırmak için Pandas kullanılır.
df.dropna(inplace=True) # Eksik verileri kaldırır
4.3 Veri Filtreleme
Belirli koşullara göre veri seçmek için kullanılır.
filtrelenmis_df = df[df["maas"] > 7500]
print(filtrelenmis_df)
4.4 Gruplama ve Özetleme
Gruplandırma işlemleri için Pandas’ın groupby() fonksiyonu kullanılır.
departman_maas = df.groupby("departman")["maas"].mean()
print(departman_maas)
5. Python’da İleri Seviye Konular
5.1 Fonksiyonlar ve Lambda İfadeleri
Python’da fonksiyonlar veri analizi süreçlerini daha modüler hale getirir.
def kare_al(sayi):
return sayi ** 2
print(kare_al(4)) # 16
# Lambda fonksiyonu
karesi = lambda x: x ** 2
print(karesi(5)) # 25
5.2 SQL ile Python Kullanımı
Python, SQL sorgularını çalıştırmak için SQLite veya SQLAlchemy gibi kütüphaneleri kullanabilir.
import sqlite3
conn = sqlite3.connect("veritabani.db")
cursor = conn.cursor()
cursor.execute("SELECT * FROM calisanlar")
veri = cursor.fetchall()
print(veri)
5.3 Makine Öğrenimi ile Veri Analizi
Makine öğrenimi için Scikit-learn gibi kütüphaneler kullanılabilir.
from sklearn.linear_model import LinearRegression
model = LinearRegression()
6. Örnek Python Projesi: Maaş Tahmin Modeli
📌 Proje Konusu: Çalışanların deneyim yıllarına göre maaşlarını tahmin eden bir model oluşturacağız.
🔹 Adımlar:
- Veri Setini Oku
df = pd.read_csv("calisan_maas.csv")
- Bağımsız ve Bağımlı Değişkenleri Belirle
X = df[["deneyim_yili"]]
y = df["maas"]
- Modeli Eğit
model = LinearRegression()
model.fit(X, y)
- Tahmin Yap
tahmin = model.predict([[5]]) # 5 yıl deneyimi olan bir çalışanın maaşını tahmin et
print(tahmin)
Python, veri analizi için en güçlü araçlardan biridir. Bu rehberde, temel Python sözdiziminden veri işleme, görselleştirme ve makine öğrenimi başlıklarının içeriklerini sunduk. Eğitim içerikleri daha kapsamlı bir hale getirilerek güncellenmeye devam edecek.