11 Nisan 2022 Pazartesi

Object türündeki veriyi sıralamayı koruyarak kategori türüne dönüştürme

Object türündeki veri kategoriye dönüştürülürken sıralaması kaybolabiliyor. Sıralamayı koruyarak dönüştürme işleminin açıklamaları ve kodlarını buraya ekliyorum. Açıklamalar resimlerin içinde ve kodlar en aşağıda..


Kodlar:

# Veriyi indirme ve genel bakış:
import seaborn as sns
diamonds = sns.load_dataset('diamonds')
df = diamonds.copy()
df.head()

# ordinal tanımlama: Kategorik veri türünü import ediyoruz. 
from pandas.api.types import CategoricalDtype

# "Cut" kolonundaki ilk 5 gözleme bakış
df.cut.head()

# "Cut" kolonunun verisini object'ten kategori türüne dönüştürme:
df.cut = df.cut.astype(CategoricalDtype(ordered = True))

# "Cut" kolonu verisinin yeni türünü kontrol etme:
df.cut.dtypes

# "Cut" kolonunun verisinin kategori sıralamasını kontrol etme:
df.cut.head(1)

# listemiz:
cut_kategoriler = ["Fair","Good","Very Good","Premium","Ideal"]

# ve bu listeyi doğru sıralama olarak kategoriye tanıtıyoruz:
df.cut = df.cut.astype(CategoricalDtype(categories = cut_kategoriler, ordered = True))

# listeye göre sıralanıp sıralanmadığını kontrol ediyoruz:
df.cut.head(1)

Hiç yorum yok:

Yorum Gönder