Object türündeki veri kategoriye dönüştürülürken sıralaması kaybolabiliyor. Sıralamayı koruyarak dönüştürme işleminin açıklamaları ve kodlarını buraya ekliyorum. Açıklamalar resimlerin içinde ve kodlar en aşağıda..
Kodlar:# Veriyi indirme ve genel bakış:
import seaborn as sns
diamonds = sns.load_dataset('diamonds')
df = diamonds.copy()
df.head()
# ordinal tanımlama: Kategorik veri türünü import ediyoruz.
from pandas.api.types import CategoricalDtype
# "Cut" kolonundaki ilk 5 gözleme bakış
df.cut.head()
# "Cut" kolonunun verisini object'ten kategori türüne dönüştürme:
df.cut = df.cut.astype(CategoricalDtype(ordered = True))
# "Cut" kolonu verisinin yeni türünü kontrol etme:
df.cut.dtypes
# "Cut" kolonunun verisinin kategori sıralamasını kontrol etme:
df.cut.head(1)
# listemiz:
cut_kategoriler = ["Fair","Good","Very Good","Premium","Ideal"]
# ve bu listeyi doğru sıralama olarak kategoriye tanıtıyoruz:
df.cut = df.cut.astype(CategoricalDtype(categories = cut_kategoriler, ordered = True))
# listeye göre sıralanıp sıralanmadığını kontrol ediyoruz:
df.cut.head(1)
Hiç yorum yok:
Yorum Gönder