Birbirine benzer veriler içeren iki dataframe'den (örneğin aynı projedeki test ve train verileri) birinde olup diğerinde olmayan kolonun -ya da kolonların- adını bulmak için gereken kod aşağıda. Örneğimizde doğal olarak bağımlı değişken (dependent variable) yani "y" durumundaki satış fiyatı kolonu sonuç olarak karşımıza çıkıyor. (+ Öncesinde train_cols ve test_cols'u tanımlıyoruz.)
train_cols=train_data.columns
test_cols=test_data.columns
list_difference = []
for item in train_cols:
if item not in test_cols:
list_difference.append(item)
print(list_difference)
for item in train_cols:
if item not in test_cols:
list_difference.append(item)
print(list_difference)