oguzhanata
Üye
- Konum
- Ankara
- İsim
- Oğuzhan Ata
Daha fazla
- İsim
- Oğuzhan Ata
- Değirmen
- Timemore Chestnut Nano, Comandante c40
- Ekipmanlar
- V60, Aeropress, Mokapot, Frech Press, Kalita
- Kahve Arkadaşlığı İstiyor musunuz?
- Evet
- Kahve Arkadaşlığı İl
- Ankara
- Kahve Arkadaşlığı İlçe 1
- Yenimahalle
- Kahve Arkadaşlığı İlçe 2
- Beytepe
Coffee Ad Astra isimli mükemmel Blog-Web sitesinin kahveden aldığımız tatlara kahvenin varyetesinin ve işlenme yönteminin etkisini araştırdığı harika veri analizi çalışmasının bir kısmını Türkçe özet olarak yazmak istedim. Makale’nin linkini en sona ekleyeceğim, daha fazlasını görmek için kesinlikle ziyaret etmelisiniz.
James Hoffman’ın “The World Atlas of Coffee” kitabını okuduktan sonra varyete ve işlenme yöntemine göre kahvelerin farklı bir tat yapısı olup olmadığını merak etmiş. Bunu analiz etmek için de Alex isimli arkadaşını aramış. Alex arkadaşımız “firstbloom” isimli uygulamayı tasarlayanlardan biriymiş ve bu uygulama içinde kafeler, kavurucular, kahve severler içtikleri kahveler hakkında yorum yapıyorlarmış. Alex elindeki 1500 tane kahve paketine ait varyete, işleme yöntemi, tadım notu vs. bilgileri göndermiş. İşin güzel tarafı bundan sonra başlıyor .
Analizi yapan kişinin elinde çok güzel bir ham-veri var. Bu veri analizini görselleştirmeyi “Word Cloud” isimli yöntem ile yapmış. Bu yönteme göre bir çekirdek hakkında yapılan yorumlar analiz ediliyor ve tadım notlarında yer alan anahtar kelimeler (Şeftali, çayımsı vs.) kullanılma sıklığına göre bir boyut kazanarak karşımıza çıkıyor. Yani bir kelime aynı çekirdek için ne kadar çok kullanılmışsa bulut içinde kapladığı alan da o kadar büyük oluyor. Örneğin:
Şekilde görüldüğü gibi bazı kelimeler (Caramel, Chocolate) diğerlerine göre daha büyük. Bunun anlamı, bu kahveyi tadanların daha büyük çoğunluğunun bu tatları aldığı. Bu da bize genelleme yapma şansı tanıyor.
Arkadaş bu yöntemi bir adım öteye götürmüş. Amacı, spesifik olarak varyete ve işleme yöntemine göre çekirdekteki tat profilini ayrıştırabilmek. Eğer her varyete ve yönteme göre bu sözcük bulutu ayrı ayrı oluşturulursa, ağırlıklandırma sadece varyete içinde yapılmış olacağı için, farklı varyetelere göre bir karşılaştırma tam olarak istenen sonucu vermeyecektir. Bunun önüne geçmek için basit bir yöntem izlemiş: Örneğin, tüm varyetelerde anahtar kelime (tat profili) olarak “çikolata” kullanılmış olsun. Buna karşın, X varyetesinde “çikolata” kelimesi diğer varyetelerde kullanıldığından daha fazla kullanılmış olsun. Bu durumda X varyetesi için oluşturulmuş kelime bulutunda “çikolata” kelimesi normalde olacağından daha büyük bir hale gelecek, bu da bize bu tat profilinin diğer varyetelere göre bu varyetede daha baskın olduğunu söyleyecektir. Bunu yaparken karşımıza bir sorun daha çıkıyor. Eğer x varyetesi için kullanılmış bir anahtar kelime, diğer hiçbir varyetede kullanılmamışsa, x’in kelime bulutunda bu kelime aşırı şekilde büyük olacaktır. Bunun önüne geçmek için en fazla 3,3 kat büyüme sınırı koymuş.
Biraz karışık gibi duruyor ancak birazdan örnekler gelince daha rahat anlaşılacaktır diye düşünüyorum.
Kahve Varyetesine Göre Tadım Profili
Başlıktan da anlaşılacağı üzere kahve varyetelerinin tat yapısına nasıl bir etkisi olduğuna bakıyoruz burada. Burada varyete hariç değişkenleri sabit tutabilmek için yalnızca yıkanmış olan çekirdekleri kullanmış.
James Hoffman’ın “The World Atlas of Coffee” kitabını okuduktan sonra varyete ve işlenme yöntemine göre kahvelerin farklı bir tat yapısı olup olmadığını merak etmiş. Bunu analiz etmek için de Alex isimli arkadaşını aramış. Alex arkadaşımız “firstbloom” isimli uygulamayı tasarlayanlardan biriymiş ve bu uygulama içinde kafeler, kavurucular, kahve severler içtikleri kahveler hakkında yorum yapıyorlarmış. Alex elindeki 1500 tane kahve paketine ait varyete, işleme yöntemi, tadım notu vs. bilgileri göndermiş. İşin güzel tarafı bundan sonra başlıyor .
Analizi yapan kişinin elinde çok güzel bir ham-veri var. Bu veri analizini görselleştirmeyi “Word Cloud” isimli yöntem ile yapmış. Bu yönteme göre bir çekirdek hakkında yapılan yorumlar analiz ediliyor ve tadım notlarında yer alan anahtar kelimeler (Şeftali, çayımsı vs.) kullanılma sıklığına göre bir boyut kazanarak karşımıza çıkıyor. Yani bir kelime aynı çekirdek için ne kadar çok kullanılmışsa bulut içinde kapladığı alan da o kadar büyük oluyor. Örneğin:
Şekilde görüldüğü gibi bazı kelimeler (Caramel, Chocolate) diğerlerine göre daha büyük. Bunun anlamı, bu kahveyi tadanların daha büyük çoğunluğunun bu tatları aldığı. Bu da bize genelleme yapma şansı tanıyor.
Arkadaş bu yöntemi bir adım öteye götürmüş. Amacı, spesifik olarak varyete ve işleme yöntemine göre çekirdekteki tat profilini ayrıştırabilmek. Eğer her varyete ve yönteme göre bu sözcük bulutu ayrı ayrı oluşturulursa, ağırlıklandırma sadece varyete içinde yapılmış olacağı için, farklı varyetelere göre bir karşılaştırma tam olarak istenen sonucu vermeyecektir. Bunun önüne geçmek için basit bir yöntem izlemiş: Örneğin, tüm varyetelerde anahtar kelime (tat profili) olarak “çikolata” kullanılmış olsun. Buna karşın, X varyetesinde “çikolata” kelimesi diğer varyetelerde kullanıldığından daha fazla kullanılmış olsun. Bu durumda X varyetesi için oluşturulmuş kelime bulutunda “çikolata” kelimesi normalde olacağından daha büyük bir hale gelecek, bu da bize bu tat profilinin diğer varyetelere göre bu varyetede daha baskın olduğunu söyleyecektir. Bunu yaparken karşımıza bir sorun daha çıkıyor. Eğer x varyetesi için kullanılmış bir anahtar kelime, diğer hiçbir varyetede kullanılmamışsa, x’in kelime bulutunda bu kelime aşırı şekilde büyük olacaktır. Bunun önüne geçmek için en fazla 3,3 kat büyüme sınırı koymuş.
Biraz karışık gibi duruyor ancak birazdan örnekler gelince daha rahat anlaşılacaktır diye düşünüyorum.
Kahve Varyetesine Göre Tadım Profili
Başlıktan da anlaşılacağı üzere kahve varyetelerinin tat yapısına nasıl bir etkisi olduğuna bakıyoruz burada. Burada varyete hariç değişkenleri sabit tutabilmek için yalnızca yıkanmış olan çekirdekleri kullanmış.