İnsan Kaynaklarında, veri kümeleri oluşturma ve çeşitli analiz yöntemleri ile karar alma, stratejiyi dizayn etmekle ilgili çalışmalara başlamadan önce veri bilimi nedir?, veri biliminde kullanılan araçlar nelerdir?, veri oluşturmanın aşamaları nelerdir? gibi temel bilgileri de öğrenmek istemiştim. Veri bilimi ile ilgili İngilizce kaynak oldukça fazla. Güzel içeriklere sahip makaleler ve kitaplar da var.

Dublin Technological University’den John D. Keller ve Dublin Institute of Technology’den Brendan Tierney’in yazdığı “Data Science” kitabı bu alanı temel olarak öğrenmek isteyen ve merakı olanlar için oldukça güzel bir kaynak.

Veri bilimi, yapay öğrenme, veri madenciliği gibi temelde birbirine çok karıştırılan terimlerden, veri biriktirme ve veri analizi tarihine kadar bir çok giriş seviyesinde merak edilen konuya yalın bir dille değinmişler. Aynı zamanda bu alanda kullanılan geçmiş ve güncel teknolojilere de alandan olmayan birinin anlayabileceği şekilde örneklerle yer vermişler.

Kitapta dikkatimi çeken konulardan biri CRISP-DM (Cross Industry Standard Process for Data Mining) Veri Madenciliğinde Standart Süreç oldu. İş Zekası ekiplerinin işe alım sürecinde adaylar sorumluluklarını anlatırlarken anlamadığım ve havada kalan konuları CRISP-DM yaşam döngüsü ile aslında oturtmuş oldum. CRISP-DM, birkaç yıldan beri çeşitli sektörlerde kullanılan her tür yazılım, sağlayıcı ya da veri analizi tekniğinden bağımsız işleyebilecek yetkinlikte bir süreç olması nedeniyle yaygın olarak kullanıyormuş. İşin anlaşılması, verinin anlaşılması, verinin hazırlanması, modelleme, değerlendirme ve konuşlandırma aşamalarından oluşuyormuş. Süreç yarı yapılandırılmış olduğu için veri bilimci bu aşamalar arasında doğrusal hareket etmeyip belirli bir aşamanın neticesine bağlı olarak bir önceki aşamalara dönebiliyormuş.

Dikkatimi çeken bir diğer konu ise Yapay Öğrenmede kullanılan tahmin modelleri. Korelasyon, doğrusal regresyon, sinir ağları ve derin öğrenme, karar ağaçları hangi alanlarda nasıl kullanıldığında doğru sonuçlar verebilir kısmını örneklerle çok güzel anlatmışlar. Bölümün sonunda bir araştırmadan güzel bir örnekte paylaşmışlar. Brynjolfsson, Hitt ve Kim’in 2011 yılında 179 halka açık şirkette yaptığı bir araştırmada firmanın karar alma süreci ne kadar veri güdümlü olursa, firmanın beklenenden %5-6 kadar daha yüksek bir randıman ve üretkenliğe sahip olduğunu bulmuşlar.

Bu kitabı okumanın bana katkısı, iş alanımla ilgili iş zekası ekipleriyle çalışmam gerektiğinde neye dikkat edeceğimi, problemin ne olduğunu tanımlarken onlara nasıl kolay yardımcı olabileceğimi ve veri kümeleri oluştururken hassas olunması gereken noktaları anlamak oldu. Tabii ki bir de bu kadar gündemde olan “Veri”yi ve bu alanda kullanılan teknolojileri de öğrenmek benim için önemliydi.

Teknik biri olmasam da iş süreçlerini kolaylaştırmak ve teknik ekiplerle birlikte daha rahat çalışabilmek adına teknolojiyi yakından takip etmenin kıymetli olduğunu düşünüyorum. Eğer siz de veri bilimini merak ediyorsanız bahsettiğim kitap teknik olmayan biri için güzel bir giriş olabilir.

Zeynep Demir

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir