Erge Teknoloji

Loading

Veri Bilimci Kimdir?

Veri Bilimcisi, büyük veri setlerini analiz eden, bu analizlerden anlamlı bilgiler çıkaran ve bu bilgileri stratejik kararlar almaları için işletmelere sunan bir profesyoneldir.

Veri Bilimcisi:

  • Matematik,
  • İstatistik,
  • Bilgisayar bilimi,
  • Endüstri

gibi alanlardan gelen bilgileri birleştirerek veri odaklı çözümler üretir.

Geçtiğimiz yüzyılda okuryazarlık neyse, 21. yüzyıl için veri okuryazarlığı aynı şeydir.

Veri Bilimi

Birinci Aşama: Problemin anlaşılması 

İşin anlaşılması olan bu aşamada alan bilgisi çok önemlidir. Problemi doğru bir şekilde tanımlayarak kapsamı daraltamazsak o zaman proje ekibi ilerleyen aşamalarda dağılabilir. Bu sebeple problemin tanımlanması aşamasında uygun bir proje ekibinin de oluşturulması esastır.

İkinci Aşama: Verinin tanımlanması 

Problemi temsil eden veri alt yapısı nasıl elde ediliyor? Analiz için bir veri kümesine ihtiyacımız var. O veri kümesine hangi veri kaynaklarından alacağız? Veri kaynaklarıyla nasıl iletişim kuracağız? Veri kaynaklarının birbirleriyle bağlantısını nasıl sağlayacağız gibi daha operasyonel problemlere çözüm bulunan aşamadır.

Üçüncü Aşama: Veriyi düzenleme

Verinin içerisinde eksiklikler olabilir boyutu çok büyük olabilir. Bunu küçültmemiz gerekebilir veriyi Dolayısıyla belli görselleştirme araçlarıyla önce bir anlamaya çalışırız. Burası da verinin düzenlenme aşamasıdır

Dördüncü Aşama: Analiz

Değişkenliğe sebep olan faktörlerin bulunması. Onlarca Yapay Zeka algoritmasının ana amacı değişkenliği veya entropiyi açıklamaktır. Dolayısıyla eğer problemi doğru bir veri kümesiyle giremezseniz istediğiniz algoritmayı kullanın istediğiniz veri bilimi istediğiniz makine öğrenmesi algoritmasını çalıştırın hiçbir işe yaramaz. Problemi anlayacaksınız, sahayı anlayacaksınız, tecrübeyi kullanacaksınız.

Beşinci aşama: Doğrulama 

Algoritmayı deneyeceksiniz bunu denedikten sonra sahada bunun test edilmesi var. yani elde etmiş olduğunuz matematiksel Algoritma her zaman başarı olacak diye bir şey yok Bunu test ederek doğruluğunu onaylamanız gerekiyor

Altıncı aşama: Yaygınlaştırma 

Artık sahada uzun süre kullanabileceğimiz bir yaygınlaştırma aşamasına geçmemiz gerekir. Buna da depoyment deriz. Sahadaki son kullanıcı bir telefon veya bilgisayar uygulaması olarak bu algoritmayı kullanabilir. Bunun tasarlanması kullanıcı deneyiminin analiz edilmesi bu aşmadır.

Yedinci aşama: Modeli kalıcı hale getirmek.

Veriler her zaman aynı dağılımda aynı şekilde gelmez. Problemin yapısı değişebilir. O yüzden de bu matematiksel modeli bazen güncellememiz gerekebilir.