Neler yeni

Baştan Başlayabilseydim Veri Bilimini Nasıl Öğrenirdim

  • Konbuyu başlatan muqo
  • Başlangıç tarihi
  • Cevaplar 1
  • Görüntüleme 598

muqo

Aktif Üye
Uzman
Katılım
24 Eki 2022
Konular
60
Mesajlar
154
Puanları
2,223
ModArt Kredi
0

Veri Bilimini Nasıl Yeniden Öğrenirim?

Aşağıda, veri bilimini baştan öğrenmek zorunda kalsaydım öğrenmeme rehberlik etmesi için kullanacağım basitleştirilmiş ve genelleştirilmiş bir akış şeması var. Mümkün olduğu kadar kapsamlı hale getirmek için %100 eksiksizlik karşılığında bu akış şemasının basitliğini yeniden vurgulamak istiyorum .

Yüksek düzeyde, akış şeması aşağıdaki adımlara bölünebilir:

  1. Temel beceriler, SQL ve Python ile başlayın.
  2. İlginizin daha çok işle ilgili rollerde mi yoksa araştırmayla ilgili rollerde mi olduğuna karar verin.
  3. 2. Adımda seçtiğiniz şeye bağlı olarak, sizi ilgilendiren ve daha derine dalmak ve tekrarlamak istediğiniz özel bir konu seçin.
Her adımı daha ayrıntılı olarak inceleyelim…

Temel Beceriler

Uzmanlaşmak istediğiniz uzmanlık alanı ne olursa olsun, SQL ve Python'da nasıl kod yazılacağını bilmeniz kaçınılmazdır. Bu nedenle, başlangıç noktası olarak kodlamayı öğrenmenizi tavsiye ederim.

SQL

SQL evrensel veri dilidir. İster veri bilimcisi, ister veri analisti, makine öğrenimi mühendisi, veri mühendisi veya bu rollerden herhangi birinin karışımı olun, SQL bilmeniz gerekecek.
SQL'i bu sırayla birkaç kaynaktan nasıl öğrenirim:

  • Mode SQL Eğitimi : Bu şimdiye kadar karşılaştığım en iyi SQL kursu. Ücretsiz, kapsamlı ve iyi yazılmış. Bunun üzerinden geçmek için zaman ayırın ve uygulama sorularıyla bilginizi pekiştirin. Her şeyi ezberlemenize gerek yok ama elinizdeki araçlar hakkında genel bir fikriniz olmalı.
  • DataLemur : Temel bir SQL anlayışına sahip olduğunuzda, DataLemur'da Leetcode benzeri sorulardan oluşan bir havuz bulunur, ancak özellikle SQL için! Bu soruların çoğunu tamamlayabiliyorsanız, nispeten karmaşık sorgular yazma becerinize güvenmelisiniz.

Python/Pandalar

Python, veri bilimcileri için önemlidir, özellikle de Python'un yararlı olan pek çok paketi ve uzantısı olduğu için. R, bir alternatif kadar eşit derecede iyidir, ancak veri bilimi dünyasında benimsenen ana dil gibi görünmüyor.
Python'u öğrenmek, SQL'den biraz daha kolay çünkü Python'un proje oluşturmaya çalışırken olduğu gibi "yaparak" daha iyi öğrenildiğini keşfettim. Bununla birlikte, kariyerimde yararlı bulduğum birkaç kaynak:

  • Codecademy : Python'un temellerini ve genel olarak programlamayı öğrenmek için Codecademy, temelleri öğrenmek için samimi bir kaynaktır.
  • Pandas Alıştırma Problemleri : Pandas, SQL gibi bir veri işleme dilidir. DataLemur'a benzer şekilde, bu depoda Pandaları nasıl kullanacağınızı öğrenmek için derinlemesine inceleyebileceğiniz düzinelerce alıştırma problemi vardır. Benim tavsiyem Pandaları soru cevapları birlikte inceleyerek öğrenmenizdir.

Uzmanlaşmış Beceriler

Temel bilgileri öğrendikten sonra, uzmanlaşabileceğiniz birkaç konu vardır. Önce neye odaklanacağımı nasıl belirleyeceğim, kendimi İş Dünyasına Yönelik Veri Bilimcisi mi yoksa Araştırmaya Yönelik Veri Bilimcisi olarak mı gördüğüme bağlıdır.
İş dünyasına bakan bir veri bilimcisi , işi doğrudan etkileyen girişimlere odaklanır ve neredeyse bir danışman gibi iş paydaşlarıyla doğrudan çalışma eğilimindedir. Projeler ve gerekli beceriler daha çok iş problemlerini doğrudan çözme etrafında döner, projelerin yaşam döngüsü nispeten daha kısadır ve kişinin çalışmasının etkisi sürekli olarak görülür.
Araştırmaya bakan bir veri bilimcisi , daha çok bir araştırmacı veya doktora öğrencisi gibi davranır. Öğrenci. Karmaşık modeller oluşturmak veya karmaşık araştırma soruları yürütmek gibi daha uzun vadeli projeler üzerinde çalışacak. Projelerin yaşam döngüsü nispeten daha uzundur ve iş, maliyet-fayda ödünleşimine bağlı olarak işletme tarafından kullanılabilir veya kullanılmayabilir.
İş üzerinde daha fazla doğrudan etkisi olan bir rolü sürdürmeyi seçerseniz, o zaman deney ve çıkarım, analitik ve içgörüler ve görselleştirmeler olmak üzere daha derine ineceğim üç alt kategori vardır.

Deney ve Çıkarım

Deney ve Çıkarım, iki değişken arasındaki neden-sonuç ilişkisini belirlemek için kullanılan bir dizi tekniği ifade eder. Bu, bir işletmenin başarının itici güçlerini ve nihayetinde işletmelerin öğrenmesine, yinelemesine ve gelişmesine neyin izin verdiğini anlaması için son derece önemlidir.
Temel bilgileri öğrenmek için başlangıç kaynakları aşağıda verilmiştir:

  • İstatistikler: Olasılık ve İstatistikler @ Georgia Tech
  • Deney Tasarımı: Deney Tasarımı @ PennState
  • Nedensel Çıkarım: Brady Neal

Analitik ve İçgörüler

Analitik , verilerin düzenlenmesi ve incelenmesi anlamına gelirken içgörüler , verilerdeki kalıplar ve anormallikler gibi bilgilerin keşfedilmesi anlamına gelir. Analitik ve içgörülere odaklanan Veri Bilimcilerinin, bir dizi analitik ve istatistiksel araç kullanarak muğlak ve genel olarak zor soruları yanıtlaması gerekir.
Temel bilgileri öğrenmek için başlangıç kaynakları aşağıda verilmiştir:

  • İstatistikler: Olasılık ve İstatistikler
  • Makine Öğrenimi: Google'dan Hızlandırılmış Kurs

Görselleştirmeler

Veri görselleştirme, bilginin grafiksel gösterimidir. Görselleştirmeye odaklanan veri bilimcileri, temel olarak pano oluşturmaya, otomatik raporlamaya ve görsel içgörüler geliştirmeye odaklanır.
Temel bilgileri öğrenmek için başlangıç kaynakları aşağıda verilmiştir:

  • Pano Oluşturma: 4 Tasarım İlkesi
  • Matplotlib'e Giriş
  • Çizimde Görselleştirme Türleri (başlangıç seviyesi)
  • Plotly'de Görselleştirme Türleri (başlangıç ve ileri düzey)

algoritmalar

Öte yandan, modellerin inceliklerine dalmakla, en son yöntemlere ayak uydurmak için araştırma makalelerini okumakla ve modellerin konuşlandırılmasıyla daha fazla ilgileniyorsanız, o zaman belirli bir konuyu daraltmanızı tavsiye ederim. modelleme ile ilgili konu. Bazı konular arasında makine öğrenimi , derin öğrenme , NLP , bilgisayar görüşü , ağ bilimi vb.
Saturn Cloud , yerel olarak oluşturamayacağım hesaplama açısından pahalı modeller oluşturmamı sağlayan bir platform. Spesifikasyonlarınız modellemeniz için bir darboğaz oluşturuyorsa, bu harika bir çözümdür.

Sıradaki ne?

Buraya kadar geldiğinizde, bazı veri bilimi projeleri üzerinde çalışmanın ve portföyünüzü oluşturmanın zamanı geldi! Nereden başlayacağınızı bilmiyorsanız, ilham almanız için birkaç projenin bir listesi:

2022 İçin Gerçek İş Sorunlarını Çözmenize Yardımcı Olacak 5 Pratik Veri Bilimi Projesi

Gerçek hayattaki sorunları taklit eden veri bilimi projelerinin derlenmiş bir listesi

doğrudatascience.com
Kendi projelerinizi oluşturmaya başlamak için kullanabileceğiniz bazı platformlar aşağıdadır:

  • Saturn Cloud , yerel olarak oluşturamayacağım hesaplama açısından pahalı modeller oluşturmamı sağlayan bir platform. Spesifikasyonlarınız modellemeniz için bir darboğaz oluşturuyorsa, bu harika bir çözümdür.
  • Anaconda , binlerce Python/R paketini arayıp kurabileceğiniz en popüler veri bilimi platformlarından biridir.
  • Kaggle , kurulum gerektirmeyen, özelleştirilebilir bir Jupyter Notebook ortamı sunar. Size hiçbir ücret ödemeden GPU'lara ve topluluk tarafından yayınlanan veri ve kodlardan oluşan devasa bir havuza erişin.
Ve bununla, sana çabalarında bol şans diliyorum!
 

™ROOT

Moderasyon Ekibi
Moderatör
Katılım
26 Eki 2022
Konular
300
Mesajlar
1,563
Çözümler
1
Puanları
11,883
ModArt Kredi
0

Bu konuyu görüntüleyen kullanıcı ve ziyaretçiler

Tema özelleştirme sistemi

Bu menüden forum temasının bazı alanlarını kendinize özel olarak düzenleye bilirsiniz.

Zevkine göre renk kombinasyonunu belirle

Gece/Gündüz modunu seç

Gece ve gündüz modlarından tarzınıza yada ihtiyaçlarınıza uygun olanı seçerek kullana bilirsiniz.

Tam ekran yada dar ekran

Temanızın gövde büyüklüğünü sevkiniz, ihtiyacınıza göre dar yada geniş olarak kulana bilirsiniz.

Izgara yada normal mod

Temanızda forum listeleme yapısını ızgara yapısında yada normal yapıda listemek için kullanabilirsiniz.

Forum arkaplan resimleri

Forum arkaplanlarına eklenmiş olan resimlerinin kontrolü senin elinde, resimleri aç/kapat

Sidebar blogunu kapat/aç

Forumun kalabalığında kurtulmak için sidebar (kenar çubuğunu) açıp/kapatarak gereksiz kalabalıklardan kurtula bilirsiniz.

Yapışkan sidebar kapat/aç

Yapışkan sidebar ile sidebar alanını daha hızlı ve verimli kullanabilirsiniz.

Radius aç/kapat

Blok köşelerinde bulunan kıvrımları kapat/aç bu şekilde tarzını yansıt.

Foruma hoş geldin 👋, Ziyaretçi

Forum içeriğine ve tüm hizmetlerimize erişim sağlamak için foruma kayıt olmalı ya da giriş yapmalısınız. Foruma üye olmak tamamen ücretsizdir.