Liste der 10 besten datenwissenschaftlichen Bücher und Beschreibungen für den Generalisten

Liste Der 10 Besten Datenwissenschaftlichen Bucher Und Beschreibungen Fur Den Generalisten



Data Science ist das Studiengebiet, das große Datenmengen mit wissenschaftlichen Methoden, Prozessen, Algorithmen und Systemen verarbeitet, um die unsichtbaren Muster zu finden, aussagekräftige Informationen abzuleiten, Geschäftsentscheidungen in Unternehmen zu treffen und auch in nicht geschäftlichen Institutionen zu verwenden. Zu den nicht geschäftlichen Institutionen gehören Branchen für Gesundheitswesen, Spiele, Bilderkennung, Empfehlungssysteme, Logistik, Betrugserkennung (Banken und Finanzinstitute), Internetsuche, Spracherkennung, gezielte Werbung, Flugroutenplanung und Augmented Reality. Data Science ist eine Teilmenge der künstlichen Intelligenz. Die für die Analyse verwendeten Daten können aus vielen verschiedenen Quellen stammen und werden in verschiedenen Formaten präsentiert. Einige der Quelldaten können standardisiert sein; andere sind möglicherweise nicht standardisiert.

Anders ausgedrückt werden unterschiedliche Methoden verwendet, um die Daten zu sammeln (Plural von Datum). Dann wird Wissen (wertvolle Schlussfolgerungen) aus den gesammelten Daten extrahiert. Dabei wird nach der Erhebung der Daten an ihnen (Daten) geforscht, um neue Daten (Ergebnisse) zu erhalten, aus denen die Probleme gelöst werden.







Data Science als (Haupt-)Disziplin existiert auf Bachelor- und Masterstufe an der Universität. Allerdings bieten nur wenige Universitäten weltweit den Bachelor- oder Masterstudiengang Data Science an. Auf der Bachelor-Stufe schließen die Studierenden mit einem Abschluss in Data Science ab. Dies ist wie ein allgemeines Studium. Auf Master-Ebene schließt der Student mit einem Postgraduierten-Abschluss in Data Science mit den Schwerpunkten Data Analytics, Data Engineering oder als Data Scientist ab.



Es mag den Leser überraschen und möglicherweise leider, dass maschinelles Lernen, Modellierung, Statistik, Programmierung und Datenbanken Grundkenntnisse sind, um Data Science auf Bachelor-Ebene zu studieren, obwohl es sich um angesehene Universitätsstudiengänge handelt, in denen studiert wird andere Fachrichtungen auf Bachelor- oder Masterstufe. Ungeachtet dessen werden alle diese Kurse, wenn ein Student an eine Universität geht, um Data Science auf Abschlussebene zu studieren, neben oder vor den eigentlichen Kursen für Data Science studiert.



Data Science für den Bachelor oder seine Spezialisierungen wie Data Analytics, Data Engineering oder als Data Scientist befinden sich noch in der Entwicklung; obwohl sie ein Stadium erreicht haben, in dem sie nach dem Studium (an der Universität) in der Industrie angewendet werden. Insgesamt ist Data Science eine relativ junge Disziplin.





Denken Sie daran, dass Sie zuerst ein Generalist sein sollten, bevor Sie ein Spezialist werden. Die Unterscheidungen zwischen Fachprogrammen sind noch nicht klar. Die Abgrenzung zwischen generalistischen und spezialisierten Studiengängen ist noch nicht klar.

Da Data Science eine relativ neue Disziplin ist, basieren die in diesem Dokument vorgeschriebenen Bücher auf der Inhaltsabdeckung und nicht auf der Pädagogik (wie gut das Buch lehrt). Und sie sind für das Bachelor-Programm (Generalist). Es gibt verschiedene generalistische Studiengänge.



Die Liste

Für weitere Details und möglichen Kauf mit Kreditkarte ist ein Hyperlink für jedes der Bücher angegeben. Keines der Bücher deckt alle Generalistenkurse ab.

Grundlegende Mathematik für die Datenwissenschaft: Analysis, Statistik, Wahrscheinlichkeitstheorie und lineare Algebra

Geschrieben von: Hadrien Jean

  • Verlag: Hadrien-Jean
  • Erscheinungsdatum: Nach dem 30. September 2020
  • Sprache: ‎Englisch
  • Anzahl der Seiten: ‎mehr als 400

Der Inhalt dieses Buches kann als Mathekurs für Data Science angesehen werden. Obwohl es nicht empfohlen wird, Data Science selbst zu lernen, sollte ein Abiturient, der Data Science selbst lernen möchte, mit diesem Buch beginnen.

Inhalt: Analysis; Statistik und Wahrscheinlichkeit; Lineare Algebra; Skalare und Vektoren; Matrizen und Tensoren; Spanne, lineare Abhängigkeit und Raumtransformation; Lineare Gleichungssysteme; Eigenvektoren und Eigenwerte; Einzelwertzerlegung.

https://www.essentialmathfordatascience.com/

A Common-Sense Guide to Data Structures and Algorithms: Level Up Your Core Programming Skills / 2nd Edition

Geschrieben von: Jay Wengrow

  • Verlag: Pragmatic Bookshelf
  • Erscheinungsdatum: 15. September 2020
  • Sprache: ‎Englisch
  • Abmessungen: 7,5 x 1,25 x 9,25 Zoll
  • Seitenzahl: ‎508

Dieses Buch befasst sich mit Algorithmen und Datenstrukturen, die in Data Science verwendet werden. Angenommen, jemand lernt Data Science nach dem Abitur selbst, dann ist dies das nächste Buch, das man lesen sollte, nachdem man das vorherige Mathebuch gelesen hat. Die Beispielprogramme sind in JavaScript, Python und Ruby angegeben.

Inhalt: Warum Datenstrukturen wichtig sind; Warum Algorithmen wichtig sind; Oh ja! Große O-Notation; Beschleunigen Sie Ihren Code mit Big O; Optimierung von Code mit und ohne Big O; Optimierung für optimistische Szenarien; Großes O im Alltagscode; Blitzschnelles Nachschlagen mit Hash-Tabellen; Erstellen von elegantem Code mit Stacks und Queues; Rekursive Rekursion mit Rekursion; Rekursiv schreiben lernen; Dynamische Programmierung; Rekursive Algorithmen für Geschwindigkeit; Knotenbasierte Datenstrukturen; Beschleunigung aller Dinge mit binären Suchbäumen; Halten Sie Ihre Prioritäten mit Haufen klar; Es tut nicht weh, es zu versuchen; Alles mit Graphen verbinden; Umgang mit Platzbeschränkungen; Techniken zur Codeoptimierung

Smarter Data Science: Erfolgreich mit unternehmenstauglichen Daten- und KI-Projekten / 1 st Bearbeitung

Geschrieben von: Neal Fishman, Cole Stryker und Grady Booch

  • Verlag: Wiley
  • Erscheinungsdatum: 14. April 2020
  • Sprache: ‎Englisch
  • Seitenzahl: ‎286

Inhalt: Die KI-Leiter erklimmen; Rahmen Teil I: Überlegungen für Organisationen, die KI verwenden; Rahmen Teil II: Überlegungen zur Arbeit mit Daten und KI; Ein Rückblick auf Analytics: Mehr als ein Hammer; Ein Ausblick auf Analytics: Nicht alles kann ein Nagel sein; Umgang mit operativen Disziplinen auf der KI-Leiter; Maximierung der Nutzung Ihrer Daten: Wertorientiert sein; Daten mit statistischer Analyse bewerten und sinnvollen Zugriff ermöglichen; Langfristig bauen; Das Ende einer Reise: Eine IA für KI.

Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning series) Illustrated Edition

Geschrieben von: Kevin P. Murphy

  • Herausgeber: The MIT Press
  • Erscheinungsdatum: 24. August 2012
  • Sprache: ‎Englisch
  • Abmessungen: 8,25 x 1,79 x 9,27 Zoll
  • Seitenzahl: ‎1104

Dieses Buch ist gut für Anfänger. Auch dieses Buch deckt, wie alle anderen in diesem Dokument vorgeschriebenen Bücher, nicht alles Notwendige für das generalistische Programm ab, das leider immer noch nicht abgeschlossen ist (die spezialisierten Programme sind ebenfalls noch nicht abgeschlossen). Der typische Einsteiger ist hier ein Abiturient mit Mathematik-Informatik-Pass.

Inhalt: Einführung (Maschinelles Lernen: was und warum?, Unüberwachtes Lernen, Einige grundlegende Konzepte des maschinellen Lernens); Wahrscheinlichkeit; Generative Modelle für diskrete Daten; Gaußsche Modelle; Bayessche Statistik; Frequentistische Statistik; Lineare Regression; Logistische Regression; Verallgemeinerte lineare Modelle und die Exponentialfamilie; Gerichtete grafische Modelle (Bayes-Netze); Mischungsmodelle und der EM-Algorithmus; Latente lineare Modelle; Sparse lineare Modelle; Kerne; Gaußsche Prozesse; Adaptive Basisfunktionsmodelle; Markov- und Hidden-Markov-Modelle; Zustandsraummodelle; Ungerichtete grafische Modelle (Markov-Zufallsfelder); Exakte Inferenz für grafische Modelle; Variationsschlussfolgerung; Mehr Variationsschlussfolgerung; Monte-Carlo-Inferenz; Markov-Ketten-Monte-Carlo(MCMC)-Inferenz; Clustering; Lernen der grafischen Modellstruktur; Latente Variablenmodelle für diskrete Daten; Tiefes Lernen.

Data Science für Unternehmen: Was Sie über Data Mining und datenanalytisches Denken wissen müssen / 1. Auflage

Geschrieben von: Tom Fawcett und Foster Provost

  • Verlag: O’Reilly Media
  • Erscheinungsdatum: 17. September 2013
  • Sprache: ‎Englisch
  • Abmessungen: 7 x 0,9 x 9,19 Zoll
  • Seitenzahl: ‎413

Inhalt: Datenanalytisches Denken; Geschäftsprobleme und datenwissenschaftliche Lösungen; Einführung in die Vorhersagemodellierung: Von der Korrelation zur überwachten Segmentierung; Anpassen eines Modells an Daten; Überanpassung und ihre Vermeidung; Ähnlichkeit, Nachbarn und Cluster; Entscheidungsanalytisches Denken I: Was ist ein gutes Modell?; Visualisierung der Modellleistung; Beweise und Wahrscheinlichkeiten; Repräsentieren und Mining von Text; Entscheidungsanalytisches Denken II: Toward Analytical Engineering; Andere datenwissenschaftliche Aufgaben und Techniken; Datenwissenschaft und Unternehmensstrategie; Fazit.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Praktische Statistik für Data Scientists: 50+ Essential Concepts Using R and Python / 2nd Edition

Geschrieben von: Peter Bruce, Andrew Bruce und Peter Gedeck

  • Verlag: O’Reilly Media
  • Erscheinungsdatum: 2. Juni 2020
  • Sprache: ‎Englisch
  • Abmessungen: 7 x 0,9 x 9,1 Zoll
  • Seitenzahl: ‎368

Inhalt: Explorative Datenanalyse, Daten- und Stichprobenverteilungen, statistische Experimente und Signifikanztests, Regression und Vorhersage, Klassifikation, statistisches maschinelles Lernen, unüberwachtes Lernen.

Das Buch des Warum: Die neue Wissenschaft von Ursache und Wirkung

Geschrieben von: Judea Pearl, Dana Mackenzie

  • Verlag: Grundbuch
  • Erscheinungsdatum: 15. Mai 2018
  • Sprache: ‎Englisch
  • Abmessungen: 6,3 x 1,4 x 9,4 Zoll
  • Seitenzahl: ‎432

Während viele Data-Science-Bücher die reine Unternehmensbranche zur Veranschaulichung verwenden, verwendet dieses Buch die Medizinbranche und andere Disziplinen zur Veranschaulichung.

Inhalt: Einführung: Mind over Data; Die Leiter der Verursachung; Von Freibeutern zu Meerschweinchen: Die Genese der kausalen Inferenz; Von Beweisen zu Ursachen: Reverend Bayes trifft Mr. Holmes; Verwirrung und Entwirrung: Oder die lauernde Variable töten; Die verrauchte Debatte: Clearing the Air; Paradoxien in Hülle und Fülle!; Jenseits der Anpassung: Die Eroberung der Mount-Intervention; Kontrafaktuale: Bergbauwelten, die hätten sein können; Mediation: Die Suche nach einem Mechanismus; Big Data, künstliche Intelligenz und die großen Fragen.

Bauen Sie eine Karriere in der Datenwissenschaft auf

Geschrieben von: Emily Robinson und Jacqueline Nolis

  • Verlag: Manning
  • Erscheinungsdatum: 24. März 2020
  • Sprache: ‎Englisch
  • Abmessungen: 7,38 x 0,8 x 9,25 Zoll
  • Seitenzahl: ‎354

Inhalt: Einstieg in Data Science; Finden Sie Ihren Data Science-Job; Eingewöhnung in die Datenwissenschaft; Wachsen Sie in Ihrer Data-Science-Rolle.

https://www.manning.com/books/build-a-career-in-data-science

Data Science für Dummies / 2. Auflage

Geschrieben von: Lillian Pierson

  • Verlag: Für Dummies
  • Erscheinungsdatum: 6. März 2017
  • Sprache Englisch
  • Abmessungen: 7,3 x 1 x 9 Zoll
  • Seitenzahl: ‎384

Dieses Buch geht davon aus, dass der Leser bereits über die erforderlichen mathematischen und Programmierkenntnisse verfügt.

Inhalt: Den Kopf um Data Science wickeln; Erkundung von Data-Engineering-Pipelines und -Infrastrukturen; Anwendung datengesteuerter Erkenntnisse auf Wirtschaft und Industrie; Maschinelles Lernen: Mit Ihrer Maschine aus Daten lernen; Mathematik, Wahrscheinlichkeit und statistische Modellierung; Verwenden von Clustering zum Unterteilen von Daten; Modellierung mit Instanzen; Gebäudemodelle, die Internet-of-Things-Geräte betreiben; Einhaltung der Prinzipien des Datenvisualisierungsdesigns; Verwenden von D3.js für die Datenvisualisierung; Webbasierte Anwendungen für Visualisierungsdesign; Best Practices im Dashboard-Design erkunden; Karten aus räumlichen Daten erstellen; Verwenden von Python für Data Science; Verwenden von Open Source R für Data Science; Verwendung von SQL in der Datenwissenschaft; Data Science mit Excel und Knime betreiben; Data Science im Journalismus: Die fünf Ws (und ein H) festnageln; Eintauchen in die Umweltdatenwissenschaft; Data Science zur Förderung des Wachstums im E-Commerce; Verwendung von Data Science zur Beschreibung und Vorhersage krimineller Aktivitäten; Zehn phänomenale Ressourcen für Open Data; Zehn kostenlose Data-Science-Tools und -Anwendungen.

Mining riesiger Datensätze / 3 rd Bearbeitung

Geschrieben von: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Verlag: Cambridge University Press
  • Erscheinungsdatum: 13. Februar 2020
  • Sprache Englisch
  • Abmessungen: 7 x 1 x 9,75 Zoll
  • Seitenzahl: ‎565

Dieses Buch geht auch davon aus, dass der Leser bereits über die erforderlichen mathematischen und Programmierkenntnisse verfügt.

Inhalt: Data-Mining; MapReduce und der neue Software-Stack; Algorithmen mit MapReduce; Ähnliche Artikel finden; Mining-Datenströme; Linkanalyse; Häufige Itemsets; Clustering; Werbung im Internet; Empfehlungssysteme; Mining von Social-Network-Grafiken; Dimensionsreduktion; Maschinelles Lernen im großen Maßstab.

Fazit

Die Unterscheidungen zwischen Fachprogrammen sind noch nicht klar. Auch die Unterscheidung zwischen generalistischen und spezialisierten Programmen ist noch nicht eindeutig. Nach Lektüre der angegebenen Bücherliste wird der Leser jedoch in der Lage sein, die besonderen Rollen von Data Analyst, Data Engineering und Data Scientist besser einzuschätzen und sich dann weiterzuentwickeln.