The Elements of Statistical Learning

Data Mining, Inference, and Prediction

DOWNLOAD NOW »

Author: Trevor Hastie,Robert Tibshirani,Jerome Friedman

Publisher: Springer Science & Business Media

ISBN: 0387216065

Category: Mathematics

Page: 536

View: 8076

During the past decade there has been an explosion in computation and information technology. With it have come vast amounts of data in a variety of fields such as medicine, biology, finance, and marketing. The challenge of understanding these data has led to the development of new tools in the field of statistics, and spawned new areas such as data mining, machine learning, and bioinformatics. Many of these tools have common underpinnings but are often expressed with different terminology. This book describes the important ideas in these areas in a common conceptual framework. While the approach is statistical, the emphasis is on concepts rather than mathematics. Many examples are given, with a liberal use of color graphics. It should be a valuable resource for statisticians and anyone interested in data mining in science or industry. The book’s coverage is broad, from supervised learning (prediction) to unsupervised learning. The many topics include neural networks, support vector machines, classification trees and boosting---the first comprehensive treatment of this topic in any book. This major new edition features many topics not covered in the original, including graphical models, random forests, ensemble methods, least angle regression & path algorithms for the lasso, non-negative matrix factorization, and spectral clustering. There is also a chapter on methods for “wide” data (p bigger than n), including multiple testing and false discovery rates. Trevor Hastie, Robert Tibshirani, and Jerome Friedman are professors of statistics at Stanford University. They are prominent researchers in this area: Hastie and Tibshirani developed generalized additive models and wrote a popular book of that title. Hastie co-developed much of the statistical modeling software and environment in R/S-PLUS and invented principal curves and surfaces. Tibshirani proposed the lasso and is co-author of the very successful An Introduction to the Bootstrap. Friedman is the co-inventor of many data-mining tools including CART, MARS, projection pursuit and gradient boosting.

Wahrscheinlichkeitsrechnung und Statistik

DOWNLOAD NOW »

Author: Robert Hafner

Publisher: Springer-Verlag

ISBN: 3709169445

Category: Mathematics

Page: 512

View: 2449

Das Buch ist eine Einführung in die Wahrscheinlichkeitsrechnung und mathematische Statistik auf mittlerem mathematischen Niveau. Die Pädagogik der Darstellung unterscheidet sich in wesentlichen Teilen – Einführung der Modelle für unabhängige und abhängige Experimente, Darstellung des Suffizienzbegriffes, Ausführung des Zusammenhanges zwischen Testtheorie und Theorie der Bereichschätzung, allgemeine Diskussion der Modellentwicklung – erheblich von der anderer vergleichbarer Lehrbücher. Die Darstellung ist, soweit auf diesem Niveau möglich, mathematisch exakt, verzichtet aber bewußt und ebenfalls im Gegensatz zu vergleichbaren Texten auf die Erörterung von Meßbarkeitsfragen. Der Leser wird dadurch erheblich entlastet, ohne daß wesentliche Substanz verlorengeht. Das Buch will allen, die an der Anwendung der Statistik auf solider Grundlage interessiert sind, eine Einführung bieten, und richtet sich an Studierende und Dozenten aller Studienrichtungen, für die mathematische Statistik ein Werkzeug ist.

Statistical Inference for Ergodic Diffusion Processes

DOWNLOAD NOW »

Author: Yury A. Kutoyants,Jurij A. Kutojanc

Publisher: Springer Science & Business Media

ISBN: 9781852337599

Category: Mathematics

Page: 481

View: 8425

An elementary introduction to the field at the start of the book introduces a class of examples - both non-standard and classical - that reappear constantly throughout the book to illustrate the merits and demerits of the procedures as the investigation progresses. The statements of the problems are in the spirit of classical mathematical statistics, and special attention is paid to asymptotically efficient procedures."--Jacket.

Data mining

praktische Werkzeuge und Techniken für das maschinelle Lernen

DOWNLOAD NOW »

Author: Ian H. Witten,Eibe Frank

Publisher: N.A

ISBN: 9783446215337

Category:

Page: 386

View: 5545

Ensemble Machine Learning

Methods and Applications

DOWNLOAD NOW »

Author: Cha Zhang,Yunqian Ma

Publisher: Springer Science & Business Media

ISBN: 1441993258

Category: Computers

Page: 332

View: 676

It is common wisdom that gathering a variety of views and inputs improves the process of decision making, and, indeed, underpins a democratic society. Dubbed “ensemble learning” by researchers in computational intelligence and machine learning, it is known to improve a decision system’s robustness and accuracy. Now, fresh developments are allowing researchers to unleash the power of ensemble learning in an increasing range of real-world applications. Ensemble learning algorithms such as “boosting” and “random forest” facilitate solutions to key computational issues such as face recognition and are now being applied in areas as diverse as object tracking and bioinformatics. Responding to a shortage of literature dedicated to the topic, this volume offers comprehensive coverage of state-of-the-art ensemble learning techniques, including the random forest skeleton tracking algorithm in the Xbox Kinect sensor, which bypasses the need for game controllers. At once a solid theoretical study and a practical guide, the volume is a windfall for researchers and practitioners alike.

Statistik-Workshop für Programmierer

DOWNLOAD NOW »

Author: Allen B. Downey

Publisher: O'Reilly Germany

ISBN: 3868993436

Category: Computers

Page: 160

View: 1335

Wenn Sie programmieren können, beherrschen Sie bereits Techniken, um aus Daten Wissen zu extrahieren. Diese kompakte Einführung in die Statistik zeigt Ihnen, wie Sie rechnergestützt, anstatt auf mathematischem Weg Datenanalysen mit Python durchführen können. Praktischer Programmier-Workshop statt grauer Theorie: Das Buch führt Sie anhand eines durchgängigen Fallbeispiels durch eine vollständige Datenanalyse -- von der Datensammlung über die Berechnung statistischer Kennwerte und Identifikation von Mustern bis hin zum Testen statistischer Hypothesen. Gleichzeitig werden Sie mit statistischen Verteilungen, den Regeln der Wahrscheinlichkeitsrechnung, Visualisierungsmöglichkeiten und vielen anderen Arbeitstechniken und Konzepten vertraut gemacht. Statistik-Konzepte zum Ausprobieren: Entwickeln Sie über das Schreiben und Testen von Code ein Verständnis für die Grundlagen von Wahrscheinlichkeitsrechnung und Statistik: Überprüfen Sie das Verhalten statistischer Merkmale durch Zufallsexperimente, zum Beispiel indem Sie Stichproben aus unterschiedlichen Verteilungen ziehen. Nutzen Sie Simulationen, um Konzepte zu verstehen, die auf mathematischem Weg nur schwer zugänglich sind. Lernen Sie etwas über Themen, die in Einführungen üblicherweise nicht vermittelt werden, beispielsweise über die Bayessche Schätzung. Nutzen Sie Python zur Bereinigung und Aufbereitung von Rohdaten aus nahezu beliebigen Quellen. Beantworten Sie mit den Mitteln der Inferenzstatistik Fragestellungen zu realen Daten.

Medizinische Statistik

DOWNLOAD NOW »

Author: Hans J. Trampisch,Jürgen Windeler

Publisher: Springer-Verlag

ISBN: 364256996X

Category: Mathematics

Page: 376

View: 3991

"Statistiken sind merkwürdige Dinge ...", dies wird so mancher Mediziner denken, wenn er sich mit der Biometrie befaßt. Sei es im Rahmen seiner Ausbildung oder im Zuge wissenschaftlicher oder klinischer Studien, Kenntnisse der Statistik und Mathematik sind unentbehrlich für die tägliche Arbeit des Mediziners. Ziel dieses Lehrbuches ist es, den Mediziner systematisch an biometrische Terminologie und Arbeitsmethoden heranzuführen, um ihn schließlich mit den Grundlagen der Wahrscheinlichkeitsrechung vertraut zu machen. Nach der Lektüre dieses Buches hält der Leser ein Werkzeug in den Händen, das ihm bei der Lösung medizinscher Fragestellungen hilft ebenso wie bei der Beschreibung von Ergebnissen wissenschaftlicher Studien und natürlich bei der Doktorarbeit!

Darwin im Reich der Maschinen

Die Evolution der globalen Intelligenz

DOWNLOAD NOW »

Author: George B. Dyson

Publisher: Springer

ISBN: 9783211835883

Category: Computers

Page: 316

View: 1585

"Beim Spiel von Leben und Evolution sitzen drei Spieler am Tisch: Menschen, die Natur und Maschinen. Ich bin entschieden auf der Seite der Natur. Die Natur, vermute ich, ist aber auf der Seite der Maschinen." George Dyson führt vor, dass das Leben, nachdem es sich zunächst durch die biologische Evolution entwickelte, nun noch einmal entsteht, diesmal durch die spontane Evolution der Intelligenz innerhalb unseres rasch expandierenden Informationsnetzes. Das Ergebnis ist eine digitale Wildnis, in der bisher unbekannte Geschöpfe entstehen – Geschöpfe, die uns in Hinblick auf Geschwindigkeit, Intelligenz und Langlebigkeit bald überlegen sein werden. Dieses originelle Buch zeigt, wie die Entstehung der Maschinen mit ihrem Eigenleben – und möglicherweise einem eigenen Geist – schon lange in der Literatur und Wissenschaft vorausgesehen wurde, nachweisbar in den Werken von Hobbes, Samuel Butler, Erasmus Darwin und anderen. Dyson beschreibt diese alternative intellektuelle Geschichte und erzählt, wie frühere Denker das durchgespielt haben, was dann zu den Entdeckungen der wissenschaftlichen Abenteurer des 20. Jahrhunderts, unter ihnen Alan Turing, Norbert Wiener und John von Neumann, wurde. Wie Dyson schreibt, handelt dieses Buch nicht von der Zukunft. Es geht darum, wo wir jetzt stehen und wie wir hierher kamen; was aufregend genug ist.

Markov Chain Monte Carlo - Methoden: Herleitung, Beweis und Implementierung

DOWNLOAD NOW »

Author: Thomas Plehn

Publisher: Bachelor + Master Publication

ISBN: 3956844513

Category: Mathematics

Page: 56

View: 5903

In seiner Arbeit beschäftigt sich der Autor mit der ‘Markov Chain Monte Carlo‘, auch abgekürzt als MCMC. Dabei handelt es sich um eine Monte Carlo Methode. Allen Monte Carlo Methoden ist gemein, dass sie von einer mehr oder minder komplizierten Verteilung zufällige Szenarien erzeugen. Diese Szenarien werden dann genutzt um Aussagen über Erwartungswerte oder andere Kennzahlen der Verteilung zu treffen. Diese Aussagen sind natürlich nur zu gebrauchen, wenn man sehr viele zufällig erzeugte Szenarien auswertet. Die Methode kommt also immer dann zum Einsatz, wenn es nicht möglich ist, aus der Verteilung der Szenarien direkt Rückschlüsse auf die statistischen Kennzahlen der Verteilung zu ziehen, weder auf analytischem Wege, noch durch numerische Integration (bei sehr vielen Dimensionen steigt der Aufwand rapide an). Markov Chain Monte Carlo ist nun eine spezielle Monte Carlo Methode unter Zuhilfenahme von Markovketten. Diese kommt immer dann zum Einsatz, wenn es nicht möglich ist, von einer Verteilung auf einfache Weise Szenarien zu erzeugen. Eine Markovkette fängt bei einem Zustand an und geht von einem bestimmten Zustand mit einer bestimmten Wahrscheinlichkeit zu einem anderen Zustand über. Diese Übergangswahrscheinlichkeiten stehen in einer Übergangsmatrix. Der Knackpunkt ist nun, dass diese Form der Zustandsgenerierung oft einfacher zu implementieren ist, als direkt auf eine Verteilung zurückzugreifen. In der Arbeit gibt es mehrere konkrete Beispiele für den Einsatz solcher Methoden. Quelltexte der Implementierungen sind beigefügt.

Grundlagen zur Neuroinformatik und Neurobiologie

The Computational Brain in deutscher Sprache

DOWNLOAD NOW »

Author: Patricia S. Churchland,Terrence J. Sejnowski

Publisher: Springer-Verlag

ISBN: 3322868214

Category: Technology & Engineering

Page: 702

View: 4098

The Computational Brain, das außergewöhnliche Buch über vergleichende Forschung in den Bereichen von menschlichem Gehirn und neuesten Möglichkeiten der Computertechnologie, liegt hiermit erstmals in deutscher Sprache vor. Geschrieben von einem führenden Forscherteam in den USA, ist es eine Fundgrube für alle, die wissen wollen, was der Stand der Wissenschaft auf diesem Gebiet ist. Die Autoren führen die Bereiche der Neuroinformatik und Neurobiologie mit gut ausgesuchten Beispielen und der gebotenen Hintergrundinformation gekonnt zusammen. Das Buch wird somit nicht nur dem Fachwissenschaftler sondern auch dem interdisziplinären Interesse des Informatikers und des Biologen auf eine hervorragende Weise gerecht. Übersetzt wurde das Buch von Prof. Dr. Steffen Hölldobler und Dipl.-Biol. Claudia Hölldobler, einem Informatiker und einer Biologin. Rezension in Spektrum der Wissenschaft nr. 10, S. 122 f. im Oktober 1997 (...) Die 1992 erschienene amerikanische Originalausgabe des vorliegenden Werkes ist so erfolgreich, daß man bereits von einem Klassiker reden kann. (...) (...) ....ist das Buch sehr zu empfehlen. In Verbindung von Neurobiologie und Neuroinformatik konkurrenzlos, vermittelt es einiges von der Faszination theoretischer Hirnforschung, die auch in Deutschland zunehmend mehr Wissenschaftler in ihren Bann schlägt. Rezension erschienen in: Computer Spektrum 3/1997, S. 2 (...)Das Buch wird somit nicht nur dem Fachwissenschaftler, sondern auch den interdisziplinären Interesse des Informatikers und des Biologen auf eine hervorragende Weise gerecht(...)

Amstat News

DOWNLOAD NOW »

Author: N.A

Publisher: N.A

ISBN: N.A

Category: Statistics

Page: N.A

View: 7197

R in a Nutshell

DOWNLOAD NOW »

Author: Joseph Adler

Publisher: O'Reilly Germany

ISBN: 3897216507

Category: Computers

Page: 768

View: 8667

Wozu sollte man R lernen? Da gibt es viele Gründe: Weil man damit natürlich ganz andere Möglichkeiten hat als mit einer Tabellenkalkulation wie Excel, aber auch mehr Spielraum als mit gängiger Statistiksoftware wie SPSS und SAS. Anders als bei diesen Programmen hat man nämlich direkten Zugriff auf dieselbe, vollwertige Programmiersprache, mit der die fertigen Analyse- und Visualisierungsmethoden realisiert sind – so lassen sich nahtlos eigene Algorithmen integrieren und komplexe Arbeitsabläufe realisieren. Und nicht zuletzt, weil R offen gegenüber beliebigen Datenquellen ist, von der einfachen Textdatei über binäre Fremdformate bis hin zu den ganz großen relationalen Datenbanken. Zudem ist R Open Source und erobert momentan von der universitären Welt aus die professionelle Statistik. R kann viel. Und Sie können viel mit R machen – wenn Sie wissen, wie es geht. Willkommen in der R-Welt: Installieren Sie R und stöbern Sie in Ihrem gut bestückten Werkzeugkasten: Sie haben eine Konsole und eine grafische Benutzeroberfläche, unzählige vordefinierte Analyse- und Visualisierungsoperationen – und Pakete, Pakete, Pakete. Für quasi jeden statistischen Anwendungsbereich können Sie sich aus dem reichen Schatz der R-Community bedienen. Sprechen Sie R! Sie müssen Syntax und Grammatik von R nicht lernen – wie im Auslandsurlaub kommen Sie auch hier gut mit ein paar aufgeschnappten Brocken aus. Aber es lohnt sich: Wenn Sie wissen, was es mit R-Objekten auf sich hat, wie Sie eigene Funktionen schreiben und Ihre eigenen Pakete schnüren, sind Sie bei der Analyse Ihrer Daten noch flexibler und effektiver. Datenanalyse und Statistik in der Praxis: Anhand unzähliger Beispiele aus Medizin, Wirtschaft, Sport und Bioinformatik lernen Sie, wie Sie Daten aufbereiten, mithilfe der Grafikfunktionen des lattice-Pakets darstellen, statistische Tests durchführen und Modelle anpassen. Danach werden Ihnen Ihre Daten nichts mehr verheimlichen.

Inside Big Data

Unsere Daten zeigen, wer wir wirklich sind

DOWNLOAD NOW »

Author: Christian Rudder

Publisher: Carl Hanser Verlag GmbH Co KG

ISBN: 3446444602

Category: Political Science

Page: 304

View: 6351

In seinem New-York-Times-Bestseller zeigt Christian Rudder erstmals, wie wir von Big Data profitieren können: indem wir menschlichen Überzeugungen und Vorlieben durch die Analyse großer Datenmengen auf die Spur kommen. Der Gründer der Dating-Seite "OkCupid" hat seine anonymisierten Daten danach befragt, was wir mögen, was wir ablehnen, was wir uns insgeheim wünschen, ob unsere politischen Ansichten unsere Partnerbeziehung verändern – und wie rassistisch wir wirklich sind. "Inside Big Data" bedeutet einen Paradigmenwechsel zu einer konstruktiven Datenauswertung, unabhängig von Konzernen wie Google, und verrät uns Erstaunliches darüber, wer wir wirklich sind.

Maschinelles Lernen

DOWNLOAD NOW »

Author: Ethem Alpaydin

Publisher: De Gruyter Oldenbourg

ISBN: 9783486581140

Category: Machine learning

Page: 440

View: 5598

Maschinelles Lernen heißt, Computer so zu programmieren, dass ein bestimmtes Leistungskriterium anhand von Beispieldaten und Erfahrungswerten aus der Vergangenheit optimiert wird. Das vorliegende Buch diskutiert diverse Methoden, die ihre Grundlagen in verschiedenen Themenfeldern haben: Statistik, Mustererkennung, neuronale Netze, Künstliche Intelligenz, Signalverarbeitung, Steuerung und Data Mining. In der Vergangenheit verfolgten Forscher verschiedene Wege mit unterschiedlichen Schwerpunkten. Das Anliegen dieses Buches ist es, all diese unterschiedlichen Ansätze zu kombinieren, um eine allumfassende Behandlung der Probleme und ihrer vorgeschlagenen Lösungen zu geben.

Data Analysis and Data Mining

An Introduction

DOWNLOAD NOW »

Author: Adelchi Azzalini,Bruno Scarpa

Publisher: Oxford University Press

ISBN: 0199942714

Category: Business & Economics

Page: 288

View: 9073

An introduction to statistical data mining, Data Analysis and Data Mining is both textbook and professional resource. Assuming only a basic knowledge of statistical reasoning, it presents core concepts in data mining and exploratory statistical models to students and professional statisticians-both those working in communications and those working in a technological or scientific capacity-who have a limited knowledge of data mining. This book presents key statistical concepts by way of case studies, giving readers the benefit of learning from real problems and real data. Aided by a diverse range of statistical methods and techniques, readers will move from simple problems to complex problems. Through these case studies, authors Adelchi Azzalini and Bruno Scarpa explain exactly how statistical methods work; rather than relying on the "push the button" philosophy, they demonstrate how to use statistical tools to find the best solution to any given problem. Case studies feature current topics highly relevant to data mining, such web page traffic; the segmentation of customers; selection of customers for direct mail commercial campaigns; fraud detection; and measurements of customer satisfaction. Appropriate for both advanced undergraduate and graduate students, this much-needed book will fill a gap between higher level books, which emphasize technical explanations, and lower level books, which assume no prior knowledge and do not explain the methodology behind the statistical operations.

Künstliche Intelligenz

ein moderner Ansatz

DOWNLOAD NOW »

Author: Stuart J. Russell,Stuart Russell,Peter Norvig

Publisher: N.A

ISBN: 9783827370891

Category:

Page: 1327

View: 2468

Angewandte Zeitreihenanalyse mit R

DOWNLOAD NOW »

Author: Rainer Schlittgen

Publisher: Walter de Gruyter GmbH & Co KG

ISBN: 311041399X

Category: Business & Economics

Page: 329

View: 2337

Dieses Buch präsentiert die wichtigsten Modelle und Verfahren der Zeitreihenanalyse. Der Schwerpunkt liegt auf dem Zeitbereich; speziell werden explorative Methoden, ARMA-Modelle mit ihren Erweiterungen, Prognosemethoden und Zeitreihenregressionen behandelt. Die Neuauflage wurde akualisiert und unter anderem um ein Kapitel der Long-Memory-Prozesse erweitert.