データサイエンスとレポート生成
Wolfram言語には,データを処理しプロ品質のレポートを発表するために必要なツールが揃っています.
データの取得
ファイルからデータをインポートする
データサイエンスにはデータが必要ですが,Wolfram言語には必要なデータに簡単にアクセスする方法が備わっています.組込みのImport関数は,一般的に使用される数百種類のファイル形式をインポートします.
1. デフォルト設定を使ってデータをインポートする.
Import関数はほとんどの一般的なファイル形式を適切な式として自動的にインポートします.
Import関数がファイル形式を判別できない場合は,明示的に指定することができます.
リストの階層と連想に基づいた構造化データセットであるDatasetオブジェクトにデータをインポートすることも簡単にできます.このようにすると,大規模データセットのトラバースが簡単に速く行えます.
2. Datasetとしてデータをインポートする.
CSV,TSV,XLS,XLSX等のデータ指向のファイル形式はDatasetとしてインポートされます.Import関数の第2引数に"Dataset"を指定します.
Import関数はほとんどの一般的なファイル形式を適切な式として自動的にインポートします.
データセット全体をインポートしないで,特定の要素だけを抽出したいことがあります.追加のパラメータを使うことによって,Import関数は特定の要素だけを抽出することができます.
3. データファイルやWebページから特定の要素を抽出する.
ファイルやWebページの多くには,Importがデフォルトで返すデータ以外の要素が含まれています.Importの第2引数に"Elements"を指定すると,要素のリストを得ることができます.
Importはほとんどの一般的なファイル形式を適切な式として自動的にインポートします.
インポートする要素を指定します.
APIからデータをインポートする
Wolfram言語では外部サービスに簡単に接続できます.この例では,ロンドンのシェアサイクルの場所に関するデータに,APIを介してアクセスします.
解析と可視化
自動解析
Wolfram言語には何千もの組込み関数が含まれているため,特定の動作がどのように構成されているかという技術的側面は気にせずに,自分のプロジェクトに集中することができます.すべての詳細を完全に指定することもできますが,関数のデフォルト設定はほとんどどのような場合でもうまく動作するように設計されており,非常に複雑なタスクでさえも,短く読みやすいコードになります.この例では,二変量データがFindClusters関数で自動的にクラスタ化されます.
二変量データのクラスタを見付け可視化する.
FindDistribution等の高レベル関数は,さまざまな統計手法を使ってデータを解析し,35を超える分布の中からデータに最もフィットするものを選びます.
指数分布からサンプリングされたデータを生成する.
データから最適な分布を求める.
もとの分布と推測した分布の確率密度関数を比較する.
クラウド配備
プログラムを他の人と共有したい場合がよくありますが,Wolfram言語ならコードをスタンドアロンのインタラクティブなWebページにすることが簡単にできます.CloudDeploy関数を使えば,コードはWolfram Researchのサーバに公開され,誰もがアクセスできるようにすることも,許可を持つ人だけがアクセスできるようにすることもできます.この例では,分子の画像を認識するためのインタラクティブなプログラムを公開のWebページに変換します.
1. 公開するコンテンツを作成する.
始めましょう
ラーニングリソース
ラーニングパス
ちょっと試してみたいと思いませんか?Webアプリの構築と配備に焦点を当てた実際のコードの例を試して,Wolfram言語がどのようなものかを体感してください.
Wolfram言語は自分のペースで学べます.無料のインタラクティブコースを受講して認定証を取得しませんか.
データサイエンスを深く学ぶ
Wolframテクノロジーを使ってデータサイエンスの分野で他にどのようなことができるかについて知りたい方は,データサイエンスとAIに対するWolfram のアプローチをご覧ください.
- ダウンロード可能な例
- ドキュメントへのリンク
- 講演,プレゼンテーション,講義
- オンラインクラス
- 技術的情報
お勧めの製品
データサイエンスに関心のある方には,こちらをお勧めします.
クラウドとデスクトップのハイブリッド製品であるWolfram|Oneは,データサイエンスに関心のある方にお勧めの環境です.Wolfram|Oneは受賞歴のある直感的なノートブックインターフェースや,クラウドとのシームレスな機能を備え,完全なWolfram体験を提供します.
他のトピックを見る
データサイエンスとレポート生成
いろいろな解析ツールを見たり,自動的にデータをインポートしたり,クラウドダッシュボードを配備したりします.
機械学習
ニューラルネットワーク,自動化された機械学習,分類器等について調べます.
ブロックチェーンと暗号通貨
ブロックチェーンについて調べたり,暗号通貨のチャートを作ったり,暗号関数を使ったりします.
Webアプリの構築と配備
簡単に配備できるWebアプリについて知ったり,コードを実際のWebサイトにしたりします.
フィンテック
金融データを調べたり,チャートを作成したり,予測関数を書いたりします.
地理とGIS
さまざまな地図作成法を知ったり,データを重ね合せたり,可視化を行ったりします.