WOLFRAM

Wolfram音声計算WOLFRAM言語の
コアとなる部分

音声の処理と分析

Wolframの音声計算機能には,音声言語,音楽,その他の音声信号の高度に最適化された処理機能と高レベルの分析機能が備わっています.機械学習やニューラルネットワークと緊密に統合されているため,自動化システム,セキュリティ,医学等におけるソリューションを提供することができます.

ファーストクラスの要素としての音声

生成あるいはインポートした音声のデータやファイルは,ノートブックのインタラクティブな要素として,あるいは幅広い種類の処理・解析・可視化の関数の入出力として使えます.

音声の可視化と解析

音声信号を視覚およびプログラムで調べ,理解して解析します.数多くの音声録音から特徴を抽出したり,次元を削減したりできます.

フィルタリングとノイズ除去

音声の質を向上させたり,音声効果を作成したりします.数多くの高度に最適化されたフィルタにアクセスしたり,自分自身のカスタムフィルタを設計したりすることが即座にできます.

音声についての機械学習

機械学習やニューラルネットワークモデルに基づく関数を即座に使い,音声言語,音楽,医学その他の音声録音を解析・特定・識別したり,自分のモデルを作成・訓練したりできます.

音声言語と話者を理解する

音声言語を検知・認識・合成して,音声言語が使えるアプリケーションを構築します.機械学習やニューラルネットワークを利用して,いろいろな録音を分類したり,話された内容から特性を抽出したりします.

サウンド生成と音声効果

テキスト,データ,関数から新たな音声信号や任意の音声信号を生成します.残響等の創造的な音声効果を適用したり,さまざまな音声関数を使って自分の音声効果を作成したりできます.

音響分析

時間領域あるいは周波数領域の偏微分方程式を解くことによって,音の伝播のシミュレーションを行ったり,音響デバイスのモデル化や分析を行ったりします.音響設計における違いを文字通り聞き分けることができます.

効率的なインポートとエキスポート

録音された音声を簡単かつ効率的にインポートしたり,接続されたデバイスから音声を取り込んだり,音声データをWebで検索したりできます.録音された信号を処理し,結果を任意の音声形式にエキスポートします.

Live Playground

This is an interactive notebook—try making your own changes!

音声計算に関するWolframドキュメント

Wolfram 音声計算は,Wolfram言語に統合されています.全システムに計算の全分野を網羅する6,000個を超える組込み関数が含まれており,そのすべてが綿密に統合されているため,完全に一体となって作動します.

Wolfram言語
全領域とドキュメント
AudioIdentify ▪ SpeechRecognize ▪ PitchRecognize ▪ SpeechSynthesize ▪ Spectrogram ▪ Cepstrogram ▪ Periodogram ▪ LowpassFilter ▪ AudioReverb ▪ AudioDelay ▪ AudioTimeStretch ▪ AudioPitchShift ▪ AudioIntervals ▪ AudioLocalMeasurements ▪ AudioMeasurements ▪ WebAudioSearch ▪ AudioGenerator ▪ AudioCapture ▪ AudioJoin ▪ AudioSplit ▪ SpeechCases ▪ SpeechInterpreter ▪ Classify ▪ FindClusters ▪ FeatureSpacePlot ▪ Export ▪ AudioQ ▪ AudioLength ▪ AudioChannels ▪ AudioAnnotationLookup ▪ AudioPause ▪ AudioStop ▪ AudioStreams ▪ RemoveAudioStream ▪ InverseShortTimeFourier ▪ $AudioOutputDevices ▪ Annotation ▪ EventHandler ▪ Hyperlink ▪ Legended ▪ StatusArea ▪ Style ▪ Tooltip ▪ Labeled ▪ Placed ▪ Above ▪ Below ▪ Before ▪ After ▪ Filling ▪ FillingStyle ▪ LabelingFunction ▪ LabelingSize ▪ PlotLabels ▪ PlotMarkers ▪ PlotStyle ▪ PopupWindow ▪ Button ▪ Callout ▪ ListPlot ▪ PointValuePlot ▪ UpTo ▪ Weights ▪ DistanceFunction ▪ CriterionFunction ▪ CanberraDistance ▪ SquaredEuclideanDistance ▪ DiceDissimilarity ▪ MatchingDissimilarity ▪ HammingDistance ▪ ClusteringMeasurements ▪ ClusteringComponents ▪ Partition ▪ Gather ▪ DistanceTransform ▪ MeanShift ▪ FittedModel ▪ AnomalyDetector ▪ Identity ▪ FeatureTypes ▪ IndeterminateThreshold ▪ MissingValueSynthesis ▪ RecalibrationFunction ▪ TimeGoal ▪ UtilityFunction ▪ ValidationSet ▪ TrainingProgressReporting ▪ Print ▪ ProgressIndicator ▪ Inherited ▪ Information ▪ ClassPriors ▪ Indeterminate ▪ FeatureNames ▪ LearnedDistribution ▪ AbsoluteTiming ▪ Log ▪ RandomSeeding ▪ ClassifierMeasurements ▪ Predict ▪ ActiveClassification ▪ SequencePredict ▪ ClusterClassify ▪ LogitModelFit ▪ DimensionReduce ▪ Restricted ▪ DelimitedSequence ▪ AnySubset ▪ CloudObject ▪ GrammarRules ▪ QuantityVariable ▪ EntityValue ▪ AmbiguityFunction ▪ GeoLocation ▪ $GeoLocation ▪ TimeZone ▪ $TimeZone ▪ CompoundElement ▪ RepeatingElement ▪ DateObject ▪ Failure ▪ GeoPosition ▪ SemanticInterpretation ▪ APIFunction ▪ FormFunction ▪ GrammarToken ▪ ToExpression ▪ $InterpreterTypes ▪ Containing ▪ Verbatim ▪ VerifyInterpretation ▪ Alternatives ▪ Cases ▪ Interpreter ▪ Split ▪ StringSplit ▪ AudioOverlay ▪ AudioChannelCombine ▪ AudioData ▪ Join ▪ StringJoin ▪ File ▪ $DefaultAudioInputDevice ▪ $AudioInputDevices ▪ AnnotationRules ▪ Appearance ▪ AudioChannelAssignment ▪ AudioInputDevice ▪ AudioLabel ▪ AudioOutputDevice ▪ $DefaultAudioOutputDevice ▪ CaptureRunning ▪ MaxDuration ▪ SoundVolume ▪ AudioStream ▪ AudioRecord ▪ SystemDialogInput ▪ ImageCapture ▪ DeviceReadTimeSeries ▪ NetworkPacketCapture ▪ DiscreteMarkovProcess ▪ ListPlay ▪ Play ▪ SampledSoundList ▪ RandomVariate ▪ RandomFunction ▪ RandomReal ▪ Sin ▪ SawtoothWave ▪ TriangleWave ▪ SquareWave ▪ VideoGenerator ▪ VideoCombine ▪ URL ▪ MaxItems ▪ WebSearch ▪ WikipediaSearch ▪ WebImageSearch ▪ ServiceExecute ▪ $ServiceCreditsAvailable ▪ Min ▪ AudioNormalize ▪ AudioSampleRate ▪ ImageMeasurements ▪ List ▪ Rule ▪ AudioPad ▪ Dataset ▪ WarpingCorrespondence ▪ AudioDistance ▪ AudioPartition ▪ Left ▪ Right ▪ AudioDelete ▪ VideoIntervals ▪ VideoSplit ▪ Scaled ▪ HannWindow ▪ VideoTimeStretch ▪ AudioResample ▪ Duration ▪ AudioType ▪ AudioTrackApply ▪ TemporalData ▪ Image ▪ Image3D ▪ BlackmanWindow ▪ HammingWindow ▪ BandpassFilter ▪ BandstopFilter ▪ DifferentiatorFilter ▪ HilbertFilter ▪ LeastSquaresFilterKernel ▪ ListConvolve ▪ ImageConvolve ▪ ScalingFunctions ▪ ListLinePlot ▪ Pi ▪ ImagePeriodogram ▪ FindRepeat ▪ Video ▪ Graphics ▪ FourierParameters ▪ Padding ▪ PaddingSize ▪ Tiny ▪ Small ▪ Medium ▪ Large ▪ Full ▪ CepstrogramArray ▪ CepstrumArray ▪ PeriodogramArray ▪ Length ▪ DirichletWindow ▪ ArrayPlot ▪ AlignmentPoint ▪ AspectRatio ▪ Axes ▪ AxesLabel ▪ AxesOrigin ▪ AxesStyle ▪ Background ▪ BaselinePosition ▪ BaseStyle ▪ ClippingStyle ▪ ColorFunctionScaling ▪ ColorFunction ▪ ColorRules ▪ ContentSelectable ▪ CoordinatesToolOptions ▪ DataRange ▪ DataReversed ▪ Epilog ▪ FormatType ▪ TraditionalForm ▪ Frame ▪ FrameLabel ▪ FrameStyle ▪ FrameTicks ▪ FrameTicksStyle ▪ GridLines ▪ GridLinesStyle ▪ ImageMargins ▪ ImagePadding ▪ ImageSize ▪ LabelStyle ▪ MaxPlotPoints ▪ Mesh ▪ MeshStyle ▪ GrayLevel ▪ GoldenRatio ▪ PlotLabel ▪ PlotLegends ▪ PlotRangeClipping ▪ PlotRangePadding ▪ PlotRegion ▪ PlotTheme ▪ $PlotTheme ▪ PreserveImageOptions ▪ Prolog ▪ RotateLabel ▪ SampleRate ▪ TargetUnits ▪ Ticks ▪ TicksStyle ▪ PlotRange ▪ InverseSpectrogram ▪ SpectrogramArray ▪ Fourier ▪ AudioSpectralTransformation ▪ $WolframDocumentsDirectory ▪ GeneratedAssetFormat ▪ $GeneratedAssetLocation ▪ OverwriteTarget ▪ False ▪ True ▪ Infinity ▪ Association ▪ GeneratedAssetLocation ▪ AudioPlay ▪ Speak ▪ SpokenString ▪ Alignment ▪ Center ▪ MetaInformation ▪ MissingDataMethod ▪ None ▪ ResamplingMethod ▪ Sound ▪ AllowedFrequencyRange ▪ SoundNote ▪ ProgressReporting ▪ $ProgressReporting ▪ Language ▪ Method ▪ VideoTranscribe ▪ TextRecognize ▪ TextCases ▪ Entity ▪ Masking ▪ All ▪ $PerformanceGoal ▪ Automatic ▪ TargetDevice ▪ PerformanceGoal ▪ Missing ▪ $LocalBase ▪ LocalObjects ▪ ResourceRemove ▪ AcceptanceThreshold ▪ SpecificityGoal ▪ AudioBlockMap ▪ WordCloud ▪ FeatureExtract ▪ ImageIdentify ▪ HighpassFilter ▪ GaussianFilter ▪ Quantity ▪ BiquadraticFilterModel ▪ ButterworthFilterModel ▪ ToDiscreteTimeModel ▪ RecurrenceFilter ▪ TransferFunctionModel ▪ AudioChannelMix ▪ NumericFunction ▪ Listable ▪ Tanh ▪ ChebyshevT ▪ PartitionGranularity ▪ TimeSeries ▪ ClassifierFunction ▪ FeatureExtraction ▪ FeatureExtractorFunction ▪ NetMeasurements ▪ ExampleData ▪ ResourceData ▪ LanguageIdentify ▪ SpeakerMatchQ ▪ AudioLoudness ▪ AudioFrequencyShift ▪ VoiceStyleData ▪ $VoiceStyles ▪ FeatureSpacePlot3D ▪ FeatureExtractor ▪ NetModel ▪ NetTrain ▪ GatedRecurrentLayer ▪ LongShortTermMemoryLayer ▪ CTCLossLayer ▪ AudioAnnotate ▪ AnnotationKeys ▪ AnnotationValue ▪ AnnotationDelete ▪ AudioReplace ▪ Audio ▪ Import ▪ AudioPlot ▪ AudioAmplify ▪ AudioTrim ▪ WienerFilter ▪ MeanFilter ▪ TotalVariationFilter ▪ ShortTimeFourier ▪ Mean ▪ Variance ▪ Median ▪ Quantile ▪ AudioInstanceQ ▪ Nearest ▪ NetEncoder ▪ NetChain ▪ NetGraph ▪

音声計算の分野でWolfram製品を使い始める

Explore interactive examples
in the cloud

Wolframは,あらゆる規模の組織をサポートします