Информация о фильмах
База знаний Wolfram Knowledgebase позволяет изучить поминутную стоимость и кассовые сборы от фильмов, выпущенных с 2000 года. Кроме того, вы можете получить информацию о средней продолжительности проката фильмов, которая подчиняется закону так называемого устойчивого распределения, что необычно для объектов, созданных человеком.
Воспользуемся неявно определенным классом сущностей, чтобы выбрать фильмы, выпущенные с начала данного тысячелетия.
Length[movies =
EntityClass["Movie",
EntityProperty["Movie", "ReleaseDate"] ->
Between[{DateObject[{2000}], DateObject[{2015}]}]] // EntityList]
Извлечем названия фильмов, жанры, срок проката, производственные бюджеты и кассовые сборы.
movieData =
EntityValue[
movies, {EntityProperty["Movie", "Name"],
EntityProperty["Movie", "Genres"],
EntityProperty["Movie", "Runtime"],
EntityProperty["Movie", "ReleaseDate"],
EntityProperty["Movie", "ProductionBudget"],
EntityProperty["Movie", "DomesticBoxOfficeGross"]}];
Стоимость минуты фильма, вышедшего в прокат, является функцией с значением, колеблющимся во времени.
Тем не менее, в среднем за месяц, некоторые периодичные элементы в распределении стоимости за минуту проката становятся видимыми. В частности, на следующем графике зеленые линии сетки обозначают День Независимости США; фиолетовые линии соответствуют Дню Благодарения.
Как показано на следующем логарифмическом графике, кассовые сборы за минуту проката представляют собой еще более колеблющуюся функцию.
Среднее время проката фильмов было достаточно постоянно в течение последних 15 лет.
Распределение времени проката представляет собой oтносительно гладкую функцию.
movieRuntimes = DeleteMissing[movieData[[All, 3]]];
hg = Histogram[movieRuntimes, {1, 200, 5}, "PDF",
AxesLabel -> Automatic]
Моделирование с использованием большого количества встроенных распределений указывает на то, что ближе всего для данных подходит стабильное распределение Леви. В данном случае, рассчитаем совместимость данных о фильмах с нормальным (распределение средних значений случайных величин независимых друг от друга и извлеченных из независимых распределений), логнормальным (распределение произведения многих независимых положительных случайных величин), и устойчивым распределениями.
edNormal =
EstimatedDistribution[movieRuntimes,
NormalDistribution[\[Mu], \[Sigma]]]
edLogNormal =
EstimatedDistribution[movieRuntimes,
LogNormalDistribution[\[Mu], \[Sigma]]]
edStable =
EstimatedDistribution[movieRuntimes,
StableDistribution[1, \[Alpha], \[Beta], \[Mu], \[Sigma]]]
Отметим, что устойчивое распределение визуально наиболее точно соответствует распределению данных о фильмах.
Лишь немногие созданные человеком объекты имеют свойства стабильного распределения. Характерной чертой стабильного распределения является наличие крайних величин, часто в несколько раз превышающих среднее значение распределения. Эта характеристика наблюдается благодаря фильмам. Рассмотрим, 10 фильмов с самoй большой продолжительностью, выпущенных после 1 января 2000 года.
longest =
EntityClass[
"Movie", {EntityProperty["Movie", "ReleaseDate"] ->
Between[{DateObject[{2000}], DateObject[{2015}]}],
EntityProperty["Movie", "Runtime"] -> TakeLargest[10]}] //
EntityList
Представим результаты в виде таблицы.