Может ли

Python

заменить

Excel

и Power BI

Posted by Ekaterina on November 8, 2021

Может ли Python заменить Excel и Power BI

Популярность Python (заслуженная) так велика, что у некоторых возникает желание использовать его везде. Например, вместо Excel и Power BI. Возможно ли это? Давайте разберемся. Начнем с Power BI.

Power BI

Power BI – это инструмент, рассчитанный на относительно низкий порог входа и одновременно большой объем хранимых данных. Сделать глубокий статистический анализ в Power BI без программирования практически невозможно. При этом Power BI позволяет встраивать в него питоновские скрипты за счет virtual environment.

Но чтобы состыковать Power BI и Python, нужно приложить недюжинные усилия и хорошо знать Python. Притом Power BI ничуть не проще такого инструмента, как Plotly. Для тех, кто умеет программировать на Python, Plotly – отличная альтернатива Power BI.

В Power BI вы, затратив много времени и сил, готовите предварительные данные, делаете витрину этих данных и создаете графический материал. То же самое в Plotly – но за счет кода, за счет знания библиотеки можно делать более качественные и современные (и более красивые!) интерактивные графики.

Пример графика, построенного на данных НБКИ

Plotly – это гибкость кода, полная совместимость с Python, с современными браузерами и неограниченные возможности визуализации.

Если вы не знакомы с Plotly, хорошо изучить документацию, а еще лучше начать в ней чертить. Plotly легко воспринимает формат json. Этот формат описывает непосредственно те фигуры, которые хочет создать аналитик. Так что вам будет достаточно даже минимального знания Python.

Plotly можно выпустить как в standalone браузере-«окошке», так и внутри блокнота или в Dash, то есть просто на порту локальной машины и даже сервера. Поэтому аналитику не нужен большой объем знаний и навыков, чтобы сделать полноценную замену Power BI.

При этом в Power BI статистические расчеты довольно сложные. Нужно углубляться во внутренний скриптовый язык, который чем-то похож на F Sharp.

А еще Power BI – это все-таки продукт Microsoft. Надо его сопровождать, настраивать, делать так, чтобы он не «падал», устанавливать на разных машинах разные права и так далее. Браузерный интерфейс Plotly облегчает почти все.

Поэтому сделать Python заменой Power BI не только возможно, но и нужно. С Excel сложнее.

Excel

Excel используется для многих вещей. В том числе для агрегации информации. У вас наверняка есть десятки Excel-таблиц, где вы храните данные: это сделки, клиенты, паспорта сделок, фрагменты отчетов и прочее. И здесь Excel дает такую гибкость, которая в Python недостижима.

Есть мощная библиотека xlwings, которая позволяет «крутить» в Excel питоновские скрипты, загружать данные туда и обратно, то есть делать Python совместимой средой. Но для xlwings нужен Python в виде виртуального окружения и нужно, чтобы он был установлен на машине.

Некоторые библиотеки, такие как bamboolib (платная) и dtale (бесплатная), пытаются сократить разрыв между Python и Excel. Но несмотря на то, что они предоставляют полноценный GUI (graphical user interface), от Excel все это очень далеко. Почему?

Excel начинался в восьмидесятых. В нем есть телеметрия. А это значит, что почти сорок лет Microsoft изучал поведение своих пользователей. И поэтому Excel стал тем, чем он стал: многофункциональным, гибким, простым и одновременно сложным инструментом. Многие аналитики, которые до сих пор не освоили Python, успешно делают в Excel статистические модели и прогнозы.

Есть, конечно, вещи, которые в Excel делать не рекомендуется. Если у вас больше ста тысяч наблюдений, их нереально уместить в Excel – да и не нужно. Если вы применяете оконные функции, то лучше даже не пытаться использовать Excel. Если у вас алгоритмы сложнее, чем линейная регрессия, – тоже.

Так что давайте переходить на ступень выше в своих познаниях и учиться пользоваться всеми современными инструментами.