stack do analizy: Python czy R, co łatwiejsze dla startu

Startuję z analizą bio danych: sen, HRV, CGM, eksporty z Oura i Garmin; co polecacie na start, Python czy R, żeby szybko ogarnąć wykresy, obróbkę i prosty dashboard, bez mordowania się z instalacją i bibliotekami

9 polubień

Na start Python, bo ekosystem jest szerszy; pandas do tabel, matplotlib i seaborn do wykresów, Jupyter do notatek, a potem wejdziesz w scikit learn

1 polubienie

@imichalek1 dzięki, a jak z szybkimi dashboardami pod dziennik, Streamlit da radę na laptopie offline prosto

1 polubienie

@stanislaw2003 jeśli chcesz szybko ładne wykresy i raporty, R z tidyverse i ggplot2 daje turbo start, a RStudio prowadzi za rękę; do dziennika Shiny jest banalne na lokalnym, a z Quarto robisz powtarzalne notatki z kodem, opisem i wykresami bez gimnastyki Do statystyk masz lme4 i brms, a import z CSV i Excela działa bez walki

R jest super do statystyki i wykresów, ale jeśli planujesz kiedyś łączyć to z aplikacjami czy integracjami API, Python da więcej dróg, a nauka podstaw pandas i plotly to dwa wieczory

2 polubienia

python bo memy, ale serio pip czasem wkurza strasznie

RStudio ma wszystko w jednym oknie, dla startu to mniej straszy niż terminal

Przerobiłem logi z Oura i FreeStyle Libre w Pythonie, pandas plus polars na większe pliki, do HRV stats statsmodels, a do podglądu Streamlit; przydaje się też Jupyter i rozsądny virtualenv lub conda

1 polubienie

czy ktoś łączył Strava i Garmin z R lub Python, zależy mi na automatycznym imporcie rano danych

@wellnesswellness_pl brzmi zachęcająco, a jak z nauką tidyverse od zera, dużo krzywej bólu; @metabolizm polars brzmi ciekawie, ma lepszą wydajność niż pandas

1 polubienie

Jeśli planujesz modele mieszane dla snu czy HRV, w R masz lme4 i nlme, a do Bayesa brms i rstanarm, workflow z renv oraz Quarto czyni raporty w pełni powtarzalnymi, to ważne przy dłuższych eksperymentach i porównywaniu cykli

Zaczęłam od Pythona, bo kursów masa, YouTube prowadzi za rękę na start

1 polubienie

Najwięcej czasu straciłem na konflikty wersji w Pythonie, polecam od razu conda lub poetry, a projekty trzymaj oddzielnie, mniej bólu potem jest

Dla równowagi: w R odpal renv, wtedy wersje pakietów masz zamrożone, a projekty są przenośne; w Pythonie Miniforge plus mamba i poetry rozwiązuje większość problemów, na Windows unikaj mieszania pip i conda w tym samym env

3 polubienia

Estetycznie szybciej osiągniesz efekt w ggplot2, w seaborn też ok, ale predefiniowane motywy w R robią robotę przy publikacji naprawdę ładnej

offtop, pod GPU i tak potem będziesz chciał pewnie kiedyś

1 polubienie

Jeśli liczysz duże ramki, polars w Pythonie i data.table w R są znacznie szybsze niż klasyczne pandas i dplyr, a Arrow umożliwia wspólny format kolumnowy; na jednym laptopie przerobiłem tygodnie danych CGM x HRV dużo szybciej po migracji, różnica była kilkukrotna Do wykresów interaktywnych sprawdza mi się plotly i bokeh, a w R highcharter też daje radę

ja zaczęłam w R bo ładniej mi wychodzi grafika

2 polubienia

Nie wkręcajcie ludzi w wojny religijne, oba narzędzia działają i wystarczą spokojnie na początek

1 polubienie

Dla mnie notatnik Jupyter to złoto przy eksperymentach, ale finalnie i tak przenoszę kod do modułów, i łatwiej kontrolować wersje na Git