Startuję z analizą bio danych: sen, HRV, CGM, eksporty z Oura i Garmin; co polecacie na start, Python czy R, żeby szybko ogarnąć wykresy, obróbkę i prosty dashboard, bez mordowania się z instalacją i bibliotekami
Na start Python, bo ekosystem jest szerszy; pandas do tabel, matplotlib i seaborn do wykresów, Jupyter do notatek, a potem wejdziesz w scikit learn
@imichalek1 dzięki, a jak z szybkimi dashboardami pod dziennik, Streamlit da radę na laptopie offline prosto
@stanislaw2003 jeśli chcesz szybko ładne wykresy i raporty, R z tidyverse i ggplot2 daje turbo start, a RStudio prowadzi za rękę; do dziennika Shiny jest banalne na lokalnym, a z Quarto robisz powtarzalne notatki z kodem, opisem i wykresami bez gimnastyki Do statystyk masz lme4 i brms, a import z CSV i Excela działa bez walki
R jest super do statystyki i wykresów, ale jeśli planujesz kiedyś łączyć to z aplikacjami czy integracjami API, Python da więcej dróg, a nauka podstaw pandas i plotly to dwa wieczory
python bo memy, ale serio pip czasem wkurza strasznie
RStudio ma wszystko w jednym oknie, dla startu to mniej straszy niż terminal
Przerobiłem logi z Oura i FreeStyle Libre w Pythonie, pandas plus polars na większe pliki, do HRV stats statsmodels, a do podglądu Streamlit; przydaje się też Jupyter i rozsądny virtualenv lub conda
czy ktoś łączył Strava i Garmin z R lub Python, zależy mi na automatycznym imporcie rano danych
@wellnesswellness_pl brzmi zachęcająco, a jak z nauką tidyverse od zera, dużo krzywej bólu; @metabolizm polars brzmi ciekawie, ma lepszą wydajność niż pandas
Jeśli planujesz modele mieszane dla snu czy HRV, w R masz lme4 i nlme, a do Bayesa brms i rstanarm, workflow z renv oraz Quarto czyni raporty w pełni powtarzalnymi, to ważne przy dłuższych eksperymentach i porównywaniu cykli
Zaczęłam od Pythona, bo kursów masa, YouTube prowadzi za rękę na start
Najwięcej czasu straciłem na konflikty wersji w Pythonie, polecam od razu conda lub poetry, a projekty trzymaj oddzielnie, mniej bólu potem jest
Dla równowagi: w R odpal renv, wtedy wersje pakietów masz zamrożone, a projekty są przenośne; w Pythonie Miniforge plus mamba i poetry rozwiązuje większość problemów, na Windows unikaj mieszania pip i conda w tym samym env
Estetycznie szybciej osiągniesz efekt w ggplot2, w seaborn też ok, ale predefiniowane motywy w R robią robotę przy publikacji naprawdę ładnej
offtop, pod GPU i tak potem będziesz chciał pewnie kiedyś
Jeśli liczysz duże ramki, polars w Pythonie i data.table w R są znacznie szybsze niż klasyczne pandas i dplyr, a Arrow umożliwia wspólny format kolumnowy; na jednym laptopie przerobiłem tygodnie danych CGM x HRV dużo szybciej po migracji, różnica była kilkukrotna Do wykresów interaktywnych sprawdza mi się plotly i bokeh, a w R highcharter też daje radę
ja zaczęłam w R bo ładniej mi wychodzi grafika
Nie wkręcajcie ludzi w wojny religijne, oba narzędzia działają i wystarczą spokojnie na początek
Dla mnie notatnik Jupyter to złoto przy eksperymentach, ale finalnie i tak przenoszę kod do modułów, i łatwiej kontrolować wersje na Git