Changelog
Source:NEWS.md
rnp 3.1.0
Amplia o pacote para alem da graduacao classica, cobrindo temas centrais de estatistica aplicada e ciencia de dados. Cerca de 49 funcoes novas, organizadas em cinco areas.
Novas funcionalidades
-
Analise de sobrevivencia (apoio em
survival): Kaplan-Meier e curva, teste log-rank, Nelson-Aalen, modelo de Cox e diagnostico da hipotese de riscos proporcionais, modelos parametricos (AFT) e tabua de vida. -
Series temporais ARIMA/SARIMA (base
stats): ajuste e selecao automatica de ordem, previsao com intervalos, testes ADF e KPSS reimplementados, autorregressao vetorial (VAR) com causalidade de Granger, correlacao cruzada e volatilidade GARCH. -
Modelos lineares generalizados e extensoes (
MASS,nlme,mgcv): GLM unificado e diagnostico de superdispersao, regressao binomial negativa, ordinal, modelos mistos e aditivos (GAM). -
Aprendizado de maquina com tidymodels: particao, validacao cruzada, receitas de pre-processamento, especificacoes de arvore, floresta, boosting, k-vizinhos, SVM e modelos regularizados, alem de ajuste, tunagem, comparacao, predicao e importancia de variaveis. Engines em
Suggests. - Avaliacao de modelos: metricas de classificacao e regressao, curvas de lift e ganho, calibracao com Hosmer-Lemeshow, escore de Brier, estatistica KS, curva precisao-revocacao, comparacao de ROC pelo teste de DeLong e acuracia diagnostica.
rnp 3.0.0
Esta versao reescreve boa parte do pacote e amplia a cobertura para os temas dos primeiros anos de um curso de estatistica. Contem mudancas incompativeis com a serie 2.x (ver “Quebra de compatibilidade”).
Novas funcionalidades
- Cerca de 60 funcoes novas em descritiva, probabilidade, processos estocasticos, simulacao, inferencia (maxima verossimilhanca, bootstrap, testes classicos e nao-parametricos), regressao (regularizada, robusta, nao-linear, Box-Cox, multinomial), multivariada (analise discriminante, Hotelling, MANOVA, fatorial, correspondencia, k-medoids), dados categoricos, delineamento experimental, series temporais e pre-processamento.
- Rotinas numericamente intensivas passaram a ser implementadas em C++ (Rcpp/RcppArmadillo): distancias, covariancia e correlacao, ajuste por QR, momentos, cadeias de Markov, reamostragem, regularizacao, regressao robusta, silhueta, ACF/PACF e imputacao por vizinhos. Os resultados foram conferidos contra as funcoes equivalentes do R base.
- As dependencias foram restritas ao R base, ao tidyverse, ao tidymodels e ao Rcpp/RcppArmadillo.
Quebra de compatibilidade
- Removidas funcoes legadas/redundantes, substituidas por equivalentes modernos:
-
rnp_freq()->rnp_tabela_frequencia()/rnp_tabela_classes() -
rnp_2freq()->rnp_tabela_contingencia()(corrige a frequencia relativa, que estava incorreta) -
rnp_summary(),rnp_summary_all(),rnp_summary_by()->rnp_descritiva()/rnp_descritiva_by() -
rnp_associacao()->rnp_teste_qui_quadrado() -
rnp_correlacao()(legada) ->rnp_matriz_correlacao() -
media_aritmetica(),media_geometrica(),media_harmonica(),rnp_media()->rnp_medias() -
rnp_atributos()->rnp_estrutura() -
rnp_load_packages(),rnp_try_error()removidas (anti-padroes) -
rnp_ts_arima(),rnp_ts_teste_estacionariedade()removidas (dependiam de forecast/tseries); usernp_ts_acf(),rnp_ts_pacf(),rnp_ts_ljung_box(),rnp_ts_holt_winters(),rnp_ts_periodograma().
-
-
rnp_read()agora usareadr(retorna tibble) em vez dedata.table.
Correcoes
-
rnp_distribuicao()ernp_grafico_qq()montavam o nome da funcao de distribuicao de forma invertida (ex.:"nd"em vez de"dnorm"), o que impedia o uso de varias distribuicoes. -
rnp_descritiva(): a colunanmascarava a variaveln, retornandon_validosincorreto. - Corrigida a formula da curtose amostral (Joanes-Gill).
-
rnp_distribuicao_hipergeometrica(): argumentonduplicado. -
nclass.*movidas destatsparagrDevices;scales::colorRampPalettecorrigido paragrDevices::colorRampPalette;stats::pntparastats::pt.