DOI-USGS · ldecicco-USGS · Dec 2, 2025 · Nov 24, 2025 · Nov 26, 2025 · Dec 1, 2025
diff --git a/.Rbuildignore b/.Rbuildignore
@@ -5,20 +5,15 @@
 LICENSE.md
 .gitlab-ci.yml
 README.Rmd
-all_aqs.Rmd
-all_aqs.pdf
 ^ci/*
 ^review/*
 HASP_*.tar.gz
-orig_scripts/
 DISCLAIMER.md
-^docs$
+^docker$
 ^Meta$
 code.json
-travis.yml
 _pkgdown.yml
-pkgdown/
-.gitlab/
+^.gitlab$
 ^docs$
 ^pkgdown$
 ^codecov\.yml$
@@ -49,7 +44,6 @@ vignettes/login.png
 vignettes/git_repository.png
 vignettes/https_clone.png
 deploy_simple.R
-^docs$
 cobertura.xml
 test-out.xml
 man/figures/app.gif
diff --git a/DESCRIPTION b/DESCRIPTION
@@ -59,7 +59,8 @@ Suggests:
     shinycssloaders,
     shinydashboard,
     openxlsx,
-    rmarkdown
+    rmarkdown,
+    targets
 BugReports: https://code.usgs.gov/water/stats/hasp/-/issues
 VignetteBuilder: knitr
 BuildVignettes: true

diff --git a/NAMESPACE b/NAMESPACE
@@ -4,6 +4,7 @@ export(Sc_Cl_plot)
 export(Sc_Cl_table)
 export(composite_data)
 export(create_groundwater_report)
+export(create_targets_script)
 export(daily_frequency_table)
 export(daily_gwl_plot)
 export(daily_gwl_summary)

diff --git a/NEWS b/NEWS
@@ -2,6 +2,7 @@ HASP 1.1.0
 ===========
 * Convert to new dataRetrieval USGS Waterdata API functions and format.
 * Switched to native R pipe (|>)
+* Added a function to create a targets workflow for composite aquifers
 
 HASP 1.0.3
 ===========

diff --git a/R/Sc_Cl_plot.R b/R/Sc_Cl_plot.R
@@ -3,8 +3,8 @@
 #' Functions to create the individual chloride, specific conductance, 
 #' and combination plots and tables for a single site.
 #'
-#' @param qw_data data frame returned from dataRetrieval::readWQPqw,
-#' must include columns sample_dt, parm_cd, result_va
+#' @param qw_data data frame returned from \code{\link[dataRetrieval]{readWQPqw}},
+#' must include columns "ActivityStartDateTime", "CharacteristicName", and "ResultMeasureValue"
 #' @param plot_title character title for plot
 #' @param subtitle character. Sub-title for plot, default is "U.S. Geological Survey".
 #' @rdname sc_cl

diff --git a/R/analyze.R b/R/analyze.R
@@ -13,14 +13,12 @@
 #'
 #' @examples 
 #' aquifer_data <- aquifer_data
-#' aquifer_data <- aquifer_data[aquifer_data$parameter_cd == "72019", ]
-#' summary_info <- site_data_summary(aquifer_data, site_col = "site_no")
+#' aquifer_data <- aquifer_data[aquifer_data$parameter_code == "72019", ]
+#' summary_info <- site_data_summary(aquifer_data)
 site_data_summary <- function(x,
                               value_col = "value",
                               site_col = "monitoring_location_id"){
 
-  site_no <- value <- ".dplyr"
-
   if(nrow(x) == 0) stop("No data")
 
   if(!all(c(site_col, value_col) %in% names(x))) stop("Missing columns")
@@ -51,33 +49,29 @@ site_data_summary <- function(x,
 #'
 #' Get map info
 #' 
-#' @param x aquifer data
+#' @param sites aquifer data
 #' @return data frame 
 #' @export
 #' @keywords internal
 #'
 #' @examples 
-#' aquifer_data <- aquifer_data
-#' map_info <- prep_map_data(aquifer_data)
-prep_map_data <- function(x ){
+#' site_info <- site_info
+#' map_info <- prep_map_data(site_info)
+prep_map_data <- function(sites){
 
-
-  if(nrow(x) == 0) stop("No data")
-
-  if(!("siteInfo" %in% names(attributes(x)))) stop("Missing site attributes")
+  if(nrow(sites) == 0) stop("No data")
 
-  sites <- attr(x, "siteInfo")
+  if(!all(c("monitoring_location_id", "monitoring_location_name", "geometry") %in% names(sites))) stop("Missing columns")
+
 
-  map_data <- sites |>
+  map_data <- sites |> 
     dplyr::mutate(popup = paste0('<b><a href="https://waterdata.usgs.gov/monitoring-location/',
-                              site_no,'">',
-                              site_no,"</a></b><br/>
+                              .data[["monitoring_location_id"]],'">',
+                              .data[["monitoring_location_id"]],"</a></b><br/>
              <table>
-             <tr><td>Name:</td><td>",
-                              station_nm,
-                              '</td></tr>
+             <tr><td>Name:</td><td>", .data[["monitoring_location_name"]],'</td></tr>
              </table>')) |> 
-    dplyr::filter(!is.na(dec_lat_va))
+    dplyr::filter(!is.na(.data[["geometry"]]))
 
   return(map_data)
 
@@ -112,20 +106,18 @@ filter_sites <- function(x,
 
   if(nrow(x) == 0) stop("No data")
 
-  if(!all(c("site_no", "year", "value") %in% names(x))) stop("Missing columns")
+  if(!all(c("monitoring_location_id", "year", "value", "parameter_code") %in% names(x))) stop("Missing columns")
 
-  lev_va <- site_no <- year <- value <- n_years <- ".dplyr"
-
-  pick_sites <- x[x$parameter_cd == parameter_cd, ]
+  pick_sites <- x[x$parameter_code == parameter_cd, ]
 
   if(nrow(pick_sites) == 0){
     warning("No data with requested parameter code.")
     return(data.frame())
   }
 
   pick_sites <- pick_sites |>
-    dplyr::filter(!is.na(value)) |> 
-    dplyr::group_by(site_no, year) |> 
+    dplyr::filter(!is.na(.data[["value"]])) |> 
+    dplyr::group_by(.data[["monitoring_location_id"]], .data[["year"]]) |> 
     dplyr::summarize(n_meas = dplyr::n()) |> 
     dplyr::ungroup() 
 
@@ -154,16 +146,16 @@ filter_sites <- function(x,
   }
 
   tots <- expand.grid(year = start_year:end_year,
-              site_no = unique(pick_sites$site_no), stringsAsFactors = FALSE) |> 
+                      monitoring_location_id = unique(pick_sites$monitoring_location_id), stringsAsFactors = FALSE) |> 
     data.frame()
 
   pick_sites_comp <- pick_sites |> 
-    dplyr::right_join(tots, by = c("year", "site_no")) |> 
-    dplyr::filter(year >= start_year,
-                  year <= end_year)
+    dplyr::right_join(tots, by = c("year", "monitoring_location_id")) |> 
+    dplyr::filter(.data[["year"]] >= start_year,
+                  .data[["year"]] <= end_year)
 
-  sites_incomplete <- unique(pick_sites_comp$site_no[is.na(pick_sites_comp$n_meas)])
-  sites_complete <- unique(pick_sites_comp$site_no)
+  sites_incomplete <- unique(pick_sites_comp$monitoring_location_id[is.na(pick_sites_comp$n_meas)])
+  sites_complete <- unique(pick_sites_comp$monitoring_location_id)
   sites_complete <- sites_complete[!sites_complete %in% sites_incomplete]
 
   # If no sites are complete...we could walk back until there are some 
@@ -173,25 +165,18 @@ filter_sites <- function(x,
   }
 
   pick_sites_comp_sum <- pick_sites_comp |> 
-    dplyr::filter(site_no %in% sites_complete) |> 
-    dplyr::group_by(site_no) |> 
+    dplyr::filter(.data[["monitoring_location_id"]] %in% sites_complete) |> 
+    dplyr::group_by(.data[["monitoring_location_id"]]) |> 
     dplyr::summarise(n_years = length(unique(year))) |> 
     dplyr::ungroup() |> 
-    dplyr::filter(n_years >= !!num_years) |> 
-    dplyr::pull(site_no)
+    dplyr::filter(.data[["n_years"]] >= !!num_years) |> 
+    dplyr::pull(.data[["monitoring_location_id"]])
 
   aquifer_data <- x |> 
-    dplyr::filter(site_no %in% pick_sites_comp_sum) |> 
-    dplyr::filter(year >= start_year,
-           year <= end_year)
+    dplyr::filter(.data[["monitoring_location_id"]] %in% pick_sites_comp_sum) |> 
+    dplyr::filter(.data[["year"]] >= start_year,
+                  .data[["year"]] <= end_year)
 
-  if("siteInfo" %in% names(attributes(x))){
-    siteInfo <- attr(x, "siteInfo") |> 
-      dplyr::filter(site_no %in% pick_sites_comp_sum)
-
-    attr(aquifer_data, "siteInfo") <- siteInfo    
-  }
-
   return(aquifer_data)
 
 }
@@ -214,33 +199,31 @@ filter_sites <- function(x,
 #' 
 composite_data <- function(x, num_years, parameter_cd){
 
-  year <- site_no <- n_sites_year <- med_site <- value <- name <- ".dplyr"
-
   if(nrow(x) == 0) stop("No data")
 
-  if(!all(c("site_no", "year", "value") %in% names(x))) stop("Missing columns")
+  if(!all(c("monitoring_location_id", "year", "value") %in% names(x))) stop("Missing columns")
 
   x <- filter_sites(x, num_years, parameter_cd = parameter_cd)
 
   if(nrow(x) == 0){
     stop("No data ")
   }
 
-  n_sites <- length(unique(x$site_no))
+  n_sites <- length(unique(x$monitoring_location_id))
 
   composite <- x |> 
-    dplyr::group_by(year, site_no) |> 
-    dplyr::summarize(med_site = stats::median(value, na.rm = TRUE)) |> 
+    dplyr::group_by(.data[["year"]], .data[["monitoring_location_id"]]) |> 
+    dplyr::summarize(med_site = stats::median(.data[["value"]], na.rm = TRUE)) |> 
     dplyr::ungroup() |> 
-    dplyr::distinct(year, site_no, med_site) |> 
-    dplyr::group_by(year) |> 
-    dplyr::summarise(mean = mean(med_site, na.rm = TRUE),
-              median = stats::median(med_site, na.rm = TRUE),
-              n_sites_year = length(unique(site_no))) |> 
-    dplyr::filter(n_sites_year == {{n_sites}}) |>
-    dplyr::select(-n_sites_year) |> 
+    dplyr::distinct(.data[["year"]], .data[["monitoring_location_id"]], .data[["med_site"]]) |> 
+    dplyr::group_by(.data[["year"]]) |> 
+    dplyr::summarise(mean = mean(.data[["med_site"]], na.rm = TRUE),
+                     median = stats::median(.data[["med_site"]], na.rm = TRUE),
+                     n_sites_year = length(unique(.data[["monitoring_location_id"]]))) |> 
+    dplyr::filter(.data[["n_sites_year"]] == {{n_sites}}) |>
+    dplyr::select(-dplyr::all_of("n_sites_year")) |>
     tidyr::pivot_longer(c("mean", "median")) |> 
-    dplyr::mutate(name = factor(name, 
+    dplyr::mutate(name = factor(.data[["name"]], 
                          levels = c("median","mean"),
                          labels = c("Median",
                                     "Mean") ))
@@ -268,7 +251,7 @@ normalized_data <- function(x, num_years, parameter_cd = "72019"){
 
   if(nrow(x) == 0) stop("No data")
 
-  if(!all(c("site_no", "year", "value") %in% names(x))) stop("Missing columns")
+  if(!all(c("monitoring_location_id", "year", "value", "parameter_code") %in% names(x))) stop("Missing columns")
 
   if(nrow(x) == 0){
     stop("No data")
@@ -277,30 +260,34 @@ normalized_data <- function(x, num_years, parameter_cd = "72019"){
   x <- filter_sites(x,
                     num_years = num_years, 
                     parameter_cd = parameter_cd)
-  n_sites <- length(unique(x$site_no))
+
+  n_sites <- length(unique(x$monitoring_location_id))
+
   year_summaries <- site_data_summary(x, 
-                                      value_col = "value", site_col = "site_no")
+                                      value_col = "value", 
+                                      site_col = "monitoring_location_id")
 
   norm_composite <- x |> 
-    dplyr::group_by(year, site_no) |> 
+    dplyr::group_by(.data[["year"]], .data[["monitoring_location_id"]]) |> 
     dplyr::mutate(med_site = stats::median(value, na.rm = TRUE)) |> 
     dplyr::ungroup() |> 
-    dplyr::distinct(year, site_no, med_site) |> 
-    dplyr::group_by(site_no) |> 
-    dplyr::mutate(max_med = max(med_site, na.rm = TRUE),
-           min_med = min(med_site, na.rm = TRUE),
-           mean_med = mean(med_site, na.rm = TRUE)) |> 
+    dplyr::distinct(.data[["year"]], .data[["monitoring_location_id"]], .data[["med_site"]]) |> 
+    dplyr::group_by(.data[["monitoring_location_id"]]) |> 
+    dplyr::mutate(max_med = max(.data[["med_site"]], na.rm = TRUE),
+                  min_med = min(.data[["med_site"]], na.rm = TRUE),
+                  mean_med = mean(.data[["med_site"]], na.rm = TRUE)) |> 
     dplyr::ungroup() |> 
-    dplyr::mutate(x_norm = -1*(med_site - mean_med)/(max_med - min_med)) |> 
+    dplyr::mutate(x_norm = -1*(.data[["med_site"]] - .data[["mean_med"]])/
+                    (.data[["max_med"]] - .data[["min_med"]])) |> 
     dplyr::ungroup() |> 
-    dplyr::group_by(year) |> 
-    dplyr::summarise(mean = mean(x_norm, na.rm = TRUE),
-              median = stats::median(x_norm, na.rm = TRUE),
-              n_sites_year = length(unique(site_no))) |> 
-    dplyr::filter(!n_sites_year < {{n_sites}}) |> 
-    dplyr::select(-n_sites_year) |> 
+    dplyr::group_by(.data[["year"]]) |> 
+    dplyr::summarise(mean = mean(.data[["x_norm"]], na.rm = TRUE),
+                     median = stats::median(.data[["x_norm"]], na.rm = TRUE),
+                     n_sites_year = length(unique(.data[["monitoring_location_id"]]))) |> 
+    dplyr::filter(!.data[["n_sites_year"]] < {{n_sites}}) |> 
+    dplyr::select(-dplyr::all_of("n_sites_year")) |> 
     tidyr::pivot_longer(c("mean", "median")) |> 
-    dplyr::mutate(name = factor(name, 
+    dplyr::mutate(name = factor(.data[["name"]], 
                          levels = c("median","mean"),
                          labels = c("Median",
                                     "Mean") ))

diff --git a/R/chloride.R b/R/chloride.R
@@ -2,7 +2,7 @@
 #'
 #' Function creates the cloride over time plot with trends.
 #'
-#' @param qw_data data frame returned from dataRetrieval::readWQPqw,
+#' @param qw_data data frame returned from \code{\link[dataRetrieval]{readWQPqw}} 
 #' must include columns ActivityStartDateTime, CharacteristicName, result_va
 #' @param CharacteristicName character CharacteristicName to plot
 #' @param norm_range a numerical range to potentially group the data. If NA, no grouping is shown.

diff --git a/R/create_groundwater_report.R b/R/create_groundwater_report.R
@@ -49,8 +49,9 @@ create_groundwater_report <- function(siteID,
   save_as <- file.path(report_path, paste0(report_name, ".Rmd"))
   new <- usethis::write_over(save_as, template_contents)
 
-  usethis::edit_file(save_as)
-
+  if (new) {
+    usethis::edit_file(save_as)
+  }
 
 }
 
diff --git a/R/create_targets_script.R b/R/create_targets_script.R
@@ -0,0 +1,53 @@
+#' Generate targets script for national aquifer data pull
+#'
+#' @description Opens a template of the blanks sample report. Running the function
+#' will create a Rmd file.
+#'
+#' @param national_aquifer_cd character. 
+#' @param parameter_cd character. 
+#' @param statistic_cd character. 
+#' @param start_date character. 
+#' @param end_date character. 
+#' @param file_name description
+#'
+#' @export
+#' @examples 
+#' 
+#' 
+#' \dontrun{
+#' create_targets_script(national_aquifer_cd = "N100BSNRGB",
+#'                       parameter_cd = "72019",
+#'                       statistic_cd = "00003",
+#'                       start_date = "1988-10-01",
+#'                       end_date = "2021-01-01",
+#'                       file_name = "_targets_test.R")
+#' }
+#' 
+create_targets_script <- function(national_aquifer_cd,
+                                  parameter_cd = "72019",
+                                  statistic_cd = "00003",
+                                  start_date,
+                                  end_date,
+                                  file_name = "_targets.R"){
+
+
+  template_path <- system.file(package = "HASP", "templates", "aquifer_target.R")
+
+
+  template_contents <- strsplit(whisker::whisker.render(xfun::read_utf8(template_path), 
+                                                        data = list(national_aquifer_cd = national_aquifer_cd,
+                                                                    parameter_cd = parameter_cd,
+                                                                    statistic_cd = statistic_cd,
+                                                                    start_date = start_date,
+                                                                    end_date = end_date)), "\n")[[1]]
+
+
+  new <- usethis::write_over(file_name, template_contents)
+
+  if (new) {
+    usethis::edit_file(file_name)
+  }
+
+
+}
+