45 Ревизии (df14b4203aa5a447c399e26e7b3d134c201f1175)
 

Автор SHA1 Съобщение Дата
  Garrick Aden-Buie df14b4203a
rebuild outputs преди 2 години
  Garrick Aden-Buie 2ed69c1a11
pull latest reports преди 2 години
  Garrick Aden-Buie e26a8d48a1
fix candidate deduping by contest name преди 2 години
  Garrick Aden-Buie 769eb5546d
move around unsued code преди 2 години
  Garrick Aden-Buie 77cb0758bb
fill in missing candidate address with committee's address преди 2 години
  Garrick Aden-Buie 051b60b922
fixups and full run преди 2 години
  Garrick Aden-Buie d94e89f37f
out voters, tweaks to receipts and committees преди 2 години
  Garrick Aden-Buie 0a13f0ca90
out: candidate listing and officers преди 2 години
  Garrick Aden-Buie 1775eb0526
clean up code преди 2 години
  Garrick Aden-Buie 91ecf9eb62
normalized candidate listing (the hard way) преди 2 години
  Garrick Aden-Buie 139d69eea7
repub donors преди 2 години
  Garrick Aden-Buie f269b4914e
snapshot преди 2 години
  Garrick Aden-Buie 5655a2961a
out: addresses преди 2 години
  Garrick Aden-Buie 8d9ac72fc5
work snapshot преди 2 години
  Garrick Aden-Buie e1dcb0667f
update reports преди 2 години
  Garrick Aden-Buie 35f3a9a847
sort report list by report_id преди 2 години
  Garrick Aden-Buie 5478feb4c0
easier method to load prepped data from parquet to duckdb tables преди 2 години
  Garrick Aden-Buie 23690d6c76
progress before pause преди 2 години
  Garrick Aden-Buie 1f8f26ce30
task: table of committees преди 2 години
  Garrick Aden-Buie 7901dc4920
break process into two steps: prepare and process; pick final report преди 2 години
  Garrick Aden-Buie 2ae2575005
fix: save result of table post-processing преди 2 години
  Garrick Aden-Buie 422727b68d
need to know fixed sboe_id when writing out the parquet files преди 2 години
  Garrick Aden-Buie 070e95a120
fix missing sboe_id values that are "No Id" in the database преди 2 години
  Garrick Aden-Buie 9a1c6642e3
add validation/exploration script преди 2 години
  Garrick Aden-Buie 31ab569fd8
add `cf_db_create()` преди 2 години
  Garrick Aden-Buie 87bca76b78
`cover` table should have distinct rows, fill in missing covers преди 2 години
  Garrick Aden-Buie 9aa81ea812
faster data collection setup преди 2 години
  Garrick Aden-Buie 120702d2ae
track collect/data-raw/report_list.csv преди 2 години
  Garrick Aden-Buie 7a2cef064a
fix a bug in report processing преди 2 години
  Garrick Aden-Buie 8be009d5cf
move reports into subdirs преди 2 години
  Garrick Aden-Buie fac27f746b
status and collection process update reports преди 2 години
  Garrick Aden-Buie f6e8c9deda
finish process преди 2 години
  Garrick Aden-Buie 7b988094ca
read in report exports преди 2 години
  Garrick Aden-Buie 8593c43fbe
process raw data in a new project преди 2 години
  Garrick Aden-Buie 70369dd98b
move data collection into subfolder преди 2 години
  Garrick Aden-Buie c87a804c04
getting receipts and expenditures worked out преди 2 години
  Garrick Aden-Buie 23d145fb5d
trying to parse the badly formatted csvs преди 2 години
  Garrick Aden-Buie df7d8d347b
prepping to read into parquet format преди 2 години
  Garrick Aden-Buie 3f6def269c
reorganize targets an ensure up to date преди 2 години
  Garrick Aden-Buie 3299e98daf
ignore data-raw folder преди 2 години
  Garrick Aden-Buie 261a6f5837
rework pipeline to locally store complete report as raw text преди 2 години
  Garrick Aden-Buie 83b9d4d169
udpate gitignore преди 2 години
  Garrick Aden-Buie da3eadc747
getting report sections, fixed getting document list преди 2 години
  Garrick Aden-Buie f7eb2a291c
track committee list преди 2 години
  Garrick Aden-Buie 1f1bd52d9f
get document list for all committees since 2016 преди 2 години