The goal of the swecris
R package is to provide access to data from SweCRIS, a national database that allows you to see how participating research funding bodies has distributed their money to Swedish recipients.
SweCRIS is managed by the Swedish Research Council on behalf of the Government. This R package uses the API at SweCRIS to make data available for use from R.
Installation
You can install the development version of swecris
from GitHub with:
Examples
Projects for an organization
Goal: Using bundled data for KTH. This is a basic example which shows you how to get bundled data about projects at KTH Royal Institute of Technology:
library(swecris)
suppressPackageStartupMessages(library(dplyr))
# either fetch data live from the API
#kth_projects <- swecris_funding()
# or use the bundled data
kthf <- swecris_kth
# top three largest fundings containing abstracts with the word "data"
library(dplyr)
fundings <-
kthf |>
mutate(total_funding = as.numeric(FundingsSek)) |>
arrange(desc(total_funding)) |>
filter(grepl("data", ProjectAbstractEn)) |>
slice(3)
# display an example record
fundings |>
glimpse()
#> Rows: 1
#> Columns: 29
#> $ ProjectId <chr> "2019-00217_VR"
#> $ ProjectTitleSv <chr> "Nationell infrastruktur …
#> $ ProjectTitleEn <chr> "National Microscopy Infr…
#> $ ProjectAbstractSv <chr> "Den nationella infrastru…
#> $ ProjectAbstractEn <chr> "NMI is a distributed nat…
#> $ ProjectStartDate <dttm> 2020-01-01
#> $ ProjectEndDate <dttm> 2024-12-31
#> $ CoordinatingOrganisationId <chr> "202100-3054"
#> $ CoordinatingOrganisationNameSv <chr> "KTH, Kungliga tekniska h…
#> $ CoordinatingOrganisationNameEn <chr> "KTH, Royal Institute of…
#> $ CoordinatingOrganisationTypeOfOrganisationSv <chr> "Universitet"
#> $ CoordinatingOrganisationTypeOfOrganisationEn <chr> "University"
#> $ FundingOrganisationId <chr> "202100-5208"
#> $ FundingOrganisationNameSv <chr> "Vetenskapsrådet"
#> $ FundingOrganisationNameEn <chr> "Swedish Research Council"
#> $ FundingOrganisationTypeOfOrganisationSv <chr> "Stat, regioner, kommune…
#> $ FundingOrganisationTypeOfOrganisationEn <chr> "Governmental"
#> $ FundingsSek <dbl> 4e+07
#> $ FundingYear <dbl> 2020
#> $ FundingStartDate <date> 2020-01-01
#> $ FundingEndDate <date> 2024-12-31
#> $ TypeOfAwardId <dbl> 5
#> $ TypeOfAwardDescrSv <chr> "Forskningsinfrastruktur"
#> $ TypeOfAwardDescrEn <chr> "Research infrastructure"
#> $ UpdatedDate <chr> NA
#> $ LoadedDate <chr> "Sep 8 2023 5:12AM"
#> $ InvolvedPeople <chr> "¤¤¤65340¤Hjalmar Brismar…
#> $ Scbs <chr> "¤¤¤ 1: Naturvetenskap, N…
#> $ total_funding <dbl> 4e+07
Goal: Given an organisation, get its id and then get information about three associated projects whose funding start date soon will be here:
orgid <-
swecris_organisations() |>
filter(grepl("^KTH, ", organisationNameSv)) |>
dplyr::pull(organisationId) |>
purrr::pluck(1)
kthp <- swecris_projects(orgid)
# three upcoming projects
projects <-
kthp |>
mutate(fsd = lubridate::ymd(fundingStartDate)) |>
filter(fsd > lubridate::now()) |>
arrange(desc(fsd)) |>
select(-starts_with("projectAbstract")) |>
select(
projectId,
projectTitleEn,
projectStartDate,
projectEndDate,
fundingOrganisationNameEn,
fundingsSek,
fundingYear
) |>
head(3)
knitr::kable(projects)
projectId | projectTitleEn | projectStartDate | projectEndDate | fundingOrganisationNameEn | fundingsSek | fundingYear |
---|---|---|---|---|---|---|
2022-06621_VR | Anthropocene History | 2024-01-01 | 2028-12-31 | Swedish Research Council | 29654210 | 2024 |
2023-00543_Formas | Replacing carcinogen cobalt in hard metal products | 2024-01-01 | 2026-12-31 | Formas | 2998915 | 2024 |
2023-00562_Formas | TACK-II: an AI Framework for Automated Tunnel Inspections and Assessment | 2024-01-01 | 2027-12-31 | Formas | 4000000 | 2024 |
Project details
Goal: Given a projects id, get more information about the project and associated people and SCB classification codes:
# some details for a specific project
"2021-00157_VR" |> swecris_project() |> select(-c("projectAbstractEn")) |> t()
#> [,1]
#> projectId "2021-00157_VR"
#> projectTitleSv "Petra III svensk nod"
#> projectTitleEn "Petra III Swedish Node"
#> projectAbstractSv "Röntgenstrålning används dagligen inom sjukvården för att undersöka människors kroppar. Det är också möjligt att använda sig av röntgenstrålning för att studera virus, funktionella ytor, miljöteknik, energiprocesser, egenskaperna hos olika material, mm. För sådana studier krävs särskilda storskaliga forskningsanläggningar (synkrotroner) som producerar röntgenstrålning av extremt hög intensitet som forskarna bestrålar sina prover med och sedan mäter interaktionen mellan röntgenstrålningen och provet med hjälp av avancerade detektorer. Genom avancerad databehandling och simuleringar kan man sedan dra slutsatser om hur olika material är uppbyggda atom för atom och hur detta förändras under dynamiska processer vid t.ex. tillverkning eller användning. En synkrotronljusanläggning är en påkostad investering och olika länder samarbetar därför för att bygga och bedriva forskning vid dessa synkrotroner. Exempelvis finns ett samarbetsavtal mellan Sverige och Tyskland där organisationen Deutsches Elektronen-Synchrotron (DESY) i Hamburg har byggt och driver synkrotronljusanläggningen PETRA III, som även har en svensk nod finansierad av det svenska Vetenskapsrådet. Center for X-rays in Swedish materials science (CeXS) har ansvaret att se efter Sveriges intressen vid PETRA III. CeXS bedrivs av Kungliga Tekniska högskolan (KTH) och Linköpings Universitetet (LiU) tillsammans. Den svenska noden vid PETRA III är inriktad mot materialvetenskaplig forskning som t ex handlar om vad som händer med strukturen djupt inuti ett material under tillverkning och användning, och hur kemiska och fysikaliska fenomen sker i realtid på ett materials yta. Röntgenmätningarna ger kunskaper som på sikt leder till t ex starkare metaller, ökad livslängd hos batterier, verktyg som håller längre när de skär metall, ökad effektivitet vid additiv tillverkning, hur en katalysator konverterar skadliga utsläpp till ofarliga ämnen, hur en solpanel fungerar, osv. All denna forskning bidrar starkt till att uppfylla flera av FNs globala mål för en hållbar utveckling. Utmaningen är att synkrotronljusforskning är komplex och kräver, förutom ämneskunskaper inom materialvetenskap, speciell kompetens inom teori och praktisk användning av röntgenstrålning, specialiserad forskningsutrustning, samt dataanalys. I detta projekt vill CeXS därför bedriva utbildning inom området för forskare från universitets-, instituts-och industrisfärerna. CeXS vill också utveckla forskningsprocesser och instrumenteringen för att effektivisera användning av den svenska noden vid PETRA III samt förenkla dataanalysen.CeXS verkar också för att informera fler forskare om de nya möjligheterna vid PETRA III samt att åtkomsten till användning av PETRA III är rättvis och transparent och att det svenska forskarsamhället får den tillgång som Sverige har betalat för. Kunskapen som generas i och med användning av den svenska noden vid PETRA III bidrar till framtidens industribehov av innovationer, förbättrade produkter, mindre energikrävande processeroch processer som har lägre utsläpp. Detta inkluderar energiprodukter som batterier och solpaneler som bidrar till en omvandling av våra energisystem."
#> projectStartDate "2023-01-01"
#> projectEndDate "2026-12-31"
#> coordinatingOrganisationId "202100-3054"
#> coordinatingOrganisationNameSv "KTH, Kungliga tekniska högskolan"
#> coordinatingOrganisationNameEn "KTH, Royal Institute of Technology"
#> coordinatingOrganisationTypeOfOrganisationSv "Universitet"
#> coordinatingOrganisationTypeOfOrganisationEn "University"
#> fundingOrganisationId "202100-5208"
#> fundingOrganisationNameSv "Vetenskapsrådet"
#> fundingOrganisationNameEn "Swedish Research Council"
#> fundingOrganisationTypeOfOrganisationSv "Stat, regioner, kommuner, församlingar"
#> fundingOrganisationTypeOfOrganisationEn "Governmental"
#> fundingsSek "25636000"
#> fundingYear "2023"
#> fundingStartDate "2023-01-01"
#> fundingEndDate "2026-12-31"
#> typeOfAwardId "5"
#> typeOfAwardDescrSv "Forskningsinfrastruktur"
#> typeOfAwardDescrEn "Research infrastructure"
#> updatedDate NA
#> loadedDate "2023-09-08 05:12:00"
# some people involved in this project
"2021-00157_VR" |> swecris_project_people()
#> # A tibble: 1 × 7
#> project_id personId fullName orcId roleEn roleSv gender
#> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
#> 1 2021-00157_VR 52223 Peter Hedström 0000-0003-1102-4342 Princ… Proje… Male
# SCB classification codes for this project
"2021-00157_VR" |> swecris_project_scbs()
#> # A tibble: 2 × 10
#> project_id scb5Id scb5NameSv scb5NameEn scb3Id scb3NameSv scb3NameEn scb1Id
#> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
#> 1 2021-00157_VR 10399 Annan fys… Other Phy… 103 Fysik Physical … 1
#> 2 2021-00157_VR 20599 Annan mat… Other Mat… 205 Materialt… Materials… 2
#> # ℹ 2 more variables: scb1NameSv <chr>, scb1NameEn <chr>
Swedish, Danish, Finnish and Norwegian lists
Goal: Not part of the SweCRIS API, but mentioned on SweCRIS website. Get data for some Nordic “lists”.
Swedish list (the first few records):
sl <-
swecris_list_swedish()
#> Rows: 42816 Columns: 13
#> ── Column specification ────────────────────────────────────────────────────────
#> Delimiter: ";"
#> chr (2): ISSN, Titel
#> dbl (11): 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020, 2021, 2022
#>
#> ℹ Use `spec()` to retrieve the full column specification for this data.
#> ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
glimpse(sl |> head(3) |> collect())
#> Rows: 3
#> Columns: 13
#> $ ISSN <chr> "0001-0782", "0001-1452", "0001-1541"
#> $ Titel <chr> "Communications of the ACM", "AIAA Journal", "AIChE Journal"
#> $ `2012` <dbl> NA, 1, NA
#> $ `2013` <dbl> 1, 1, 1
#> $ `2014` <dbl> NA, 1, 1
#> $ `2015` <dbl> 1, 1, 1
#> $ `2016` <dbl> 1, 1, 1
#> $ `2017` <dbl> 1, 1, 1
#> $ `2018` <dbl> 1, 1, 1
#> $ `2019` <dbl> 1, 1, 1
#> $ `2020` <dbl> 1, 1, 1
#> $ `2021` <dbl> 1, 1, 1
#> $ `2022` <dbl> 1, NA, 1
knitr::kable(sl |> head(3) |> collect())
ISSN | Titel | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
0001-0782 | Communications of the ACM | NA | 1 | NA | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
0001-1452 | AIAA Journal | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | NA |
0001-1541 | AIChE Journal | NA | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Some other Nordic list referenced at SweCRIS are also provided:
f <- swecris_list_finnish()
n <- swecris_list_norwegian
glimpze <- function(df) {
df |> slice(1:3) |> knitr::kable()
}
glimpze(f)
id_jufo | level | title | type | issn_isbn | issn | abbr | country | DOAJ | sherpa_romeo | active | level_2012 | level_2013 | level_2014 | level_2015 | level_2016 | level_2017 | level_2018 | level_2019 | level_2020 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
65510 | 1 | PROCEEDINGS OF THE PMR CONFERENCE | Lehti/sarja | 0272-8710 | NA | NA | UNITED STATES | NA | NA | Inactive | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
89424 | 0 | ANNALS OF DISASTER RISK SCIENCES | Lehti/sarja | 2584-4873 | 2623-8934 | NA | CROATIA | NA | NA | Active | NA | NA | NA | NA | NA | NA | NA | NA | NA |
87002 | 1 | ESTUDOS LINGUISTICOS | Lehti/sarja | 1413-0939 | NA | NA | BRAZIL | 1 | NA | Active | NA | NA | NA | NA | NA | NA | NA | 1 | 1 |
glimpze(n)
journal_id | title | title_en | issn_print | issn_online | oa | publishing_agreement | group_area | group_field | level_2024 | level_2023 | level_2022 | level_2021 | level_2020 | level_2019 | level_2018 | level_2017 | level_2016 | level_2015 | level_2014 | level_2013 | level_2012 | level_2011 | level_2010 | level_2009 | level_2008 | level_2007 | level_2006 | level_2005 | level_2004 | publisher_id | publisher_company | publisher | publisher_country | language | conference_report | series | established | discontinued | url | last_updated | set | isbn_prefix | country |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
480486 | # ISOJ Journal | # ISOJ Journal | 2328-0700 | 2328-0662 | NA | NA | Humaniora | Medier og kommunikasjon | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | University of Texas at Austin, UT College of Commu | USA | Engelsk | 0 | 0 | 2013 | NA | https://online.journalism.utexas.edu/ebook.php | 2023-08-15 13:31:38 | journals | NA | NA |
469872 | (Pré)publications | (Pré)publications | NA | 1604-5394 | NA | NA | Humaniora | Historie og Idéhistorie | NA | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | NA | NA | NA | NA | Afdeling for Fransk Institut for Sprog Litteratur og Kultur Aarhus Universitet | Danmark | Flerspråklig | 0 | 0 | 2005 | NA | https://cc.au.dk/forskning/tidsskrifter/prepublications/ | 2023-06-06 12:22:29 | journals | NA | NA |
485792 | @nalyses | @nalyses | NA | 1715-9261 | NA | NA | Humaniora | Romansk | NA | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | Université d’Ottawa. Département de français | Canada | Fransk | 0 | 0 | 2006 | NA | https://uottawa.scholarsportal.info/ojs/index.php/revue-analyses/index | 2023-06-06 12:22:29 | journals | NA | NA |