Bài viết của trên R blogger với mục đích xem xét và dự báo các trích dẫn của các tác giả trên trang nghiên cứu Scholar bằng cách sử dụng R

Lấy dữ liệu trên Scholar


Bước 1: Lấy dữ liệu tác giả trên trang Scholar bằng cách vào trang của từng tác giả và lấy cụm mã code trên địa chỉ URL: ví dụ
Feyman: chuỗi url có dạng http://scholar.google.com/citations?user=B7vSqZsAAAAJ&hl=en
Mã code của Feyman là B7vSqZsAAAAJ
Sử dụng gói mã tác giả viết cho R

library(scholar)
id < - 'B7vSqZsAAAAJ'
feynman <- get_profile(id)
feynman$name # Prints out his name

Thực hiện so sánh với các tác giả khác

Sử dụng các cấu trúc lệnh ggplot bình thường

# So sánh Richard Feynman và Stephen Hawking
ids < - c('B7vSqZsAAAAJ', 'qj74uXkAAAAJ')

# Compare their career trajectories, based on year of first citation
df <- compare_scholar_careers(ids)
ggplot(df, aes(x=career_year, y=cites)) + geom_line(aes(linetype=name)) + theme_bw()

Citation histories of Richard Feynman and Stephen Hawking

Dự báo chỉ số h-index

Chỉ số h-index khả năng trích dẫn trong tương lai dựa trên các tỷ lệ trích dẫn trong lịch sử được  Acuna et al. đưa ra

## Predict Daniel Acuna's h-index
id < - 'GAi23ssAAAAJ'
predict_h_index(id)


1 comments:

  1. Anh có tài liệu nào về hồi quy ngưỡng, có thể cho mình file hoặc tên sách (tiếng anh và tiếng việt) để mình tham khảo thêm không ạ.
    Xin cảm ơn.

    ReplyDelete