Lấy dữ liệu trên Scholar
Bước 1: Lấy dữ liệu tác giả trên trang Scholar bằng cách vào trang của từng tác giả và lấy cụm mã code trên địa chỉ URL: ví dụ
Feyman: chuỗi url có dạng http://scholar.google.com/citations?user=B7vSqZsAAAAJ&hl=en
Mã code của Feyman là B7vSqZsAAAAJ
Sử dụng gói mã tác giả viết cho R
library(scholar)
id < - 'B7vSqZsAAAAJ'
feynman <- get_profile(id)
feynman$name # Prints out his name
Thực hiện so sánh với các tác giả khác
Sử dụng các cấu trúc lệnh ggplot bình thường
# So sánh Richard Feynman và Stephen Hawking
ids < - c('B7vSqZsAAAAJ', 'qj74uXkAAAAJ')
# Compare their career trajectories, based on year of first citation
df <- compare_scholar_careers(ids)
ggplot(df, aes(x=career_year, y=cites)) + geom_line(aes(linetype=name)) + theme_bw()

Dự báo chỉ số h-index
Chỉ số h-index khả năng trích dẫn trong tương lai dựa trên các tỷ lệ trích dẫn trong lịch sử được Acuna et al. đưa ra ## Predict Daniel Acuna's h-index
id < - 'GAi23ssAAAAJ'
predict_h_index(id)
Anh có tài liệu nào về hồi quy ngưỡng, có thể cho mình file hoặc tên sách (tiếng anh và tiếng việt) để mình tham khảo thêm không ạ.
ReplyDeleteXin cảm ơn.