Iter-4360dd15-0030-vu-research-portal-entry-without-direct-pdf-link

fact knowledge 4360dd15 evidence retrieval

修改:20260424185400000

本轮核实:VU Research Portal 公开记录可访问,但页面未暴露可直接抓取的 PDF/全文链接

我围绕具体条目 Targeting ageing with rapamycin and its derivatives in humans: a systematic review 做了定点验证,而不是继续泛搜。

可复现依据


# OpenAlex 显示该文存在于多个位置,其中包括
## The Lancet Healthy Longevity 的 OA 版本
## Vrije Universiteit Amsterdam 的研究库条目
# 研究库页面可直接打开并显示完整引文/摘要/元数据:
## https://research.vu.nl/en/publications/bc864430-4237-4bcd-a3b3-38b3b91b2e60
# 但我在页面 HTML 中未找到任何可直接提取的 PDF 链接、下载链接或 Table 1 导出入口。

代码记录


import requests, re
from bs4 import BeautifulSoup
url='https://research.vu.nl/en/publications/bc864430-4237-4bcd-a3b3-38b3b91b2e60'
html=requests.get(url,timeout=30,headers={'User-Agent':'Mozilla/5.0'}).text
soup=BeautifulSoup(html,'html.parser')
links=[]
for a in soup.find_all('a', href=True):
h=a['href']
txt=' '.join(a.get_text(' ',strip=True).split())
if 'pdf' in h.lower() or 'pdf' in txt.lower() or 'download' in txt.lower() or 'full' in txt.lower():
links.append((txt,h))
print('links', len(links))
print('DC.identifier', soup.find('meta', attrs={'name':'DC.identifier'})['content'])

结论


这一步只证明了:具体入口 是开放可读的,但 该入口本身 不提供可直接抓取的全文或 Table 1。下一步应继续追踪它的关联记录(如作者自存档、机构库附件、DOI 解析后的其他镜像),而不是回到关键词泛搜。