方式大体有那么几种,比如phantomjs,webkit,selenium等。如果对抓取的性能没有什么要求的话, 尝试一下selenium或者watir吧.web自动化测试脚本用好了可以做很多事情.利用你的浏览器执行好js, 然后再从dom里面取数据.另外一个情况, 如果你知道js是通过ajax或者api取数据的, 直接去抓数据源, 得到的不是json就是xml, 然后处理数据吧

一、查看相应的js代码,用python获取原始数据之后,模仿js编写相应的python代码。
二、通过接口api获得数据,直接使用python获取接口数据并处理。
三。终极方法。使用Selenium和PhantomJS执行网页js代码,然后再获取数据,这种方法100%可以获取数据,确定就是速度太慢。
方式大体有那么几种,比如phantomjs,webkit,selenium等。如果对抓取的性能没有什么要求的话,尝试一下selenium或者watir吧.web自动化测试脚本用好了可以做很多事情.利用你的浏览器执行好js,然后再从dom里面取数据.另外一个情况,如果你知道js是通过ajax或者api取数据的,直接去抓数据源,得到的不是json就是xml,然后处理数据吧
在Python中,可以使用import语句来引入模块。例如,要引入名为“module”的模块,可以使用以下方式:import module。
也可以使用fROM语句来从模块中引入特定的对象:from module import object。
对于JavaScript,可以使用import语句来引入模块。例如,要引入名为“module”的模块,可以使用以下方式:import module from 'module'。
也可以使用export语句将模块中的特定对象导出供其他模块使用:export object。在使用模块时,需要确保模块已经正确安装,并且路径设置正确。
Pythonjs是一个将Python代码转换为JavaScript代码的工具。要引入cy模块,需要在Python代码中使用import语句,后面跟上cy作为模块名。例如,可以使用以下语句引入cy模块:import cy。引入cy模块后,可以在Python代码中使用cy模块中定义的函数和变量。
需要确保cy模块所在的文件在Python代码运行的环境中可访问,可以通过设置PYTHONPATH环境变量或将cy模块所在文件路径添加到sys.path列表来实现。