首页
社区
课程
招聘
[已解决] 想要使用程序获得安全客文章的标题 20.00雪花
发表于: 2018-2-22 17:47 2348

[已解决] 想要使用程序获得安全客文章的标题 20.00雪花

2018-2-22 17:47
2348
例如:
链接:31bK9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6%4N6%4N6Q4x3X3g2S2L8Y4q4#2j5h3&6C8k6g2)9J5k6h3y4G2L8g2)9J5c8Y4m8G2M7%4c8Q4x3V1k6A6k6q4)9J5c8U0V1^5y4U0t1^5
我程序得到的标题是“安全客 - 有思想的安全新媒体”
我想要得到的标题是“详解Linux权限提升的攻击与防护”

我用phantomjs写了一个程序,本来以为很轻松就能得到title的,结果报错。不知道哪边出了问题,百度、google无果,也试了其他解法,但都失败,因此特来求助。
code:
var page = require('webpage').create();
page.settings.userAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36";

page.onAlert = function (message) {
    console.log(message);
    return true;
};

//url = 'https://bbs.pediy.com/thread-224651.htm'
url = 'da9K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6%4N6%4N6Q4x3X3g2S2L8Y4q4#2j5h3&6C8k6g2)9J5k6h3y4G2L8g2)9J5c8Y4m8G2M7%4c8Q4x3V1k6A6k6q4)9J5c8U0V1^5y4U0t1^5i4K6t1%4

page.open(url, function (status) {
    
    if ( status == "success") {
        var title = page.evaluate(function(){
           return document.title;
        });
        
        console.log(title);
    }
});


[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课

收藏
免费 0
支持
分享
最新回复 (5)
雪    币: 65
活跃值: (545)
能力值: ( LV4,RANK:50 )
在线值:
发帖
回帖
粉丝
2
不限于哪种方法,能够根据url得到title就行,如果能够分析里面的内容更好。要求不直接使用firefox、chrome等浏览器,因为云服务器上没有图形化界面,怕跑不起来。
2018-2-22 17:53
0
雪    币: 799
活跃值: (1236)
能力值: ( LV5,RANK:78 )
在线值:
发帖
回帖
粉丝
3
var url = 'https://bbs.pediy.com/thread-224651.htm';
var page = require('webpage').create();
page.open(url, function(status) {
  var title = page.evaluate(function() {
    return document.title;
  });
  console.log('Page title is ' + title);
  phantom.exit();
});
官方不是有文档么..这样写不对么?
var url = 'https://bbs.pediy.com/thread-224651.htm';
var page = require('webpage').create();
page.onConsoleMessage = function (msg) {
    console.log(msg);
};
page.open(url, function (status) {
    page.evaluate(function () {
        console.log(document.title);
    });
    phantom.exit();
});

官方给的两种写法..虽然本人看不出来说明差别 - -
最后于 2018-2-22 20:11 被bambooqj编辑 ,原因:
2018-2-22 20:07
0
雪    币: 18
活跃值: (25)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
4
可以  get  这个得到一个  json  对象解析之后得到标题  451K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6S2M7r3W2Q4x3X3g2S2L8Y4q4#2j5h3&6C8k6g2)9J5k6h3y4G2L8g2)9J5c8X3c8S2N6r3q4Q4x3V1k6$3x3g2)9J5c8Y4m8G2M7%4c8Q4x3@1k6A6k6q4)9K6c8o6V1^5y4U0t1^5
这个网站是加载后前端获取数据构成页面的
2018-2-22 20:43
0
雪    币: 185
活跃值: (1115)
能力值: ( LV13,RANK:405 )
在线值:
发帖
回帖
粉丝
5
如楼上所说,class="article-title"的div为想要的字段,匹配这个字段也是可以的。
2018-2-22 23:03
0
雪    币: 65
活跃值: (545)
能力值: ( LV4,RANK:50 )
在线值:
发帖
回帖
粉丝
6
OxCL 可以 get 这个得到一个 json 对象解析之后得到标题 98dK9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6S2M7r3W2Q4x3X3g2S2L8Y4q4#2j5h3&6C8k6g2)9J5k6h3y4G2L8g2)9J5c8X3c8S2N6r3q4Q4x3V1k6$3x3g2)9J5c8Y4m8G2M7%4c8Q4x3@1k6A6k6q4)9K6c8o6V1^5y4U0t1^5 这个网站是加载后前端获取数据构成页面的
正解。之前抓包的时候没在意,随便点了几个链接,居然漏掉了这个。
2018-2-23 11:26
0
游客
登录 | 注册 方可回帖
返回