php实现模拟登陆方正教务系统抓取课表

来源:PHPzhong 发布时间:2018-12-04 15:26:57 阅读量:740

课程格子和超级课程表这两个应用,想必大学生都很熟悉,使用自己的学号和教务系统的密码,就可以将自己的课表导入,随时随地都可以在手机上查看。

其实稍微了解一点php的话,我们也可以做一个类似这样的web 应用。

1,解决掉验证码

其实这是正方的一个小bug,当我们进入登陆界面时,浏览器会去请求服务器,服务器会生成一个验证码图片。如果我们不去请求这个图片,那么正方后台也不会生成相应的 验证码,于是这样我们就有了可乘之机,让我高兴会儿~这时,我们在不填写验证码的情况下,可以很流畅的进入。大家可以在自己的电脑上禁止访问验证码的地址,然后试试这 是不是真的~当然,这只对正方有效。

2,php 的curl 模拟登陆

接下来就是相关代码了,相信很多人和我一样,只喜欢看例子,对于长篇大论的讲解,转头就走……不过这个习惯还是不好……废话不多说!

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

//模拟登陆

  function curl_request($url,$post='',$cookie='', $returnCookie=0){

      $curl = curl_init();

      curl_setopt($curl, CURLOPT_URL, $url);

      curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)');

      curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);

      curl_setopt($curl, CURLOPT_AUTOREFERER, 1);

      curl_setopt($curl, CURLOPT_REFERER, "这里一定要换成教务系统登陆的url"); //填写教务系统url

      if($post) {

        curl_setopt($curl, CURLOPT_POST, 1);

        curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));

      }

      if($cookie) {

        curl_setopt($curl, CURLOPT_COOKIE, $cookie);

      }

      curl_setopt($curl, CURLOPT_HEADER, $returnCookie);

      curl_setopt($curl, CURLOPT_TIMEOUT, 20);

      curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);

      $data = curl_exec($curl);

      if (curl_errno($curl)) {

        return curl_error($curl);

      }

      curl_close($curl);

      if($returnCookie){

        list($header, $body) = explode("\r\n\r\n", $data, 2);

        preg_match_all("/Set\-Cookie:([^;]*);/", $header, $matches);

        $info['cookie'] = substr($matches[1][0], 1);

        $info['content'] = $body;

        return $info;

      }else{

        return $data;

      }

  }

3,教务系统登陆页面的隐藏字段

举个栗子

代码如下:

这些东西在登陆的时候也是需要带上的,顺便贴出函数,顺便暴漏了博主的学校……皇家种地大学(主要是正则表达式的运用)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

//登陆页面的隐藏字段  

 

function getView(){

  $url = 'http://jw.hzau.edu.cn/default2.aspx';

  $result = curl_request($url);

  $pattern = '//is';

  preg_match_all($pattern, $result, $matches);

  $res[0] = $matches[1][0];

      

  return $res[0] ;

}

  //返回教室查询页面的隐藏值

  private function getViewJs($cookie,$xh){

    $url = "http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";

    $result = curl_request($url,'',$cookie);

    $pattern = '//is';

    preg_match_all($pattern, $result, $matches);

    $res[0] = $matches[1][0];

    return $res[0] ;

  }

4,cookie 的获取

1

2

3

4

5

6

7

8

9

10

11

12

13

14

function login($xh,$pwd){

    $url = 'http://jw.hzau.edu.cn/default2.aspx';

    $post['__VIEWSTATE'] = $this->getView();

    $post['txtUserName'] = $xh; //填写学号

    $post['TextBox2'] = $pwd; //填写密码

    $post['txtSecretCode'] = '';

    $post['lbLanguage'] = '';

    $post['hidPdrs'] = '';

    $post['hidsc'] = '';

    $post['RadioButtonList1'] = iconv('utf-8', 'gb2312', '学生');

    $post['Button1'] = iconv('utf-8', 'gb2312', '登录');

    $result = curl_request($url,$post,'', 1);

    return $result['cookie'];

  }

5,让我们来试试查课表的功能,格式有点乱额,大家凑合着看,我把课表转成了一个二维关联数组

1

2

3

4

5

6

7

8

9

10

11

12

13

//返回课表字符串

private function classresult($xh,$pwd){

    date_default_timezone_set("PRC"); //时区设置

    $classList = "";//声明课表变量

  

    $cookie = $this->login($xh,$pwd);

    $view = $this->getViewJs($cookie,$xh);//验证密码是否正确

  

    //如果密码正确

    if (!empty($view)) {

      $url = "http://jw.hzau.edu.cn/xskbcx.aspx?xh={$xh}";

      $result = curl_request($url,'',$cookie); //保存的cookies

      preg_match_all('/([\w\W]*?)

6,再试试查询空教室的功能

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

//空教室查询结果

  public function roomresult(){

    $xh = ""; //设置学号

    $pwd = ""; //学号对应的密码

  

    $cookie = $this->login($xh,$pwd);

    $url = "http://jw.hzau.edu.cn/xs_main.aspx?xh={$xh}";

    $result = curl_request($url,'',$cookie); //保存的cookies

  

    $url="http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";

    $post['Button2'] = iconv('utf-8', 'gb2312', '空教室查询');

    $post['__EVENTARGUMENT']='';

    $post['__EVENTTARGET']='';

    $post['__VIEWSTATE'] = $this->getViewJs($cookie,$xh);

    $post['ddlDsz'] = iconv('utf-8', 'gb2312', '单');

    $post['ddlSyXn'] = '2014-2015'; //学年

    $post['ddlSyxq'] = '1';

    $post['jslb'] = '';

    $post['xiaoq'] = '';

  

    $post['kssj']=$_GET['start']; //提交的开始查询时间

    $post['sjd']=$_GET['class'];//提交的课程节次

  

    $post['xn']='2014-2015';//所在学年

    $post['xq']='2';//所在学期

    $post['xqj']='6';//当天星期几

    $post['dpDataGrid1:txtPageSize']=90;//每页显示条数

  

    $result = curl_request($url,$post,$cookie,0);

      

    preg_match_all('/]+>[^>]+span>/',$result,$out);

    $tip = iconv('gb2312', 'utf-8', $out[0][3]);//获取页面前部的提示内容

    preg_match_all('/([\w\W]*?)/',$result,$out);

    $table = iconv('gb2312', 'utf-8', $out[0][0]); //获取查询列表

      

    $this->load->view("classroom",array('tip'=>$tip,'table'=>$table));

  }

总结起来就是这些了,每个学校的教务系统都不尽相同,这时我们可以借助火狐浏览器的 firebug 抓包,看看到底提交了哪些东西。

以上所述就是本文的全部内容了,希望大家能够喜欢。


标签: PHP 环境搭建
分享:
评论:
你还没有登录,请先