질문을 삭제하지 말아주세요.!
 
1
0
-1

크롤링을 찾아보다가 snoopy를 알게됬는데


제대로 배워보고싶습니다


snoopy를 다운받으면 폴더안에 snoopy.clss.php 파일있고 여러파일이 있는데 

php 파일은 public 폴더에넣고 그냥 include시켜서 사용하면 되는건가요 ?? 


또 공식메뉴얼 이라던가 강좌가 있을까요?? 맨처음 사용자를 위한 그냥 초보적인 강좌 같은거요,,

사이트나 문서같은거 있으면 추천좀 부탁드립니다.. 

다운로드는 source forge 에서 받았는데 여기가 공식적으로 snoopy를 받는곳인가요??


질문이 많지만 조언좀 주시면 감사하겠습니다

    CommentAdd your comment...

    2 answers

    1.  
      2
      1
      0

      spatie/crawler 는 Chrome에 Node (puppteer)까지 설치되어있어야 해서 복잡하실수 있을것 같네요...


      더 심플한건 symfony에서 제공하는 dom-crawler를 추천드립니다

      써보진 않았지만, 훨씬 설치도 간편한것 같네요 composer로 설치하기만 하면 되는듯 합니다

      문서화도 물론 잘되어있구요

      https://github.com/symfony/dom-crawler


      설치

      composer require symfony/dom-crawler

      사용

      use Symfony\Component\DomCrawler\Crawler;
      
      $html = <<<'HTML'
      <!DOCTYPE html>
      <html>
          <body>
              <p class="message">Hello World!</p>
              <p>Hello Crawler!</p>
          </body>
      </html>
      HTML;
      
      $crawler = new Crawler($html);
      
      foreach ($crawler as $domElement) {
          var_dump($domElement->nodeName);
      }
        CommentAdd your comment...
      1.  
        2
        1
        0

        질문에서 벗어나지만, 다른 패키지는 어떠신가요?

        라라벨에 최적화된 spatie/crawler 패키지가 있습니다

        메뉴얼도 잘되어있고, 검증된 개발팀이 만들었습니다

        https://github.com/spatie/crawler

        1. getahead92

          감사합니다!! 그런데,, snoopy보다는 복잡해보이는데,, 어떻게 사용하는지 메뉴얼이 readme 이게 맞나요 ...?? 깃허브에 가보면 파일들이 많은데 어떤파일을 읽어보면 처음 제 웹에 적용부터 응용 까지 알수있을까요 ㅠㅠ 스누피는 폴더안에 스누피 클래스 php파일을 그냥 인클루드 시켜서

          사용하면 되는걸로 알고있는데 안내해주신 crawler 들어가보니,, 어떻게 사용하는지 감이 안잡혀요 ㅠㅠ 

        CommentAdd your comment...