Re: [CBLX] wget

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


From: Aldo <info@xxxxxxxxxxxx>
Subject: Re: [CBLX] wget
Date: Wed, 19 Mar 2014 12:57:05 +0100

> Je suis tout à fait d'accord avec toi et avec Jeremy, mais je tente
> neanmoins de récupérer un maximum, quitte à refaire les pages et scripts php
> ultérieurement.
> Mais j'ai toujours pas assez de profondeur dans mon pompage via wget, mais
> sans doute pour la raison que tu évoques, cad que l'organisation des
> dossiers est differente et sans rapport avec la structure et les liens
> suivits par le site, ceci expliquerait cela.
> Note que j'ai expressément demandé à la personne concernée et propriétaire
> des domaines de reprendre contact avec l'hébergeur; pour ma part je bosse
> pour la personne (benevolement), pas pour l'hebergeur !

  Pour la prochaine fois, il me semble que ce n'est pas
  absolument superflu d'avoir un backup d'un site. Perso mon
  site internet est sous svn du moins pour la partie code et
  les données (son images etc) sont backupées à parts.

  OK Aldo on peut toujours dire un tas de choses après ! Là à
  mon avis tu vas devoir bricoler pas mal et ça risque de te
  prendre du coup pas mal de temps !


  Bon courage alors 

  Pierre


> 
> Aldo. 
> 
> On Wed, Mar 19, 2014 at 05:48:14AM +0100, Pierre Lorenzon wrote:
>> 
>> Bonjour,
>> 
>> 
>> Si je peux mettre mon grain de sel : on n'accédera pas à plus
>> de données avec wget que celle auxquelles on accède avec un
>> brouteur. Pour la bonne raison que (sauf bêtise de ma part)
>> wget adresse des requête get au serveur http et analyse
>> quand-même peut-être quelques pages. Normalement sur un site le
>> code php n'est pas visible puisque le serveur sert du html à
>> partir de ce code donc aucun espoir (et c'est tant mieux comme
>> dit Jérémy) de récupérer ça. 
>> 
>> Autre détail. L'arborescence qui a été choisie pour ranger les
>> fichiers constituant le site http n'a de rapport que celui que
>> l'on veut bien lui donner avec lorganisation logique des page
>> html elles-mêmes. Autrement dit rien n'est obligatoire et
>> surtout cette arborescence n'apparaît pas dans la structure
>> logique du site (même si on peut la reconstituer grâce aux
>> liens) . Or il n'y a en définitive que cette structure logique
>> qui soit apparente à travers le serveur http. Autrement dit un
>> fichier qui n'est pas, soit de manière directe, soit de manière
>> récursive, référencé par un lien à partir du fichier sur lequel
>> on fait le wget ne sera pas récupéré.
>> 
>> Pierre
>> 
>> From: prego jérémy <jeremy@xxxxxxxxxxxxxxxxx>
>> Subject: Re: [CBLX] wget
>> Date: Tue, 18 Mar 2014 19:42:16 +0100
>> 
>> > 
>> > 
>> > Le 18/03/2014 19:40, Aldo a écrit :
>> >> Bonsoir Erwin,
>> >>
>> >> On Tue, Mar 18, 2014 at 04:11:14PM +0100, erwin wrote:
>> >>    
>> >>> Le Tue, 18 Mar 2014 15:54:32 +0100
>> >>> Aldo<info@xxxxxxxxxxxx>  écrivait:
>> >>>
>> >>>      
>> >>>> quelles options hormis -m pourrais-je ajouter à wget pour
>> >>>> récupérer en
>> >>>> profondeur ?
>> >>>>        
>> >>> trouvé cela sur un forum ubuntu
>> >>> (http://forum.ubuntu-fr.org/viewtopic.php?id=21805) :
>> >>>
>> >>> wget -r -k -np AdresseDeLaPage
>> >>>
>> >>> l'option -r signifie que le téléchargement sera récursif (il
>> >>> télécharge aussi les liens de la page)
>> >>> le -k permet de reconstituer le site localement (les liens sont
>> >>> modifié pour pointer localement)
>> >>> le -np empêche de remonter dans le répertoire parent.
>> >>>      
>> >> ça fonctionne pas mal, mieux qu'avec mon -m mais je suis loin
>> >> de tout
>> >> rapatrier;
>> >> j'ai demandé à l'intéressée de tenter de son côté de retrouver
>> >> les infos
>> >> pour accéder par ftp;
>> >>    
>> > 
>> > ça sera plus sure
>> > 
>> >> les compteurs en php par ex., ça je ne les récupère pas avec
>> >> wget, ni les
>> >> scripts en php que j'avais mis dnas misc/,
>> > 
>> > heureusement ! :)
>> > 
>> > 
>> > jerem
>> >> donc j'espère pouvoir réaccéder
>> >> en ftp si on a un peu de chance!
>> >>
>> >> Merci en tout cas.
>> >>
>> >> Aldo.
>> >>
>> >>
>> >>    
>> > 
>> > -- 
>> > 
>> >   CarrefourBLinuX MailingListe Pour obtenir de l'aide, envoyez le
>> >   sujet help à: carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>> >   Archives:
>> >   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
>> > 
>> 
>> -- 
>> 
>>    CarrefourBLinuX MailingListe 
>>    Pour obtenir de l'aide, envoyez le sujet  help  à: 
>>    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>>    Archives: 
>>    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
>> 
> 
> -- 
>   |  Verstuurd vanaf mijn GNU/Linux  |  Envoyé de mon GNU/Linux  | 
>   |  -----------------  Sent from GNU/Linux  ------------------  | 
> 
> -- 
> 
>    CarrefourBLinuX MailingListe 
>    Pour obtenir de l'aide, envoyez le sujet  help  à: 
>    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>    Archives: 
>    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> 

-- 

   CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  à: 
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/