Re: [CBLX] wget

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Je suis tout à fait d'accord avec toi et avec Jeremy, mais je tente
neanmoins de récupérer un maximum, quitte à refaire les pages et scripts php
ultérieurement.
Mais j'ai toujours pas assez de profondeur dans mon pompage via wget, mais
sans doute pour la raison que tu évoques, cad que l'organisation des
dossiers est differente et sans rapport avec la structure et les liens
suivits par le site, ceci expliquerait cela.
Note que j'ai expressément demandé à la personne concernée et propriétaire
des domaines de reprendre contact avec l'hébergeur; pour ma part je bosse
pour la personne (benevolement), pas pour l'hebergeur !

Aldo. 

On Wed, Mar 19, 2014 at 05:48:14AM +0100, Pierre Lorenzon wrote:
> 
> Bonjour,
> 
> 
> Si je peux mettre mon grain de sel : on n'accédera pas à plus
> de données avec wget que celle auxquelles on accède avec un
> brouteur. Pour la bonne raison que (sauf bêtise de ma part)
> wget adresse des requête get au serveur http et analyse
> quand-même peut-être quelques pages. Normalement sur un site le
> code php n'est pas visible puisque le serveur sert du html à
> partir de ce code donc aucun espoir (et c'est tant mieux comme
> dit Jérémy) de récupérer ça. 
> 
> Autre détail. L'arborescence qui a été choisie pour ranger les
> fichiers constituant le site http n'a de rapport que celui que
> l'on veut bien lui donner avec lorganisation logique des page
> html elles-mêmes. Autrement dit rien n'est obligatoire et
> surtout cette arborescence n'apparaît pas dans la structure
> logique du site (même si on peut la reconstituer grâce aux
> liens) . Or il n'y a en définitive que cette structure logique
> qui soit apparente à travers le serveur http. Autrement dit un
> fichier qui n'est pas, soit de manière directe, soit de manière
> récursive, référencé par un lien à partir du fichier sur lequel
> on fait le wget ne sera pas récupéré.
> 
> Pierre
> 
> From: prego jérémy <jeremy@xxxxxxxxxxxxxxxxx>
> Subject: Re: [CBLX] wget
> Date: Tue, 18 Mar 2014 19:42:16 +0100
> 
> > 
> > 
> > Le 18/03/2014 19:40, Aldo a écrit :
> >> Bonsoir Erwin,
> >>
> >> On Tue, Mar 18, 2014 at 04:11:14PM +0100, erwin wrote:
> >>    
> >>> Le Tue, 18 Mar 2014 15:54:32 +0100
> >>> Aldo<info@xxxxxxxxxxxx>  écrivait:
> >>>
> >>>      
> >>>> quelles options hormis -m pourrais-je ajouter à wget pour
> >>>> récupérer en
> >>>> profondeur ?
> >>>>        
> >>> trouvé cela sur un forum ubuntu
> >>> (http://forum.ubuntu-fr.org/viewtopic.php?id=21805) :
> >>>
> >>> wget -r -k -np AdresseDeLaPage
> >>>
> >>> l'option -r signifie que le téléchargement sera récursif (il
> >>> télécharge aussi les liens de la page)
> >>> le -k permet de reconstituer le site localement (les liens sont
> >>> modifié pour pointer localement)
> >>> le -np empêche de remonter dans le répertoire parent.
> >>>      
> >> ça fonctionne pas mal, mieux qu'avec mon -m mais je suis loin
> >> de tout
> >> rapatrier;
> >> j'ai demandé à l'intéressée de tenter de son côté de retrouver
> >> les infos
> >> pour accéder par ftp;
> >>    
> > 
> > ça sera plus sure
> > 
> >> les compteurs en php par ex., ça je ne les récupère pas avec
> >> wget, ni les
> >> scripts en php que j'avais mis dnas misc/,
> > 
> > heureusement ! :)
> > 
> > 
> > jerem
> >> donc j'espère pouvoir réaccéder
> >> en ftp si on a un peu de chance!
> >>
> >> Merci en tout cas.
> >>
> >> Aldo.
> >>
> >>
> >>    
> > 
> > -- 
> > 
> >   CarrefourBLinuX MailingListe Pour obtenir de l'aide, envoyez le
> >   sujet help à: carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
> >   Archives:
> >   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> > 
> 
> -- 
> 
>    CarrefourBLinuX MailingListe 
>    Pour obtenir de l'aide, envoyez le sujet  help  à: 
>    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>    Archives: 
>    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> 

-- 
  |  Verstuurd vanaf mijn GNU/Linux  |  Envoyé de mon GNU/Linux  | 
  |  -----------------  Sent from GNU/Linux  ------------------  | 

-- 

   CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  à: 
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/