Disallow: /download.php* in robots.txt
Disallow: /download.php* in robots.txt
Kann mir jemand sagen, warum in robots.txt "Disallow: /download.php*" steht.
Das heisst doch, dass die Dokumente in Dateiliste *nicht* indiziert werden.
Soweit ich weiss ist das Indizieren lassen von PDFs aber (im Normalfall) sinnvoll ...
Kann mich jemand aufklären.
Liebe Grüsse und Dank,
Michael
Das heisst doch, dass die Dokumente in Dateiliste *nicht* indiziert werden.
Soweit ich weiss ist das Indizieren lassen von PDFs aber (im Normalfall) sinnvoll ...
Kann mich jemand aufklären.
Liebe Grüsse und Dank,
Michael
Re: Disallow: /download.php* in robots.txt
Wieso sollte es sinnvoll sein, sowas wie
http://meinesupertolledomain.de/downloa ... d0e6650d6c
im Suchmaschinenindex zu haben?
Oder im Falle von
http://meinesupertolledomain.de/download.php
ein 404 not found?
http://meinesupertolledomain.de/downloa ... d0e6650d6c
im Suchmaschinenindex zu haben?
Oder im Falle von
http://meinesupertolledomain.de/download.php
ein 404 not found?
It's mostly all about maintaining two or three customer's sites Still supporter for the band Mykket Morton. Visit Mykket Morton on FB. Listen Mykket Morton and live videos on youtube.
Now building a venue for young artists to get wet on stage, rehearsal rooms, a studio, a guitar shop - yes I'm going to build some guitars.
Now building a venue for young artists to get wet on stage, rehearsal rooms, a studio, a guitar shop - yes I'm going to build some guitars.
Re: Disallow: /download.php* in robots.txt
Hinzukommt, dass eine download.php ohne Paramter vollkommen nutzlos wäre. Jawoll ![Mr. Green :mrgreen:](./images/smilies/icon_mrgreen.gif)
![Mr. Green :mrgreen:](./images/smilies/icon_mrgreen.gif)
Re: Disallow: /download.php* in robots.txt
Weil ich den Inhalt meiner PDFs gerne von den SE indiziert hätte ...claus wrote:Wieso sollte es sinnvoll sein, sowas wie
http://meinesupertolledomain.de/downloa ... d0e6650d6c
im Suchmaschinenindex zu haben?
Oder begreife ich das was nicht...?
bei
ist klar: will ich nicht und wird von den SE so oder so nicht genommen.claus wrote:http://meinesupertolledomain.de/download.php
ein 404 not found?
Gruss
Michael
Re: Disallow: /download.php* in robots.txt
Hallo,
wie Oliver es macht ist es verkehrt. Die einen möchten ein geschütztes /filearchive/*, die anderen möchten es öffnen.
OG hat sich für die erste Variante entschieden.
Jedoch ist es problemlos möglich hier einen direkten "Download" ohne diese Funktion zu generieren.
Ein kleines CP-trigger Script in "frontend_init" und das abschalten der "filearchive/.htaccess" hilft.
Jetzt ist natürlich der geschütze Bereich aufgehoben.
Das könnte ausgebaut werden um über z.B. den target-Tag in der Beschreibung zu selektieren.
Hier die Supereinfachvariante.
Dateiname: template/inc_script/frontend_init/cp_trig_filelist_kill_download.php
Vorlage: Mit Identifizierer <!--XDOWNLOAD_LINK//--> irgendwo im Template.
Es wird im Prinzip nur ein Teil des generierten Links ersetzt.
Aus
wird
Eine andere Lösung wäre die Erweiterung des CP um einen Schalter, der dies generiert. Bitte an OG wenden. (Issue schreiben).
Oder die betreffenden Dateien vom Script automatisch in ein separates Verzeichnis kopieren lassen, dann vorzugsweise mit dem tatsächlichen Namen.
So könnte auch der Schutz von /filearchive/ bestehen bleiben.
Es ist alles machbar ....
Knut
wie Oliver es macht ist es verkehrt. Die einen möchten ein geschütztes /filearchive/*, die anderen möchten es öffnen.
OG hat sich für die erste Variante entschieden.
Jedoch ist es problemlos möglich hier einen direkten "Download" ohne diese Funktion zu generieren.
Ein kleines CP-trigger Script in "frontend_init" und das abschalten der "filearchive/.htaccess" hilft.
Jetzt ist natürlich der geschütze Bereich aufgehoben.
Das könnte ausgebaut werden um über z.B. den target-Tag in der Beschreibung zu selektieren.
Hier die Supereinfachvariante.
Dateiname: template/inc_script/frontend_init/cp_trig_filelist_kill_download.php
Code: Select all
<?php
/**
* ******************************************************************************
* 14.05.10 KH: CP Filelist: Kill download in link
* Aendert den Link zum Download: tauscht "download.php?f=" nach "filearchive/"
* Im Template zur Identifizierung: <!--XDOWNLOAD_LINK//-->
* Im CP: Download: [_] direkt
* in conf.inc.php: $phpwcms['allow_ext_init'] = 1;
* Verzeichnis filearchive/: Umbenennen .htaccess nach _htaccess
******************************************************************************
*/
// -------------------------------------------------------------------------------------------
// obligate check for phpwcms constants
if (!defined('PHPWCMS_ROOT')) {
die("You Cannot Access This Script Directly, Have a Nice Day."); }
// -------------------------------------------------------------------------------------------
function FILELIST_KILL_DOWNLOAD_1($text, & $data) {
// ======= CUSTOM vars ========================================================
$cp_identification = '<!--XDOWNLOAD_LINK//-->'; // cp identifier
// ============================================================================
// Der richtige CP: => filelist (7) und Tag vorhanden?
if( $data['acontent_type'] == 7 AND strpos($text, $cp_identification) )
{
// Ergebnis in Container einsetzen
$text = str_replace('download.php?f=','filearchive/',$text);
}
return $text;
}
register_cp_trigger('FILELIST_KILL_DOWNLOAD_1');
?>
Code: Select all
<!--FILE_SETTINGS_END//-->
<!--XDOWNLOAD_LINK//-->
[TITLE]<h3>{TITLE}</h3>[/TITLE]
..
..
..
<a href="{FILE_LINK}.{FILE_EXT}"{FILE_TARGET}>[FILE_TITLE]{FILE_TITLE}[/FILE_TITLE][FILE_TITLE_ELSE]{FILE_NAME}[/FILE_TITLE_ELSE]</a>
Aus
Code: Select all
Vorlage: <a href="{FILE_LINK}&target=0"{FILE_TARGET}>
Ergebnis: <a href="download.php?f=30b775233abb220a4bedda7030c8b533&target=0" target="_blank">Title-PDF</a>
Code: Select all
Vorlage: <a href="{FILE_LINK}.{FILE_EXT}"{FILE_TARGET}>
Ergebnis: <a href="filearchive/30b775233abb220a4bedda7030c8b533.pdf" target="_blank">Title-PDF</a>
Oder die betreffenden Dateien vom Script automatisch in ein separates Verzeichnis kopieren lassen, dann vorzugsweise mit dem tatsächlichen Namen.
Code: Select all
<a href="content/doc/super-wichtiges.pdf" target="_blank">Title-PDF</a>
Es ist alles machbar ....
Knut
>> HowTo | DOCU | FAQ | TEMPLATES/DOCS << ( SITE )
Re: Disallow: /download.php* in robots.txt
Um das Pdf in einem Tab / Fenster sich öffnen zu lassen, muss in der conf.inc.php stehen:
$phpwcms['inline_download'] = 1;
und im Contentpart Dateiliste darf Download direkt nicht gecheckt sein
Dann sollte auch eine Suchmaschine sicher das pdf lesen und indexieren können (über den Link dahin).
$phpwcms['inline_download'] = 0; bietet die Datei zum Download an.
Ist nur eine Vermutung, sollte aber so stimmen, denn ein und dasselbe pdf, angeboten auf diese zwei Arten auf zwei verschiedenen Websites zeigt im index der Suchmaschine nur das mit der 1. Methode angebotene pdf ... und das wiederholt sich bei ca 15 weiteren genau so....
Disallow download.php* auszukommentieren soll dabei auch helfen.... oder?
Oder ich liege da total falsch![Smile :)](./images/smilies/icon_smile.gif)
$phpwcms['inline_download'] = 1;
und im Contentpart Dateiliste darf Download direkt nicht gecheckt sein
Dann sollte auch eine Suchmaschine sicher das pdf lesen und indexieren können (über den Link dahin).
$phpwcms['inline_download'] = 0; bietet die Datei zum Download an.
Ist nur eine Vermutung, sollte aber so stimmen, denn ein und dasselbe pdf, angeboten auf diese zwei Arten auf zwei verschiedenen Websites zeigt im index der Suchmaschine nur das mit der 1. Methode angebotene pdf ... und das wiederholt sich bei ca 15 weiteren genau so....
Disallow download.php* auszukommentieren soll dabei auch helfen.... oder?
Oder ich liege da total falsch
![Smile :)](./images/smilies/icon_smile.gif)
It's mostly all about maintaining two or three customer's sites Still supporter for the band Mykket Morton. Visit Mykket Morton on FB. Listen Mykket Morton and live videos on youtube.
Now building a venue for young artists to get wet on stage, rehearsal rooms, a studio, a guitar shop - yes I'm going to build some guitars.
Now building a venue for young artists to get wet on stage, rehearsal rooms, a studio, a guitar shop - yes I'm going to build some guitars.
Re: Disallow: /download.php* in robots.txt
Wenn die SUMAS den Link mit "download.php?" angehen ist das natürlich die bessere Wahl.
Knut
Knut
>> HowTo | DOCU | FAQ | TEMPLATES/DOCS << ( SITE )
- Oliver Georgi
- Site Admin
- Posts: 9909
- Joined: Fri 3. Oct 2003, 22:22
- Contact:
Re: Disallow: /download.php* in robots.txt
Ich habe mich einfach default dafür entschieden, es möglichst erst mal soweit sinnvoll abzusichern - sehe nicht, was hier falsch sein sollte. Ihr kennt doch das Problem: ist etwas erst mal im Netz, ist es erst mal nicht mehr rauszubekommen. Und die meisten User sollten sich dann einen Kopf machen müssen, wenn Sie es wirklich brauchen anstatt in Facebook-Manier darauf zu setzen, dass erst mal alles erlaubt ist, was nicht explizit verboten ist.
Re: Disallow: /download.php* in robots.txt
Das sehe ich genau so.
Alternative Mittel und Wege sind ja vorhanden wenn Dokumente unbedingt im Suchindex stehen müssen.
Interessant wäre nur zu wissen, ob die SUMAs auch dem Link "example.com/download.php?xyz" folgen, wenn die "download.php" nicht in der robots.txt ausgeschlossen ist.
Knut
Alternative Mittel und Wege sind ja vorhanden wenn Dokumente unbedingt im Suchindex stehen müssen.
Interessant wäre nur zu wissen, ob die SUMAs auch dem Link "example.com/download.php?xyz" folgen, wenn die "download.php" nicht in der robots.txt ausgeschlossen ist.
Knut
>> HowTo | DOCU | FAQ | TEMPLATES/DOCS << ( SITE )
Re: Disallow: /download.php* in robots.txt
Danke für die ausführlichen Antworten und Alternativen.
Ich sehe es auch so, dass ich erstmal zurückhaltend mit den Daten im Netz bin.
Trotzdem hat es mich interessiert, wie es mit download.php* aussieht.
Wunderbar wäre beim CP Filelist eine Checkbox in der Art von:
"indexed by SE" --> file.php* und "Allow: /file.php*"
"not indexed by SE" --> download.php* und "Disallow: /download.php*"
Liebe Grüsse
Michael
Ich sehe es auch so, dass ich erstmal zurückhaltend mit den Daten im Netz bin.
Trotzdem hat es mich interessiert, wie es mit download.php* aussieht.
Wunderbar wäre beim CP Filelist eine Checkbox in der Art von:
"indexed by SE" --> file.php* und "Allow: /file.php*"
"not indexed by SE" --> download.php* und "Disallow: /download.php*"
Liebe Grüsse
Michael
- Oliver Georgi
- Site Admin
- Posts: 9909
- Joined: Fri 3. Oct 2003, 22:22
- Contact:
Re: Disallow: /download.php* in robots.txt
Die Downloads unter download.php?xyz werden korrekt indiziert, solange der Download nicht per Redirect erfolgt und dann wiederum die .htaccess in Filearchive greift, insofern diese dort noch vorhanden ist.