]> git.mxchange.org Git - fba.git/commitdiff
Continued:
authorRoland Häder <roland@mxchange.org>
Mon, 20 May 2024 12:49:13 +0000 (14:49 +0200)
committerRoland Häder <roland@mxchange.org>
Mon, 20 May 2024 12:49:13 +0000 (14:49 +0200)
- variable `response_url` is the whole URL, maybe stripped off from its anchor
  (#) part but it is NEVER a valid domain (ops)

fba/http/federation.py

index d9101c6137a69938e0243c5c25c88a0d6fc7c6a7..b3ad86ce113a094f3292f4130995243425202afa 100644 (file)
@@ -297,7 +297,7 @@ def fetch_generator_from_path(domain: str, path: str = "/") -> str:
     response_url = response.url.split("#")[0]
 
     logger.debug("response.ok='%s',response.status_code=%d,response.text()=%d,response_url='%s'", response.ok, response.status_code, len(response.text), response_url)
-    if ((response.ok and response.status_code == 200) or response.status_code == 410) and response.text.find("<html") >= 0 and validators.domain(response_url) and domain_helper.is_in_url(domain, response_url):
+    if ((response.ok and response.status_code == 200) or response.status_code == 410) and response.text.find("<html") >= 0 and validators.url(response_url) and domain_helper.is_in_url(domain, response_url):
         logger.debug("Parsing response.text()=%d Bytes ...", len(response.text))
         doc = bs4.BeautifulSoup(response.text, "html.parser")
 
@@ -340,7 +340,7 @@ def fetch_generator_from_path(domain: str, path: str = "/") -> str:
             if software is not None and software != "":
                 logger.debug("domain='%s' has og:site_name='%s' - Setting detection_mode=SITE_NAME ...", domain, software)
                 instances.set_detection_mode(domain, "SITE_NAME")
-    elif validators.domain(response_url) and not domain_helper.is_in_url(domain, response_url):
+    elif validators.url(response_url) and not domain_helper.is_in_url(domain, response_url):
         logger.warning("domain='%s' doesn't match response.url='%s', maybe redirect to other domain?", domain, response.url)
 
         components = urlparse(response.url)