]> git.mxchange.org Git - fba.git/blob - fba/csrf.py
Continued:
[fba.git] / fba / csrf.py
1 # Fedi API Block - An aggregator for fetching blocking data from fediverse nodes
2 # Copyright (C) 2023 Free Software Foundation
3 #
4 # This program is free software: you can redistribute it and/or modify
5 # it under the terms of the GNU Affero General Public License as published
6 # by the Free Software Foundation, either version 3 of the License, or
7 # (at your option) any later version.
8 #
9 # This program is distributed in the hope that it will be useful,
10 # but WITHOUT ANY WARRANTY; without even the implied warranty of
11 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12 # GNU Affero General Public License for more details.
13 #
14 # You should have received a copy of the GNU Affero General Public License
15 # along with this program.  If not, see <https://www.gnu.org/licenses/>.
16
17 import bs4
18 import reqto
19
20 from fba import config
21 #from fba import instances
22 from fba import network
23
24 def determine(domain: str, headers: dict) -> dict:
25     # DEBUG: print(f"DEBUG: domain='{domain}',headers()={len(headers)} - CALLED!")
26     if not isinstance(domain, str):
27         raise ValueError(f"Parameter domain[]='{type(domain)}' is not 'str'")
28     elif domain == "":
29         raise ValueError("Parameter 'domain' is empty")
30     elif not isinstance(headers, dict):
31         raise ValueError(f"Parameter headers[]='{type(headers)}' is not 'dict'")
32
33     # Default headers with no CSRF
34     reqheaders = headers
35
36     try:
37         # Fetch / to check for meta tag indicating csrf
38         # DEBUG: print(f"DEBUG: Fetching / from domain='{domain}' for CSRF check ...")
39         response = reqto.get(
40             f"https://{domain}/",
41             headers=network.web_headers,
42             timeout=(config.get("connection_timeout"), config.get("read_timeout"))
43         )
44
45         # DEBUG: print(f"DEBUG: response.ok='{response.ok}',response.status_code={response.status_code},response.text()={len(response.text)}")
46         if response.ok and len(response.text) > 0:
47             meta = bs4.BeautifulSoup(
48                 response.text,
49                 "html.parser"
50             )
51             # DEBUG: print(f"DEBUG: meta[]='{type(meta)}'")
52
53             tag = meta.find("meta", attrs={"name": "csrf-token"})
54             # DEBUG: print(f"DEBUG: tag={tag}")
55
56             # DEBUG: print(f"DEBUG: Adding CSRF token='{tag['content']}' for domain='{domain}'")
57             reqheaders["X-CSRF-Token"] = tag["content"]
58
59     except BaseException as exception:
60         # DEBUG: print(f"DEBUG: No CSRF token found, using normal headers: domain='{domain}',exception[{type(exception)}]={exception}")
61         pass
62
63     # DEBUG: print(f"DEBUG: reqheaders()={len(reqheaders)} - EXIT!")
64     return reqheaders