]> git.mxchange.org Git - friendica.git/blobdiff - src/Content/Text/BBCode.php
@brief is removed completely
[friendica.git] / src / Content / Text / BBCode.php
index fcce795810082b359c23d1c42c55a65c3bb253a8..cdb48215c8bad12af225b82d2ceb71d9228d748a 100644 (file)
@@ -8,10 +8,8 @@ namespace Friendica\Content\Text;
 use DOMDocument;
 use DOMXPath;
 use Exception;
-use Friendica\BaseObject;
 use Friendica\Content\OEmbed;
 use Friendica\Content\Smilies;
-use Friendica\Core\Cache;
 use Friendica\Core\Config;
 use Friendica\Core\Hook;
 use Friendica\Core\L10n;
@@ -19,6 +17,7 @@ use Friendica\Core\Logger;
 use Friendica\Core\Protocol;
 use Friendica\Core\Renderer;
 use Friendica\Core\System;
+use Friendica\DI;
 use Friendica\Model\Contact;
 use Friendica\Model\Event;
 use Friendica\Model\Photo;
@@ -33,10 +32,10 @@ use Friendica\Util\Proxy as ProxyUtils;
 use Friendica\Util\Strings;
 use Friendica\Util\XML;
 
-class BBCode extends BaseObject
+class BBCode
 {
        /**
-        * @brief Fetches attachment data that were generated the old way
+        * Fetches attachment data that were generated the old way
         *
         * @param string $body Message body
         * @return array
@@ -107,7 +106,7 @@ class BBCode extends BaseObject
        }
 
        /**
-        * @brief Fetches attachment data that were generated with the "attachment" element
+        * Fetches attachment data that were generated with the "attachment" element
         *
         * @param string $body Message body
         * @return array
@@ -398,21 +397,21 @@ class BBCode extends BaseObject
         */
        public static function removeAttachment($body, $no_link_desc = false)
        {
-               return preg_replace_callback("/\[attachment (.*)\](.*?)\[\/attachment\]/ism",
+               return preg_replace_callback("/\s*\[attachment (.*)\](.*?)\[\/attachment\]\s*/ism",
                        function ($match) use ($no_link_desc) {
                                $attach_data = self::getAttachmentData($match[0]);
                                if (empty($attach_data['url'])) {
                                        return $match[0];
                                } elseif (empty($attach_data['title']) || $no_link_desc) {
-                                       return '[url]' . $attach_data['url'] . "[/url]\n";
+                                       return "\n[url]" . $attach_data['url'] . "[/url]\n";
                                } else {
-                                       return '[url=' . $attach_data['url'] . ']' . $attach_data['title'] . "[/url]\n";
+                                       return "\n[url=" . $attach_data['url'] . ']' . $attach_data['title'] . "[/url]\n";
                                }
                }, $body);
        }
 
        /**
-        * @brief Converts a BBCode text into plaintext
+        * Converts a BBCode text into plaintext
         *
         * @param      $text
         * @param bool $keep_urls Whether to keep URLs in the resulting plaintext
@@ -436,15 +435,9 @@ class BBCode extends BaseObject
                }
        }
 
-       public static function scaleExternalImages($srctext, $include_link = true, $scale_replace = false)
+       public static function scaleExternalImages($srctext)
        {
-               // Suppress "view full size"
-               if (intval(Config::get('system', 'no_view_full_size'))) {
-                       $include_link = false;
-               }
-
-               // Picture addresses can contain special characters
-               $s = htmlspecialchars_decode($srctext);
+               $s = $srctext;
 
                $matches = null;
                $c = preg_match_all('/\[img.*?\](.*?)\[\/img\]/ism', $s, $matches, PREG_SET_ORDER);
@@ -452,22 +445,12 @@ class BBCode extends BaseObject
                        foreach ($matches as $mtch) {
                                Logger::log('scale_external_image: ' . $mtch[1]);
 
-                               $hostname = str_replace('www.', '', substr(System::baseUrl(), strpos(System::baseUrl(), '://') + 3));
+                               $hostname = str_replace('www.', '', substr(DI::baseUrl(), strpos(DI::baseUrl(), '://') + 3));
                                if (stristr($mtch[1], $hostname)) {
                                        continue;
                                }
 
-                               // $scale_replace, if passed, is an array of two elements. The
-                               // first is the name of the full-size image. The second is the
-                               // name of a remote, scaled-down version of the full size image.
-                               // This allows Friendica to display the smaller remote image if
-                               // one exists, while still linking to the full-size image
-                               if ($scale_replace) {
-                                       $scaled = str_replace($scale_replace[0], $scale_replace[1], $mtch[1]);
-                               } else {
-                                       $scaled = $mtch[1];
-                               }
-                               $i = Network::fetchUrl($scaled);
+                               $i = Network::fetchUrl($mtch[1]);
                                if (!$i) {
                                        return $srctext;
                                }
@@ -488,10 +471,8 @@ class BBCode extends BaseObject
                                                        Logger::log('scale_external_images: ' . $orig_width . '->' . $new_width . 'w ' . $orig_height . '->' . $new_height . 'h' . ' match: ' . $mtch[0], Logger::DEBUG);
                                                        $s = str_replace(
                                                                $mtch[0],
-                                                               '[img=' . $new_width . 'x' . $new_height. ']' . $scaled . '[/img]'
-                                                               . "\n" . (($include_link)
-                                                                       ? '[url=' . $mtch[1] . ']' . L10n::t('view full size') . '[/url]' . "\n"
-                                                                       : ''),
+                                                               '[img=' . $new_width . 'x' . $new_height. ']' . $mtch[1] . '[/img]'
+                                                               . "\n",
                                                                $s
                                                        );
                                                        Logger::log('scale_external_images: new string: ' . $s, Logger::DEBUG);
@@ -501,16 +482,15 @@ class BBCode extends BaseObject
                        }
                }
 
-               // replace the special char encoding
-               $s = htmlspecialchars($s, ENT_NOQUOTES, 'UTF-8');
                return $s;
        }
 
        /**
+        * Truncates imported message body string length to max_import_size
+        * 
         * The purpose of this function is to apply system message length limits to
         * imported messages without including any embedded photos in the length
         *
-        * @brief Truncates imported message body string length to max_import_size
         * @param string $body
         * @return string
         * @throws \Friendica\Network\HTTPException\InternalServerErrorException
@@ -599,7 +579,6 @@ class BBCode extends BaseObject
         *
         * Note: Can produce a [bookmark] tag in the returned string
         *
-        * @brief Processes [attachment] tags
         * @param string   $text
         * @param bool|int $simplehtml
         * @param bool     $tryoembed
@@ -712,7 +691,6 @@ class BBCode extends BaseObject
        /**
         * Converts [url] BBCodes in a format that looks fine on Mastodon. (callback function)
         *
-        * @brief Converts [url] BBCodes in a format that looks fine on Mastodon. (callback function)
         * @param array $match Array with the matching values
         * @return string reformatted link including HTML codes
         */
@@ -733,7 +711,7 @@ class BBCode extends BaseObject
        }
 
        /**
-        * @brief Converts [url] BBCodes in a format that looks fine on ActivityPub systems.
+        * Converts [url] BBCodes in a format that looks fine on ActivityPub systems.
         * @param string $url URL that is about to be reformatted
         * @return string reformatted link including HTML codes
         */
@@ -1090,10 +1068,10 @@ class BBCode extends BaseObject
        private static function removePictureLinksCallback($match)
        {
                $cache_key = 'remove:' . $match[1];
-               $text = Cache::get($cache_key);
+               $text = DI::cache()->get($cache_key);
 
                if (is_null($text)) {
-                       $a = self::getApp();
+                       $a = DI::app();
 
                        $stamp1 = microtime(true);
 
@@ -1104,7 +1082,7 @@ class BBCode extends BaseObject
                        @curl_exec($ch);
                        $curl_info = @curl_getinfo($ch);
 
-                       $a->getProfiler()->saveTimestamp($stamp1, "network", System::callstack());
+                       DI::profiler()->saveTimestamp($stamp1, "network", System::callstack());
 
                        if (substr($curl_info['content_type'], 0, 6) == 'image/') {
                                $text = "[url=" . $match[1] . ']' . $match[1] . "[/url]";
@@ -1132,7 +1110,7 @@ class BBCode extends BaseObject
                                        }
                                }
                        }
-                       Cache::set($cache_key, $text);
+                       DI::cache()->set($cache_key, $text);
                }
 
                return $text;
@@ -1149,10 +1127,10 @@ class BBCode extends BaseObject
 
        private static function cleanPictureLinksCallback($match)
        {
-               $a = self::getApp();
+               $a = DI::app();
 
                // When the picture link is the own photo path then we can avoid fetching the link
-               $own_photo_url = preg_quote(Strings::normaliseLink($a->getBaseURL()) . '/photos/');
+               $own_photo_url = preg_quote(Strings::normaliseLink(DI::baseUrl()->get()) . '/photos/');
                if (preg_match('|' . $own_photo_url . '.*?/image/|', Strings::normaliseLink($match[1]))) {
                        if (!empty($match[3])) {
                                $text = '[img=' . str_replace('-1.', '-0.', $match[2]) . ']' . $match[3] . '[/img]';
@@ -1163,7 +1141,7 @@ class BBCode extends BaseObject
                }
 
                $cache_key = 'clean:' . $match[1];
-               $text = Cache::get($cache_key);
+               $text = DI::cache()->get($cache_key);
                if (!is_null($text)) {
                        return $text;
                }
@@ -1178,7 +1156,7 @@ class BBCode extends BaseObject
                @curl_exec($ch);
                $curl_info = @curl_getinfo($ch);
 
-               $a->getProfiler()->saveTimestamp($stamp1, "network", System::callstack());
+               DI::profiler()->saveTimestamp($stamp1, "network", System::callstack());
 
                // if its a link to a picture then embed this picture
                if (substr($curl_info['content_type'], 0, 6) == 'image/') {
@@ -1214,7 +1192,7 @@ class BBCode extends BaseObject
                                }
                        }
                }
-               Cache::set($cache_key, $text);
+               DI::cache()->set($cache_key, $text);
 
                return $text;
        }
@@ -1227,7 +1205,7 @@ class BBCode extends BaseObject
        }
 
        /**
-        * @brief Converts a BBCode message to HTML message
+        * Converts a BBCode message to HTML message
         *
         * BBcode 2 HTML was written by WAY2WEB.net
         * extended to work with Mistpark/Friendica - Mike Macgirvin
@@ -1253,7 +1231,7 @@ class BBCode extends BaseObject
         */
        public static function convert($text, $try_oembed = true, $simple_html = 0, $for_plaintext = false)
        {
-               $a = self::getApp();
+               $a = DI::app();
 
                /*
                 * preg_match_callback function to replace potential Oembed tags with Oembed content
@@ -1283,9 +1261,9 @@ class BBCode extends BaseObject
                        function ($matches) use (&$codeblocks) {
                                $return = '#codeblock-' . count($codeblocks) . '#';
                                if (strpos($matches[2], "\n") !== false) {
-                                       $codeblocks[] = '<pre><code class="language-' . trim($matches[1]) . '">' . trim($matches[2], "\n\r") . '</code></pre>';
+                                       $codeblocks[] = '<pre><code class="language-' . trim($matches[1]) . '">' . htmlspecialchars(trim($matches[2], "\n\r"), ENT_NOQUOTES, 'UTF-8') . '</code></pre>';
                                } else {
-                                       $codeblocks[] = '<code>' . $matches[2] . '</code>';
+                                       $codeblocks[] = '<code>' . htmlspecialchars($matches[2], ENT_NOQUOTES, 'UTF-8') . '</code>';
                                }
 
                                return $return;
@@ -1507,8 +1485,29 @@ class BBCode extends BaseObject
                $text = str_replace('[hr]', '<hr />', $text);
 
                if (!$for_plaintext) {
+                       $escaped = [];
+
+                       // Escaping BBCodes susceptible to contain rogue URL we don'' want the autolinker to catch
+                       $text = preg_replace_callback('#\[(url|img|audio|video|youtube|vimeo|share|attachment|iframe|bookmark).+?\[/\1\]#ism',
+                               function ($matches) use (&$escaped) {
+                                       $return = '{escaped-' . count($escaped) . '}';
+                                       $escaped[] = $matches[0];
+
+                                       return $return;
+                               },
+                               $text
+                       );
+
                        // Autolinker for isolated URLs
                        $text = preg_replace(Strings::autoLinkRegEx(), '[url]$1[/url]', $text);
+
+                       // Restoring escaped blocks
+                       $text = preg_replace_callback('/{escaped-([0-9]+)}/iU',
+                               function ($matches) use ($escaped) {
+                                       return $escaped[intval($matches[1])] ?? $matches[0];
+                               },
+                               $text
+                       );
                }
 
                // This is actually executed in Item::prepareBody()
@@ -1605,9 +1604,9 @@ class BBCode extends BaseObject
                $text = preg_replace("/\[img\](.*?)\[\/img\]/ism", '<img src="$1" alt="' . L10n::t('Image/photo') . '" />', $text);
                $text = preg_replace("/\[zmg\](.*?)\[\/zmg\]/ism", '<img src="$1" alt="' . L10n::t('Image/photo') . '" />', $text);
 
-               $text = preg_replace("/\[crypt\](.*?)\[\/crypt\]/ism", '<br/><img src="' .System::baseUrl() . '/images/lock_icon.gif" alt="' . L10n::t('Encrypted content') . '" title="' . L10n::t('Encrypted content') . '" /><br />', $text);
-               $text = preg_replace("/\[crypt(.*?)\](.*?)\[\/crypt\]/ism", '<br/><img src="' .System::baseUrl() . '/images/lock_icon.gif" alt="' . L10n::t('Encrypted content') . '" title="' . '$1' . ' ' . L10n::t('Encrypted content') . '" /><br />', $text);
-               //$Text = preg_replace("/\[crypt=(.*?)\](.*?)\[\/crypt\]/ism", '<br/><img src="' .System::baseUrl() . '/images/lock_icon.gif" alt="' . L10n::t('Encrypted content') . '" title="' . '$1' . ' ' . L10n::t('Encrypted content') . '" /><br />', $Text);
+               $text = preg_replace("/\[crypt\](.*?)\[\/crypt\]/ism", '<br/><img src="' .DI::baseUrl() . '/images/lock_icon.gif" alt="' . L10n::t('Encrypted content') . '" title="' . L10n::t('Encrypted content') . '" /><br />', $text);
+               $text = preg_replace("/\[crypt(.*?)\](.*?)\[\/crypt\]/ism", '<br/><img src="' .DI::baseUrl() . '/images/lock_icon.gif" alt="' . L10n::t('Encrypted content') . '" title="' . '$1' . ' ' . L10n::t('Encrypted content') . '" /><br />', $text);
+               //$Text = preg_replace("/\[crypt=(.*?)\](.*?)\[\/crypt\]/ism", '<br/><img src="' .DI::baseUrl() . '/images/lock_icon.gif" alt="' . L10n::t('Encrypted content') . '" title="' . '$1' . ' ' . L10n::t('Encrypted content') . '" /><br />', $Text);
 
                // Simplify "video" element
                $text = preg_replace('(\[video.*?\ssrc\s?=\s?([^\s\]]+).*?\].*?\[/video\])ism', '[video]$1[/video]', $text);
@@ -1757,21 +1756,21 @@ class BBCode extends BaseObject
                $text = preg_replace_callback(
                        "&\[url=/?posts/([^\[\]]*)\](.*)\[\/url\]&Usi",
                        function ($match) {
-                               return "[url=" . System::baseUrl() . "/display/" . $match[1] . "]" . $match[2] . "[/url]";
+                               return "[url=" . DI::baseUrl() . "/display/" . $match[1] . "]" . $match[2] . "[/url]";
                        }, $text
                );
 
                $text = preg_replace_callback(
                        "&\[url=/people\?q\=(.*)\](.*)\[\/url\]&Usi",
                        function ($match) {
-                               return "[url=" . System::baseUrl() . "/search?search=%40" . $match[1] . "]" . $match[2] . "[/url]";
+                               return "[url=" . DI::baseUrl() . "/search?search=%40" . $match[1] . "]" . $match[2] . "[/url]";
                        }, $text
                );
 
                // Server independent link to posts and comments
                // See issue: https://github.com/diaspora/diaspora_federation/issues/75
                $expression = "=diaspora://.*?/post/([0-9A-Za-z\-_@.:]{15,254}[0-9A-Za-z])=ism";
-               $text = preg_replace($expression, System::baseUrl()."/display/$1", $text);
+               $text = preg_replace($expression, DI::baseUrl()."/display/$1", $text);
 
                /* Tag conversion
                 * Supports:
@@ -1780,15 +1779,15 @@ class BBCode extends BaseObject
                 */
                $text = preg_replace_callback("/(?:#\[url\=[^\[\]]*\]|\[url\=[^\[\]]*\]#)(.*?)\[\/url\]/ism", function($matches) {
                        return '#<a href="'
-                               . System::baseUrl()     . '/search?tag=' . rawurlencode($matches[1])
+                               . DI::baseUrl() . '/search?tag=' . rawurlencode($matches[1])
                                . '" class="tag" rel="tag" title="' . XML::escape($matches[1]) . '">'
                                . XML::escape($matches[1])
                                . '</a>';
                }, $text);
 
                // We need no target="_blank" for local links
-               // convert links start with System::baseUrl() as local link without the target="_blank" attribute
-               $escapedBaseUrl = preg_quote(System::baseUrl(), '/');
+               // convert links start with DI::baseUrl() as local link without the target="_blank" attribute
+               $escapedBaseUrl = preg_quote(DI::baseUrl(), '/');
                $text = preg_replace("/\[url\](".$escapedBaseUrl.".*?)\[\/url\]/ism", '<a href="$1">$1</a>', $text);
                $text = preg_replace("/\[url\=(".$escapedBaseUrl.".*?)\](.*?)\[\/url\]/ism", '<a href="$1">$2</a>', $text);
 
@@ -1802,7 +1801,7 @@ class BBCode extends BaseObject
                // we may need to restrict this further if it picks up too many strays
                // link acct:user@host to a webfinger profile redirector
 
-               $text = preg_replace('/acct:([^@]+)@((?!\-)(?:[a-zA-Z\d\-]{0,62}[a-zA-Z\d]\.){1,126}(?!\d+)[a-zA-Z\d]{1,63})/', '<a href="' . System::baseUrl() . '/acctlink?addr=$1@$2" target="extlink">acct:$1@$2</a>', $text);
+               $text = preg_replace('/acct:([^@]+)@((?!\-)(?:[a-zA-Z\d\-]{0,62}[a-zA-Z\d]\.){1,126}(?!\d+)[a-zA-Z\d]{1,63})/', '<a href="' . DI::baseUrl() . '/acctlink?addr=$1@$2" target="extlink">acct:$1@$2</a>', $text);
 
                // Perform MAIL Search
                $text = preg_replace("/\[mail\](.*?)\[\/mail\]/", '<a href="mailto:$1">$1</a>', $text);
@@ -1906,7 +1905,7 @@ class BBCode extends BaseObject
        }
 
        /**
-        * @brief Strips the "abstract" tag from the provided text
+        * Strips the "abstract" tag from the provided text
         *
         * @param string $text The text with BBCode
         * @return string The same text - but without "abstract" element
@@ -1920,7 +1919,7 @@ class BBCode extends BaseObject
        }
 
        /**
-        * @brief Returns the value of the "abstract" element
+        * Returns the value of the "abstract" element
         *
         * @param string $text The text that maybe contains the element
         * @param string $addon The addon for which the abstract is meant for
@@ -1950,7 +1949,7 @@ class BBCode extends BaseObject
        }
 
        /**
-        * @brief Callback function to replace a Friendica style mention in a mention for Diaspora
+        * Callback function to replace a Friendica style mention in a mention for Diaspora
         *
         * @param array $match Matching values for the callback
         *                     [1] = Mention type (! or @)
@@ -1977,7 +1976,7 @@ class BBCode extends BaseObject
        }
 
        /**
-        * @brief Converts a BBCode text into Markdown
+        * Converts a BBCode text into Markdown
         *
         * This function converts a BBCode item body to be sent to Markdown-enabled
         * systems like Diaspora and Libertree
@@ -1989,7 +1988,7 @@ class BBCode extends BaseObject
         */
        public static function toMarkdown($text, $for_diaspora = true)
        {
-               $a = self::getApp();
+               $a = DI::app();
 
                $original_text = $text;
 
@@ -2031,9 +2030,6 @@ class BBCode extends BaseObject
                        $text = self::convert($text, false, 4);
                }
 
-               // mask some special HTML chars from conversation to markdown
-               $text = str_replace(['&lt;', '&gt;', '&amp;'], ['&_lt_;', '&_gt_;', '&_amp_;'], $text);
-
                // If a link is followed by a quote then there should be a newline before it
                // Maybe we should make this newline at every time before a quote.
                $text = str_replace(['</a><blockquote>'], ['</a><br><blockquote>'], $text);
@@ -2043,10 +2039,7 @@ class BBCode extends BaseObject
                // Now convert HTML to Markdown
                $text = HTML::toMarkdown($text);
 
-               // unmask the special chars back to HTML
-               $text = str_replace(['&\_lt\_;', '&\_gt\_;', '&\_amp\_;'], ['&lt;', '&gt;', '&amp;'], $text);
-
-               $a->getProfiler()->saveTimestamp($stamp1, "parser", System::callstack());
+               DI::profiler()->saveTimestamp($stamp1, "parser", System::callstack());
 
                // Libertree has a problem with escaped hashtags.
                $text = str_replace(['\#'], ['#'], $text);
@@ -2070,7 +2063,7 @@ class BBCode extends BaseObject
        }
 
        /**
-     * @brief Pull out all #hashtags and @person tags from $string.
+     * Pull out all #hashtags and @person tags from $string.
      *
      * We also get @person@domain.com - which would make
      * the regex quite complicated as tags can also