]> git.mxchange.org Git - friendica.git/blobdiff - include/bb2diaspora.php
Improvments of the HTML to make a better bb2markdown conversion (nested lists, youtub...
[friendica.git] / include / bb2diaspora.php
index d86ba454375b72cdb481c6a5da845028e90e3502..4a82635e57f065246adc702dc8d9d49b042ede47 100644 (file)
@@ -1,10 +1,11 @@
 <?php
 
 require_once("include/oembed.php");
-require_once('include/event.php');
-
-require_once('library/markdown.php');
-require_once('include/html2bbcode.php');
+require_once("include/event.php");
+require_once("library/markdown.php");
+require_once("include/html2bbcode.php");
+require_once("include/bbcode.php");
+require_once("include/markdownify/markdownify.php");
 
 // we don't want to support a bbcode specific markdown interpreter
 // and the markdown library we have is pretty good, but provides HTML output.
@@ -66,9 +67,82 @@ function stripdcode_br_cb($s) {
 }
 
 
+function diaspora_ul($s) {
+       // Replace "[*]" followed by any number (including zero) of
+       // spaces by "* " to match Diaspora's list format
+       if( strpos($s[0], "[list]") === 0 )
+               return '<ul class="listbullet" style="list-style-type: circle;">' . preg_replace("/\[\*\]( *)/", "* ", $s[1]) . '</ul>';
+       elseif( strpos($s[0], "[ul]") === 0 )
+               return '<ul class="listbullet" style="list-style-type: circle;">' . preg_replace("/\[\*\]( *)/", "* ", $s[1]) . '</ul>';
+       else
+               return $s[0];
+}
+
+
+function diaspora_ol($s) {
+       // A hack: Diaspora will create a properly-numbered ordered list even
+       // if you use '1.' for each element of the list, like:
+       //              1. First element
+       //              1. Second element
+       //              1. Third element
+       if( strpos($s[0], "[list=1]") === 0 )
+               return '<ul class="listdecimal" style="list-style-type: decimal;">' . preg_replace("/\[\*\]( *)/", "1. ", $s[1]) . '</ul>';
+       elseif( strpos($s[0], "[list=i]") === 0 )
+               return '<ul class="listlowerroman" style="list-style-type: lower-roman;">' . preg_replace("/\[\*\]( *)/", "1. ", $s[1]) . '</ul>';
+       elseif( strpos($s[0], "[list=I]") === 0 )
+               return '<ul class="listupperroman" style="list-style-type: upper-roman;">' . preg_replace("/\[\*\]( *)/", "1. ", $s[1]) . '</ul>';
+       elseif( strpos($s[0], "[list=a]") === 0 )
+               return '<ul class="listloweralpha" style="list-style-type: lower-alpha;">' . preg_replace("/\[\*\]( *)/", "1. ", $s[1]) . '</ul>';
+       elseif( strpos($s[0], "[list=A]") === 0 )
+               return '<ul class="listupperalpha" style="list-style-type: upper-alpha;">' . preg_replace("/\[\*\]( *)/", "1. ", $s[1]) . '</ul>';
+       elseif( strpos($s[0], "[ol]") === 0 )
+               return '<ul class="listdecimal" style="list-style-type: decimal;">' . preg_replace("/\[\*\]( *)/", "1. ", $s[1]) . '</ul>';
+       else
+               return $s[0];
+}
+
 
 function bb2diaspora($Text,$preserve_nl = false) {
 
+       // bbcode() will convert "[*]" into "<li>" with no closing "</li>"
+       // Markdownify() is unable to handle these, as it makes each new
+       // "<li>" into a deeper nested element until it crashes. So pre-format
+       // the lists as Diaspora lists before sending the $Text to bbcode()
+       //
+       // Note that to get nested lists to work for Diaspora, we would need
+       // to define the closing tag for the list elements. So nested lists
+       // are going to be flattened out in Diaspora for now
+/*     $endlessloop = 0;
+       while ((((strpos($Text, "[/list]") !== false) && (strpos($Text, "[list") !== false)) ||
+              ((strpos($Text, "[/ol]") !== false) && (strpos($Text, "[ol]") !== false)) || 
+              ((strpos($Text, "[/ul]") !== false) && (strpos($Text, "[ul]") !== false))) && (++$endlessloop < 20)) {
+               $Text = preg_replace_callback("/\[list\](.*?)\[\/list\]/is", 'diaspora_ul', $Text);
+               $Text = preg_replace_callback("/\[list=1\](.*?)\[\/list\]/is", 'diaspora_ol', $Text);
+               $Text = preg_replace_callback("/\[list=i\](.*?)\[\/list\]/s",'diaspora_ol', $Text);
+               $Text = preg_replace_callback("/\[list=I\](.*?)\[\/list\]/s", 'diaspora_ol', $Text);
+               $Text = preg_replace_callback("/\[list=a\](.*?)\[\/list\]/s", 'diaspora_ol', $Text);
+               $Text = preg_replace_callback("/\[list=A\](.*?)\[\/list\]/s", 'diaspora_ol', $Text);
+               $Text = preg_replace_callback("/\[ul\](.*?)\[\/ul\]/is", 'diaspora_ul', $Text);
+               $Text = preg_replace_callback("/\[ol\](.*?)\[\/ol\]/is", 'diaspora_ol', $Text);
+       }
+*/
+       // Convert it to HTML - don't try oembed
+       $Text = bbcode($Text, $preserve_nl, false);
+
+       // Now convert HTML to Markdown
+       $md = new Markdownify(false, false, false);
+       $Text = $md->parseString($Text);
+
+       // If the text going into bbcode() has a plain URL in it, i.e.
+       // with no [url] tags around it, it will come out of parseString()
+       // looking like: <http://url.com>, which gets removed by strip_tags().
+       // So take off the angle brackets of any such URL
+       $Text = preg_replace("/<http(.*?)>/is", "http$1", $Text);
+
+       // Remove all unconverted tags
+       $Text = strip_tags($Text);
+
+/*
        $ev = bbtoevent($Text);
 
        // Replace any html brackets with HTML Entities to prevent executing HTML or script
@@ -78,12 +152,17 @@ function bb2diaspora($Text,$preserve_nl = false) {
        $Text = str_replace(">", "&gt;", $Text);
 
        // If we find any event code, turn it into an event.
-       // After we're finished processing the bbcode we'll 
+       // After we're finished processing the bbcode we'll
        // replace all of the event code with a reformatted version.
 
-
        if($preserve_nl)
                $Text = str_replace(array("\n","\r"), array('',''),$Text);
+       else
+               // Remove the "return" character, as Diaspora uses only the "newline"
+               // character, so having the "return" character can cause signature
+               // failures
+               $Text = str_replace("\r", "", $Text);
+
 
        // Set up the parameters for a URL search string
        $URLSearchString = "^\[\]";
@@ -98,7 +177,7 @@ function bb2diaspora($Text,$preserve_nl = false) {
        // new javascript markdown processor to handle links with images as the link "text"
        // It is not optimal and may be removed if this ability is restored in the future
 
-       $Text = preg_replace("/\[url\=([$URLSearchString]*)\]\[img\](.*?)\[\/img\]\[\/url\]/ism", 
+       $Text = preg_replace("/\[url\=([$URLSearchString]*)\]\[img\](.*?)\[\/img\]\[\/url\]/ism",
                '![' . t('image/photo') . '](' . '$2' . ')' . "\n" . '[' . t('link') . '](' . '$1' . ')', $Text);
 
        $Text = preg_replace("/\[bookmark\]([$URLSearchString]*)\[\/bookmark\]/ism", '[$1]($1)', $Text);
@@ -115,7 +194,7 @@ function bb2diaspora($Text,$preserve_nl = false) {
        // Perform MAIL Search
        $Text = preg_replace("(\[mail\]([$MAILSearchString]*)\[/mail\])", '[$1](mailto:$1)', $Text);
        $Text = preg_replace("/\[mail\=([$MAILSearchString]*)\](.*?)\[\/mail\]/", '[$2](mailto:$1)', $Text);
-         
+
        $Text = str_replace('*', '\\*', $Text);
        $Text = str_replace('_', '\\_', $Text);
 
@@ -124,48 +203,55 @@ function bb2diaspora($Text,$preserve_nl = false) {
        // Check for bold text
        $Text = preg_replace("(\[b\](.*?)\[\/b\])is",'**$1**',$Text);
 
-       // Check for Italics text
+       // Check for italics text
        $Text = preg_replace("(\[i\](.*?)\[\/i\])is",'_$1_',$Text);
 
-       // Check for Underline text
-//     $Text = preg_replace("(\[u\](.*?)\[\/u\])is",'<u>$1</u>',$Text);
+       // Check for underline text
+       // Replace with italics since Diaspora doesn't have underline
+       $Text = preg_replace("(\[u\](.*?)\[\/u\])is",'_$1_',$Text);
 
        // Check for strike-through text
-//     $Text = preg_replace("(\[s\](.*?)\[\/s\])is",'<strike>$1</strike>',$Text);
+       $Text = preg_replace("(\[s\](.*?)\[\/s\])is",'**[strike]**$1**[/strike]**',$Text);
 
        // Check for over-line text
 //     $Text = preg_replace("(\[o\](.*?)\[\/o\])is",'<span class="overline">$1</span>',$Text);
 
        // Check for colored text
-//     $Text = preg_replace("(\[color=(.*?)\](.*?)\[\/color\])is","<span style=\"color: $1;\">$2</span>",$Text);
+       // Remove color since Diaspora doesn't support it
+       $Text = preg_replace("(\[color=(.*?)\](.*?)\[\/color\])is","$2",$Text);
 
        // Check for sized text
-//     $Text = preg_replace("(\[size=(.*?)\](.*?)\[\/size\])is","<span style=\"font-size: $1;\">$2</span>",$Text);
+       // Remove it since Diaspora doesn't support sizes very well
+       $Text = preg_replace("(\[size=(.*?)\](.*?)\[\/size\])is","$2",$Text);
 
        // Check for list text
-//     $Text = preg_replace("/\[list\](.*?)\[\/list\]/is", '<ul class="listbullet">$1</ul>' ,$Text);
-//     $Text = preg_replace("/\[list=1\](.*?)\[\/list\]/is", '<ul class="listdecimal">$1</ul>' ,$Text);
-//     $Text = preg_replace("/\[list=i\](.*?)\[\/list\]/s",'<ul class="listlowerroman">$1</ul>' ,$Text);
-//     $Text = preg_replace("/\[list=I\](.*?)\[\/list\]/s", '<ul class="listupperroman">$1</ul>' ,$Text);
-//     $Text = preg_replace("/\[list=a\](.*?)\[\/list\]/s", '<ul class="listloweralpha">$1</ul>' ,$Text);
-//     $Text = preg_replace("/\[list=A\](.*?)\[\/list\]/s", '<ul class="listupperalpha">$1</ul>' ,$Text);
+       $Text = preg_replace_callback("/\[list\](.*?)\[\/list\]/is", 'diaspora_ul', $Text);
+       $Text = preg_replace_callback("/\[ul\](.*?)\[\/ul\]/is", 'diaspora_ul', $Text);
+       $Text = preg_replace_callback("/\[list=1\](.*?)\[\/list\]/is", 'diaspora_ol', $Text);
+       $Text = preg_replace_callback("/\[list=i\](.*?)\[\/list\]/s",'diaspora_ol', $Text);
+       $Text = preg_replace_callback("/\[list=I\](.*?)\[\/list\]/s", 'diaspora_ol', $Text);
+       $Text = preg_replace_callback("/\[list=a\](.*?)\[\/list\]/s", 'diaspora_ol', $Text);
+       $Text = preg_replace_callback("/\[list=A\](.*?)\[\/list\]/s", 'diaspora_ol', $Text);
+       $Text = preg_replace_callback("/\[ol\](.*?)\[\/ol\]/is", 'diaspora_ol', $Text);
 //     $Text = preg_replace("/\[li\](.*?)\[\/li\]/s", '<li>$1</li>' ,$Text);
 
-//     $Text = preg_replace("/\[td\](.*?)\[\/td\]/s", '<td>$1</td>' ,$Text);
-//     $Text = preg_replace("/\[tr\](.*?)\[\/tr\]/s", '<tr>$1</tr>' ,$Text);
-//     $Text = preg_replace("/\[table\](.*?)\[\/table\]/s", '<table>$1</table>' ,$Text);
+       // Just get rid of table tags since Diaspora doesn't support tables
+       $Text = preg_replace("/\[th\](.*?)\[\/th\]/s", '$1' ,$Text);
+       $Text = preg_replace("/\[td\](.*?)\[\/td\]/s", '$1' ,$Text);
+       $Text = preg_replace("/\[tr\](.*?)\[\/tr\]/s", '$1' ,$Text);
+       $Text = preg_replace("/\[table\](.*?)\[\/table\]/s", '$1' ,$Text);
 
-//     $Text = preg_replace("/\[table border=1\](.*?)\[\/table\]/s", '<table border="1" >$1</table>' ,$Text);
+       $Text = preg_replace("/\[table border=(.*?)\](.*?)\[\/table\]/s", '$2' ,$Text);
 //     $Text = preg_replace("/\[table border=0\](.*?)\[\/table\]/s", '<table border="0" >$1</table>' ,$Text);
 
-       
+
 //     $Text = str_replace("[*]", "<li>", $Text);
 
        // Check for font change text
 //     $Text = preg_replace("(\[font=(.*?)\](.*?)\[\/font\])","<span style=\"font-family: $1;\">$2</span>",$Text);
 
 
-    $Text = preg_replace_callback("/\[code\](.*?)\[\/code\]/is",'stripdcode_br_cb',$Text);
+       $Text = preg_replace_callback("/\[code\](.*?)\[\/code\]/is",'stripdcode_br_cb',$Text);
 
        // Check for [code] text
        $Text = preg_replace("/(\[code\])+(.*?)(\[\/code\])+/is","\t$2\n", $Text);
@@ -174,10 +260,11 @@ function bb2diaspora($Text,$preserve_nl = false) {
 
 
        // Declare the format for [quote] layout
-       //      $QuoteLayout = '<blockquote>$1</blockquote>';                     
+       //      $QuoteLayout = '<blockquote>$1</blockquote>';
        // Check for [quote] text
        $Text = preg_replace("/\[quote\](.*?)\[\/quote\]/is",">$1\n\n", $Text);
-         
+       $Text = preg_replace("/\[quote=(.*?)\](.*?)\[\/quote\]/is",">$2\n\n", $Text);
+
        // Images
 
        // html5 video and audio
@@ -187,13 +274,13 @@ function bb2diaspora($Text,$preserve_nl = false) {
        $Text = preg_replace("/\[audio\](.*?)\[\/audio\]/", '$1', $Text);
 
 //     $Text = preg_replace("/\[iframe\](.*?)\[\/iframe\]/", '<iframe src="$1" width="425" height="350"><a href="$1">$1</a></iframe>', $Text);
-         
+
        // [img=widthxheight]image source[/img]
 //     $Text = preg_replace("/\[img\=([0-9]*)x([0-9]*)\](.*?)\[\/img\]/", '<img src="$3" style="height:{$2}px; width:{$1}px;" >', $Text);
 
-    $Text = preg_replace("/\[youtube\]https?:\/\/www.youtube.com\/watch\?v\=(.*?)\[\/youtube\]/ism",'http://www.youtube.com/watch?v=$1',$Text); 
-    $Text = preg_replace("/\[youtube\]https?:\/\/www.youtube.com\/embed\/(.*?)\[\/youtube\]/ism",'http://www.youtube.com/watch?v=$1',$Text); 
-    $Text = preg_replace("/\[youtube\]https?:\/\/youtu.be\/(.*?)\[\/youtube\]/ism",'http://www.youtube.com/watch?v=$1',$Text); 
+       $Text = preg_replace("/\[youtube\]https?:\/\/www.youtube.com\/watch\?v\=(.*?)\[\/youtube\]/ism",'http://www.youtube.com/watch?v=$1',$Text); 
+       $Text = preg_replace("/\[youtube\]https?:\/\/www.youtube.com\/embed\/(.*?)\[\/youtube\]/ism",'http://www.youtube.com/watch?v=$1',$Text); 
+       $Text = preg_replace("/\[youtube\]https?:\/\/youtu.be\/(.*?)\[\/youtube\]/ism",'http://www.youtube.com/watch?v=$1',$Text); 
        $Text = preg_replace("/\[youtube\]([A-Za-z0-9\-_=]+)(.*?)\[\/youtube\]/ism", 'http://www.youtube.com/watch?v=$1', $Text);
 
        $Text = preg_replace("/\[vimeo\]https?:\/\/player.vimeo.com\/video\/([0-9]+)(.*?)\[\/vimeo\]/ism",'http://vimeo.com/$1',$Text); 
@@ -211,7 +298,7 @@ function bb2diaspora($Text,$preserve_nl = false) {
        if(x($ev,'desc') && x($ev,'start')) {
 
                $sub = format_event_diaspora($ev);
-       
+
                $Text = preg_replace("/\[event\-description\](.*?)\[\/event\-description\]/is",$sub,$Text);
                $Text = preg_replace("/\[event\-start\](.*?)\[\/event\-start\]/is",'',$Text);
                $Text = preg_replace("/\[event\-finish\](.*?)\[\/event\-finish\]/is",'',$Text);
@@ -222,7 +309,12 @@ function bb2diaspora($Text,$preserve_nl = false) {
        $Text = preg_replace("/\<(.*?)(src|href)=(.*?)\&amp\;(.*?)\>/ism",'<$1$2=$3&$4>',$Text);
 
        $Text = preg_replace_callback('/\[(.*?)\]\((.*?)\)/ism','unescape_underscores_in_links',$Text);
-       
+*/
+
+       // Remove any leading or trailing whitespace, as this will mess up
+       // the Diaspora signature verification and cause the item to disappear
+       $Text = trim($Text);
+
        call_hooks('bb2diaspora',$Text);
 
        return $Text;