]> git.mxchange.org Git - quix0rs-gnu-social.git/blob - lib/util.php
added copyright, updated
[quix0rs-gnu-social.git] / lib / util.php
1 <?php
2 /*
3  * StatusNet - the distributed open-source microblogging tool
4  * Copyright (C) 2008, 2009, StatusNet, Inc.
5  *
6  * This program is free software: you can redistribute it and/or modify
7  * it under the terms of the GNU Affero General Public License as published by
8  * the Free Software Foundation, either version 3 of the License, or
9  * (at your option) any later version.
10  *
11  * This program is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14  * GNU Affero General Public License for more details.
15  *
16  * You should have received a copy of the GNU Affero General Public License
17  * along with this program.  If not, see <http://www.gnu.org/licenses/>.
18  */
19
20 /* XXX: break up into separate modules (HTTP, user, files) */
21
22 // Show a server error
23
24 function common_server_error($msg, $code=500)
25 {
26     $err = new ServerErrorAction($msg, $code);
27     $err->showPage();
28 }
29
30 // Show a user error
31 function common_user_error($msg, $code=400)
32 {
33     $err = new ClientErrorAction($msg, $code);
34     $err->showPage();
35 }
36
37 /**
38  * This should only be used at setup; processes switching languages
39  * to send text to other users should use common_switch_locale().
40  * 
41  * @param string $language Locale language code (optional; empty uses
42  *                         current user's preference or site default)
43  * @return mixed success
44  */
45 function common_init_locale($language=null)
46 {
47     if(!$language) {
48         $language = common_language();
49     }
50     putenv('LANGUAGE='.$language);
51     putenv('LANG='.$language);
52     $ok =  setlocale(LC_ALL, $language . ".utf8",
53                      $language . ".UTF8",
54                      $language . ".utf-8",
55                      $language . ".UTF-8",
56                      $language);
57
58     return $ok;
59 }
60
61 /**
62  * Initialize locale and charset settings and gettext with our message catalog,
63  * using the current user's language preference or the site default.
64  * 
65  * This should generally only be run at framework initialization; code switching
66  * languages at runtime should call common_switch_language().
67  * 
68  * @access private
69  */
70 function common_init_language()
71 {
72     mb_internal_encoding('UTF-8');
73
74     // Note that this setlocale() call may "fail" but this is harmless;
75     // gettext will still select the right language.
76     $language = common_language();
77     $locale_set = common_init_locale($language);
78
79     if (!$locale_set) {
80         // The requested locale doesn't exist on the system.
81         //
82         // gettext seems very picky... We first need to setlocale()
83         // to a locale which _does_ exist on the system, and _then_
84         // we can set in another locale that may not be set up
85         // (say, ga_ES for Galego/Galician) it seems to take it.
86         //
87         // For some reason C and POSIX which are guaranteed to work
88         // don't do the job. en_US.UTF-8 should be there most of the
89         // time, but not guaranteed.
90         $ok = common_init_locale("en_US");
91         if (!$ok && strtolower(substr(PHP_OS, 0, 3)) != 'win') {
92             // Try to find a complete, working locale on Unix/Linux...
93             // @fixme shelling out feels awfully inefficient
94             // but I don't think there's a more standard way.
95             $all = `locale -a`;
96             foreach (explode("\n", $all) as $locale) {
97                 if (preg_match('/\.utf[-_]?8$/i', $locale)) {
98                     $ok = setlocale(LC_ALL, $locale);
99                     if ($ok) {
100                         break;
101                     }
102                 }
103             }
104         }
105         if (!$ok) {
106             common_log(LOG_ERR, "Unable to find a UTF-8 locale on this system; UI translations may not work.");
107         }
108         $locale_set = common_init_locale($language);
109     }
110
111     common_init_gettext();
112 }
113
114 /**
115  * @access private
116  */
117 function common_init_gettext()
118 {
119     setlocale(LC_CTYPE, 'C');
120     // So we do not have to make people install the gettext locales
121     $path = common_config('site','locale_path');
122     bindtextdomain("statusnet", $path);
123     bind_textdomain_codeset("statusnet", "UTF-8");
124     textdomain("statusnet");
125 }
126
127 /**
128  * Switch locale during runtime, and poke gettext until it cries uncle.
129  * Otherwise, sometimes it doesn't actually switch away from the old language.
130  *
131  * @param string $language code for locale ('en', 'fr', 'pt_BR' etc)
132  */
133 function common_switch_locale($language=null)
134 {
135     common_init_locale($language);
136
137     setlocale(LC_CTYPE, 'C');
138     // So we do not have to make people install the gettext locales
139     $path = common_config('site','locale_path');
140     bindtextdomain("statusnet", $path);
141     bind_textdomain_codeset("statusnet", "UTF-8");
142     textdomain("statusnet");
143 }
144
145
146 function common_timezone()
147 {
148     if (common_logged_in()) {
149         $user = common_current_user();
150         if ($user->timezone) {
151             return $user->timezone;
152         }
153     }
154
155     return common_config('site', 'timezone');
156 }
157
158 function common_valid_language($lang)
159 {
160     if ($lang) {
161         // Validate -- we don't want to end up with a bogus code
162         // left over from some old junk.
163         foreach (common_config('site', 'languages') as $code => $info) {
164             if ($info['lang'] == $lang) {
165                 return true;
166             }
167         }
168     }
169     return false;
170 }
171
172 function common_language()
173 {
174     // Allow ?uselang=xx override, very useful for debugging
175     // and helping translators check usage and context.
176     if (isset($_GET['uselang'])) {
177         $uselang = strval($_GET['uselang']);
178         if (common_valid_language($uselang)) {
179             return $uselang;
180         }
181     }
182
183     // If there is a user logged in and they've set a language preference
184     // then return that one...
185     if (_have_config() && common_logged_in()) {
186         $user = common_current_user();
187
188         if (common_valid_language($user->language)) {
189             return $user->language;
190         }
191     }
192
193     // Otherwise, find the best match for the languages requested by the
194     // user's browser...
195     if (common_config('site', 'langdetect')) {
196         $httplang = isset($_SERVER['HTTP_ACCEPT_LANGUAGE']) ? $_SERVER['HTTP_ACCEPT_LANGUAGE'] : null;
197         if (!empty($httplang)) {
198             $language = client_prefered_language($httplang);
199             if ($language)
200               return $language;
201         }
202     }
203
204     // Finally, if none of the above worked, use the site's default...
205     return common_config('site', 'language');
206 }
207 // salted, hashed passwords are stored in the DB
208
209 function common_munge_password($password, $id)
210 {
211     if (is_object($id) || is_object($password)) {
212         $e = new Exception();
213         common_log(LOG_ERR, __METHOD__ . ' object in param to common_munge_password ' .
214                    str_replace("\n", " ", $e->getTraceAsString()));
215     }
216     return md5($password . $id);
217 }
218
219 // check if a username exists and has matching password
220
221 function common_check_user($nickname, $password)
222 {
223     // empty nickname always unacceptable
224     if (empty($nickname)) {
225         return false;
226     }
227
228     $authenticatedUser = false;
229
230     if (Event::handle('StartCheckPassword', array($nickname, $password, &$authenticatedUser))) {
231         $user = User::staticGet('nickname', common_canonical_nickname($nickname));
232         if (!empty($user)) {
233             if (!empty($password)) { // never allow login with blank password
234                 if (0 == strcmp(common_munge_password($password, $user->id),
235                                 $user->password)) {
236                     //internal checking passed
237                     $authenticatedUser = $user;
238                 }
239             }
240         }
241         Event::handle('EndCheckPassword', array($nickname, $password, $authenticatedUser));
242     }
243
244     return $authenticatedUser;
245 }
246
247 // is the current user logged in?
248 function common_logged_in()
249 {
250     return (!is_null(common_current_user()));
251 }
252
253 function common_have_session()
254 {
255     return (0 != strcmp(session_id(), ''));
256 }
257
258 function common_ensure_session()
259 {
260     $c = null;
261     if (array_key_exists(session_name(), $_COOKIE)) {
262         $c = $_COOKIE[session_name()];
263     }
264     if (!common_have_session()) {
265         if (common_config('sessions', 'handle')) {
266             Session::setSaveHandler();
267         }
268         if (array_key_exists(session_name(), $_GET)) {
269             $id = $_GET[session_name()];
270         } else if (array_key_exists(session_name(), $_COOKIE)) {
271             $id = $_COOKIE[session_name()];
272         }
273         if (isset($id)) {
274             session_id($id);
275         }
276         @session_start();
277         if (!isset($_SESSION['started'])) {
278             $_SESSION['started'] = time();
279             if (!empty($id)) {
280                 common_log(LOG_WARNING, 'Session cookie "' . $_COOKIE[session_name()] . '" ' .
281                            ' is set but started value is null');
282             }
283         }
284     }
285 }
286
287 // Three kinds of arguments:
288 // 1) a user object
289 // 2) a nickname
290 // 3) null to clear
291
292 // Initialize to false; set to null if none found
293
294 $_cur = false;
295
296 function common_set_user($user)
297 {
298
299     global $_cur;
300
301     if (is_null($user) && common_have_session()) {
302         $_cur = null;
303         unset($_SESSION['userid']);
304         return true;
305     } else if (is_string($user)) {
306         $nickname = $user;
307         $user = User::staticGet('nickname', $nickname);
308     } else if (!($user instanceof User)) {
309         return false;
310     }
311
312     if ($user) {
313         if (Event::handle('StartSetUser', array(&$user))) {
314             if($user){
315                 common_ensure_session();
316                 $_SESSION['userid'] = $user->id;
317                 $_cur = $user;
318                 Event::handle('EndSetUser', array($user));
319                 return $_cur;
320             }
321         }
322     }
323     return false;
324 }
325
326 function common_set_cookie($key, $value, $expiration=0)
327 {
328     $path = common_config('site', 'path');
329     $server = common_config('site', 'server');
330
331     if ($path && ($path != '/')) {
332         $cookiepath = '/' . $path . '/';
333     } else {
334         $cookiepath = '/';
335     }
336     return setcookie($key,
337                      $value,
338                      $expiration,
339                      $cookiepath,
340                      $server);
341 }
342
343 define('REMEMBERME', 'rememberme');
344 define('REMEMBERME_EXPIRY', 30 * 24 * 60 * 60); // 30 days
345
346 function common_rememberme($user=null)
347 {
348     if (!$user) {
349         $user = common_current_user();
350         if (!$user) {
351             return false;
352         }
353     }
354
355     $rm = new Remember_me();
356
357     $rm->code = common_good_rand(16);
358     $rm->user_id = $user->id;
359
360     // Wrap the insert in some good ol' fashioned transaction code
361
362     $rm->query('BEGIN');
363
364     $result = $rm->insert();
365
366     if (!$result) {
367         common_log_db_error($rm, 'INSERT', __FILE__);
368         return false;
369     }
370
371     $rm->query('COMMIT');
372
373     $cookieval = $rm->user_id . ':' . $rm->code;
374
375     common_log(LOG_INFO, 'adding rememberme cookie "' . $cookieval . '" for ' . $user->nickname);
376
377     common_set_cookie(REMEMBERME, $cookieval, time() + REMEMBERME_EXPIRY);
378
379     return true;
380 }
381
382 function common_remembered_user()
383 {
384
385     $user = null;
386
387     $packed = isset($_COOKIE[REMEMBERME]) ? $_COOKIE[REMEMBERME] : null;
388
389     if (!$packed) {
390         return null;
391     }
392
393     list($id, $code) = explode(':', $packed);
394
395     if (!$id || !$code) {
396         common_log(LOG_WARNING, 'Malformed rememberme cookie: ' . $packed);
397         common_forgetme();
398         return null;
399     }
400
401     $rm = Remember_me::staticGet($code);
402
403     if (!$rm) {
404         common_log(LOG_WARNING, 'No such remember code: ' . $code);
405         common_forgetme();
406         return null;
407     }
408
409     if ($rm->user_id != $id) {
410         common_log(LOG_WARNING, 'Rememberme code for wrong user: ' . $rm->user_id . ' != ' . $id);
411         common_forgetme();
412         return null;
413     }
414
415     $user = User::staticGet($rm->user_id);
416
417     if (!$user) {
418         common_log(LOG_WARNING, 'No such user for rememberme: ' . $rm->user_id);
419         common_forgetme();
420         return null;
421     }
422
423     // successful!
424     $result = $rm->delete();
425
426     if (!$result) {
427         common_log_db_error($rm, 'DELETE', __FILE__);
428         common_log(LOG_WARNING, 'Could not delete rememberme: ' . $code);
429         common_forgetme();
430         return null;
431     }
432
433     common_log(LOG_INFO, 'logging in ' . $user->nickname . ' using rememberme code ' . $rm->code);
434
435     common_set_user($user);
436     common_real_login(false);
437
438     // We issue a new cookie, so they can log in
439     // automatically again after this session
440
441     common_rememberme($user);
442
443     return $user;
444 }
445
446 // must be called with a valid user!
447
448 function common_forgetme()
449 {
450     common_set_cookie(REMEMBERME, '', 0);
451 }
452
453 // who is the current user?
454 function common_current_user()
455 {
456     global $_cur;
457
458     if (!_have_config()) {
459         return null;
460     }
461
462     if ($_cur === false) {
463
464         if (isset($_COOKIE[session_name()]) || isset($_GET[session_name()])
465             || (isset($_SESSION['userid']) && $_SESSION['userid'])) {
466             common_ensure_session();
467             $id = isset($_SESSION['userid']) ? $_SESSION['userid'] : false;
468             if ($id) {
469                 $user = User::staticGet($id);
470                 if ($user) {
471                         $_cur = $user;
472                         return $_cur;
473                 }
474             }
475         }
476
477         // that didn't work; try to remember; will init $_cur to null on failure
478         $_cur = common_remembered_user();
479
480         if ($_cur) {
481             // XXX: Is this necessary?
482             $_SESSION['userid'] = $_cur->id;
483         }
484     }
485
486     return $_cur;
487 }
488
489 // Logins that are 'remembered' aren't 'real' -- they're subject to
490 // cookie-stealing. So, we don't let them do certain things. New reg,
491 // OpenID, and password logins _are_ real.
492
493 function common_real_login($real=true)
494 {
495     common_ensure_session();
496     $_SESSION['real_login'] = $real;
497 }
498
499 function common_is_real_login()
500 {
501     return common_logged_in() && $_SESSION['real_login'];
502 }
503
504 // get canonical version of nickname for comparison
505 function common_canonical_nickname($nickname)
506 {
507     // XXX: UTF-8 canonicalization (like combining chars)
508     return strtolower($nickname);
509 }
510
511 // get canonical version of email for comparison
512 function common_canonical_email($email)
513 {
514     // XXX: canonicalize UTF-8
515     // XXX: lcase the domain part
516     return $email;
517 }
518
519 function common_render_content($text, $notice)
520 {
521     $r = common_render_text($text);
522     $id = $notice->profile_id;
523     $r = common_linkify_mentions($r, $notice);
524     $r = preg_replace('/(^|[\s\.\,\:\;]+)!([A-Za-z0-9]{1,64})/e', "'\\1!'.common_group_link($id, '\\2')", $r);
525     return $r;
526 }
527
528 function common_linkify_mentions($text, $notice)
529 {
530     $mentions = common_find_mentions($text, $notice);
531
532     // We need to go through in reverse order by position,
533     // so our positions stay valid despite our fudging with the
534     // string!
535
536     $points = array();
537
538     foreach ($mentions as $mention)
539     {
540         $points[$mention['position']] = $mention;
541     }
542
543     krsort($points);
544
545     foreach ($points as $position => $mention) {
546
547         $linkText = common_linkify_mention($mention);
548
549         $text = substr_replace($text, $linkText, $position, mb_strlen($mention['text']));
550     }
551
552     return $text;
553 }
554
555 function common_linkify_mention($mention)
556 {
557     $output = null;
558
559     if (Event::handle('StartLinkifyMention', array($mention, &$output))) {
560
561         $xs = new XMLStringer(false);
562
563         $attrs = array('href' => $mention['url'],
564                        'class' => 'url');
565
566         if (!empty($mention['title'])) {
567             $attrs['title'] = $mention['title'];
568         }
569
570         $xs->elementStart('span', 'vcard');
571         $xs->elementStart('a', $attrs);
572         $xs->element('span', 'fn nickname', $mention['text']);
573         $xs->elementEnd('a');
574         $xs->elementEnd('span');
575
576         $output = $xs->getString();
577
578         Event::handle('EndLinkifyMention', array($mention, &$output));
579     }
580
581     return $output;
582 }
583
584 function common_find_mentions($text, $notice)
585 {
586     $mentions = array();
587
588     $sender = Profile::staticGet('id', $notice->profile_id);
589
590     if (empty($sender)) {
591         return $mentions;
592     }
593
594     if (Event::handle('StartFindMentions', array($sender, $text, &$mentions))) {
595
596         // Get the context of the original notice, if any
597
598         $originalAuthor   = null;
599         $originalNotice   = null;
600         $originalMentions = array();
601
602         // Is it a reply?
603
604         if (!empty($notice) && !empty($notice->reply_to)) {
605             $originalNotice = Notice::staticGet('id', $notice->reply_to);
606             if (!empty($originalNotice)) {
607                 $originalAuthor = Profile::staticGet('id', $originalNotice->profile_id);
608
609                 $ids = $originalNotice->getReplies();
610
611                 foreach ($ids as $id) {
612                     $repliedTo = Profile::staticGet('id', $id);
613                     if (!empty($repliedTo)) {
614                         $originalMentions[$repliedTo->nickname] = $repliedTo;
615                     }
616                 }
617             }
618         }
619
620         preg_match_all('/^T ([A-Z0-9]{1,64}) /',
621                        $text,
622                        $tmatches,
623                        PREG_OFFSET_CAPTURE);
624
625         preg_match_all('/(?:^|\s+)@(['.NICKNAME_FMT.']{1,64})/',
626                        $text,
627                        $atmatches,
628                        PREG_OFFSET_CAPTURE);
629
630         $matches = array_merge($tmatches[1], $atmatches[1]);
631
632         foreach ($matches as $match) {
633
634             $nickname = common_canonical_nickname($match[0]);
635
636             // Try to get a profile for this nickname.
637             // Start with conversation context, then go to
638             // sender context.
639
640             if (!empty($originalAuthor) && $originalAuthor->nickname == $nickname) {
641
642                 $mentioned = $originalAuthor;
643
644             } else if (!empty($originalMentions) &&
645                        array_key_exists($nickname, $originalMentions)) {
646
647                 $mentioned = $originalMentions[$nickname];
648             } else {
649                 $mentioned = common_relative_profile($sender, $nickname);
650             }
651
652             if (!empty($mentioned)) {
653
654                 $user = User::staticGet('id', $mentioned->id);
655
656                 if ($user) {
657                     $url = common_local_url('userbyid', array('id' => $user->id));
658                 } else {
659                     $url = $mentioned->profileurl;
660                 }
661
662                 $mention = array('mentioned' => array($mentioned),
663                                  'text' => $match[0],
664                                  'position' => $match[1],
665                                  'url' => $url);
666
667                 if (!empty($mentioned->fullname)) {
668                     $mention['title'] = $mentioned->fullname;
669                 }
670
671                 $mentions[] = $mention;
672             }
673         }
674
675         // @#tag => mention of all subscriptions tagged 'tag'
676
677         preg_match_all('/(?:^|[\s\.\,\:\;]+)@#([\pL\pN_\-\.]{1,64})/',
678                        $text,
679                        $hmatches,
680                        PREG_OFFSET_CAPTURE);
681
682         foreach ($hmatches[1] as $hmatch) {
683
684             $tag = common_canonical_tag($hmatch[0]);
685
686             $tagged = Profile_tag::getTagged($sender->id, $tag);
687
688             $url = common_local_url('subscriptions',
689                                     array('nickname' => $sender->nickname,
690                                           'tag' => $tag));
691
692             $mentions[] = array('mentioned' => $tagged,
693                                 'text' => $hmatch[0],
694                                 'position' => $hmatch[1],
695                                 'url' => $url);
696         }
697
698         Event::handle('EndFindMentions', array($sender, $text, &$mentions));
699     }
700
701     return $mentions;
702 }
703
704 function common_render_text($text)
705 {
706     $r = htmlspecialchars($text);
707
708     $r = preg_replace('/[\x{0}-\x{8}\x{b}-\x{c}\x{e}-\x{19}]/', '', $r);
709     $r = common_replace_urls_callback($r, 'common_linkify');
710     $r = preg_replace('/(^|\&quot\;|\'|\(|\[|\{|\s+)#([\pL\pN_\-\.]{1,64})/e', "'\\1#'.common_tag_link('\\2')", $r);
711     // XXX: machine tags
712     return $r;
713 }
714
715 function common_replace_urls_callback($text, $callback, $notice_id = null) {
716     // Start off with a regex
717     $regex = '#'.
718     '(?:^|[\s\<\>\(\)\[\]\{\}\\\'\\\";]+)(?![\@\!\#])'.
719     '('.
720         '(?:'.
721             '(?:'. //Known protocols
722                 '(?:'.
723                     '(?:(?:https?|ftps?|mms|rtsp|gopher|news|nntp|telnet|wais|file|prospero|webcal|irc)://)'.
724                     '|'.
725                     '(?:(?:mailto|aim|tel|xmpp):)'.
726                 ')'.
727                 '(?:[\pN\pL\-\_\+\%\~]+(?::[\pN\pL\-\_\+\%\~]+)?\@)?'. //user:pass@
728                 '(?:'.
729                     '(?:'.
730                         '\[[\pN\pL\-\_\:\.]+(?<![\.\:])\]'. //[dns]
731                     ')|(?:'.
732                         '[\pN\pL\-\_\:\.]+(?<![\.\:])'. //dns
733                     ')'.
734                 ')'.
735             ')'.
736             '|(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)'. //IPv4
737             '|(?:'. //IPv6
738                 '\[?(?:(?:(?:[0-9A-Fa-f]{1,4}:){7}(?:(?:[0-9A-Fa-f]{1,4})|:))|(?:(?:[0-9A-Fa-f]{1,4}:){6}(?::|(?:(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})(?:\.(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})){3})|(?::[0-9A-Fa-f]{1,4})))|(?:(?:[0-9A-Fa-f]{1,4}:){5}(?:(?::(?:(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})(?:\.(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})){3})?)|(?:(?::[0-9A-Fa-f]{1,4}){1,2})))|(?:(?:[0-9A-Fa-f]{1,4}:){4}(?::[0-9A-Fa-f]{1,4}){0,1}(?:(?::(?:(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})(?:\.(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})){3})?)|(?:(?::[0-9A-Fa-f]{1,4}){1,2})))|(?:(?:[0-9A-Fa-f]{1,4}:){3}(?::[0-9A-Fa-f]{1,4}){0,2}(?:(?::(?:(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})(?:\.(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})){3})?)|(?:(?::[0-9A-Fa-f]{1,4}){1,2})))|(?:(?:[0-9A-Fa-f]{1,4}:){2}(?::[0-9A-Fa-f]{1,4}){0,3}(?:(?::(?:(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})(?:\.(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})){3})?)|(?:(?::[0-9A-Fa-f]{1,4}){1,2})))|(?:(?:[0-9A-Fa-f]{1,4}:)(?::[0-9A-Fa-f]{1,4}){0,4}(?:(?::(?:(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})(?:\.(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})){3})?)|(?:(?::[0-9A-Fa-f]{1,4}){1,2})))|(?::(?::[0-9A-Fa-f]{1,4}){0,5}(?:(?::(?:(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})(?:\.(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})){3})?)|(?:(?::[0-9A-Fa-f]{1,4}){1,2})))|(?:(?:(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})(?:\.(?:25[0-5]|2[0-4]\d|[01]?\d{1,2})){3})))\]?(?<!:)'.
739             ')|(?:'. //DNS
740                 '(?:[\pN\pL\-\_\+\%\~]+(?:\:[\pN\pL\-\_\+\%\~]+)?\@)?'. //user:pass@
741                 '[\pN\pL\-\_]+(?:\.[\pN\pL\-\_]+)*\.'.
742                 //tld list from http://data.iana.org/TLD/tlds-alpha-by-domain.txt, also added local, loc, and onion
743                 '(?:AC|AD|AE|AERO|AF|AG|AI|AL|AM|AN|AO|AQ|AR|ARPA|AS|ASIA|AT|AU|AW|AX|AZ|BA|BB|BD|BE|BF|BG|BH|BI|BIZ|BJ|BM|BN|BO|BR|BS|BT|BV|BW|BY|BZ|CA|CAT|CC|CD|CF|CG|CH|CI|CK|CL|CM|CN|CO|COM|COOP|CR|CU|CV|CX|CY|CZ|DE|DJ|DK|DM|DO|DZ|EC|EDU|EE|EG|ER|ES|ET|EU|FI|FJ|FK|FM|FO|FR|GA|GB|GD|GE|GF|GG|GH|GI|GL|GM|GN|GOV|GP|GQ|GR|GS|GT|GU|GW|GY|HK|HM|HN|HR|HT|HU|ID|IE|IL|IM|IN|INFO|INT|IO|IQ|IR|IS|IT|JE|JM|JO|JOBS|JP|KE|KG|KH|KI|KM|KN|KP|KR|KW|KY|KZ|LA|LB|LC|LI|LK|LR|LS|LT|LU|LV|LY|MA|MC|MD|ME|MG|MH|MIL|MK|ML|MM|MN|MO|MOBI|MP|MQ|MR|MS|MT|MU|MUSEUM|MV|MW|MX|MY|MZ|NA|NAME|NC|NE|NET|NF|NG|NI|NL|NO|NP|NR|NU|NZ|OM|ORG|PA|PE|PF|PG|PH|PK|PL|PM|PN|PR|PRO|PS|PT|PW|PY|QA|RE|RO|RS|RU|RW|SA|SB|SC|SD|SE|SG|SH|SI|SJ|SK|SL|SM|SN|SO|SR|ST|SU|SV|SY|SZ|TC|TD|TEL|TF|TG|TH|TJ|TK|TL|TM|TN|TO|TP|TR|TRAVEL|TT|TV|TW|TZ|UA|UG|UK|US|UY|UZ|VA|VC|VE|VG|VI|VN|VU|WF|WS|XN--0ZWM56D|测试|XN--11B5BS3A9AJ6G|परीक्षा|XN--80AKHBYKNJ4F|испытание|XN--9T4B11YI5A|테스트|XN--DEBA0AD|טעסט|XN--G6W251D|測試|XN--HGBK6AJ7F53BBA|آزمایشی|XN--HLCJ6AYA9ESC7A|பரிட்சை|XN--JXALPDLP|δοκιμή|XN--KGBECHTV|إختبار|XN--ZCKZAH|テスト|YE|YT|YU|ZA|ZM|ZW|local|loc|onion)'.
744             ')(?![\pN\pL\-\_])'.
745         ')'.
746         '(?:'.
747             '(?:\:\d+)?'. //:port
748             '(?:/[\pN\pL$\,\!\(\)\.\:\-\_\+\/\=\&\;\%\~\*\$\+\'@]*)?'. // /path
749             '(?:\?[\pN\pL\$\,\!\(\)\.\:\-\_\+\/\=\&\;\%\~\*\$\+\'@\/]*)?'. // ?query string
750             '(?:\#[\pN\pL$\,\!\(\)\.\:\-\_\+\/\=\&\;\%\~\*\$\+\'\@/\?\#]*)?'. // #fragment
751         ')(?<![\?\.\,\#\,])'.
752     ')'.
753     '#ixu';
754     //preg_match_all($regex,$text,$matches);
755     //print_r($matches);
756     return preg_replace_callback($regex, curry('callback_helper',$callback,$notice_id) ,$text);
757 }
758
759 function callback_helper($matches, $callback, $notice_id) {
760     $url=$matches[1];
761     $left = strpos($matches[0],$url);
762     $right = $left+strlen($url);
763
764     $groupSymbolSets=array(
765         array(
766             'left'=>'(',
767             'right'=>')'
768         ),
769         array(
770             'left'=>'[',
771             'right'=>']'
772         ),
773         array(
774             'left'=>'{',
775             'right'=>'}'
776         ),
777         array(
778             'left'=>'<',
779             'right'=>'>'
780         )
781     );
782     $cannotEndWith=array('.','?',',','#');
783     $original_url=$url;
784     do{
785         $original_url=$url;
786         foreach($groupSymbolSets as $groupSymbolSet){
787             if(substr($url,-1)==$groupSymbolSet['right']){
788                 $group_left_count = substr_count($url,$groupSymbolSet['left']);
789                 $group_right_count = substr_count($url,$groupSymbolSet['right']);
790                 if($group_left_count<$group_right_count){
791                     $right-=1;
792                     $url=substr($url,0,-1);
793                 }
794             }
795         }
796         if(in_array(substr($url,-1),$cannotEndWith)){
797             $right-=1;
798             $url=substr($url,0,-1);
799         }
800     }while($original_url!=$url);
801
802     if(empty($notice_id)){
803         $result = call_user_func_array($callback, array($url));
804     }else{
805         $result = call_user_func_array($callback, array(array($url,$notice_id)) );
806     }
807     return substr($matches[0],0,$left) . $result . substr($matches[0],$right);
808 }
809
810 if (version_compare(PHP_VERSION, '5.3.0', 'ge')) {
811     // lambda implementation in a separate file; PHP 5.2 won't parse it.
812     require_once INSTALLDIR . "/lib/curry.php";
813 } else {
814     function curry($fn) {
815         $args = func_get_args();
816         array_shift($args);
817         $id = uniqid('_partial');
818         $GLOBALS[$id] = array($fn, $args);
819         return create_function('',
820                                '$args = func_get_args(); '.
821                                'return call_user_func_array('.
822                                '$GLOBALS["'.$id.'"][0],'.
823                                'array_merge('.
824                                '$args,'.
825                                '$GLOBALS["'.$id.'"][1]));');
826     }
827 }
828
829 function common_linkify($url) {
830     // It comes in special'd, so we unspecial it before passing to the stringifying
831     // functions
832     $url = htmlspecialchars_decode($url);
833
834    if(strpos($url, '@') !== false && strpos($url, ':') === false) {
835        //url is an email address without the mailto: protocol
836        $canon = "mailto:$url";
837        $longurl = "mailto:$url";
838    }else{
839
840         $canon = File_redirection::_canonUrl($url);
841
842         $longurl_data = File_redirection::where($canon);
843         if (is_array($longurl_data)) {
844             $longurl = $longurl_data['url'];
845         } elseif (is_string($longurl_data)) {
846             $longurl = $longurl_data;
847         } else {
848             // Unable to reach the server to verify contents, etc
849             // Just pass the link on through for now.
850             common_log(LOG_ERR, "Can't linkify url '$url'");
851             $longurl = $url;
852         }
853     }
854     $attrs = array('href' => $canon, 'title' => $longurl, 'rel' => 'external');
855
856     $is_attachment = false;
857     $attachment_id = null;
858     $has_thumb = false;
859
860     // Check to see whether this is a known "attachment" URL.
861
862     $f = File::staticGet('url', $longurl);
863
864     if (empty($f)) {
865         // XXX: this writes to the database. :<
866         $f = File::processNew($longurl);
867     }
868
869     if (!empty($f)) {
870         if ($f->getEnclosure() || File_oembed::staticGet('file_id',$f->id)) {
871             $is_attachment = true;
872             $attachment_id = $f->id;
873
874             $thumb = File_thumbnail::staticGet('file_id', $f->id);
875             if (!empty($thumb)) {
876                 $has_thumb = true;
877             }
878         }
879     }
880
881     // Add clippy
882     if ($is_attachment) {
883         $attrs['class'] = 'attachment';
884         if ($has_thumb) {
885             $attrs['class'] = 'attachment thumbnail';
886         }
887         $attrs['id'] = "attachment-{$attachment_id}";
888     }
889
890     return XMLStringer::estring('a', $attrs, $url);
891 }
892
893 function common_shorten_links($text, $always = false)
894 {
895     common_debug("common_shorten_links() called");
896
897     $user = common_current_user();
898
899     $maxLength = User_urlshortener_prefs::maxNoticeLength($user);
900
901     common_debug("maxLength = $maxLength");
902
903     if ($always || mb_strlen($text) > $maxLength) {
904         common_debug("Forcing shortening");
905         return common_replace_urls_callback($text, array('File_redirection', 'forceShort'));
906     } else {
907         common_debug("Not forcing shortening");
908         return common_replace_urls_callback($text, array('File_redirection', 'makeShort'));
909     }
910 }
911
912 function common_xml_safe_str($str)
913 {
914     // Replace common eol and extra whitespace input chars
915     $unWelcome = array(
916         "\t",  // tab
917         "\n",  // newline
918         "\r",  // cr
919         "\0",  // null byte eos
920         "\x0B" // vertical tab
921     );
922
923     $replacement = array(
924         ' ', // single space
925         ' ',
926         '',  // nothing
927         '',
928         ' '
929     );
930
931     $str = str_replace($unWelcome, $replacement, $str);
932
933     // Neutralize any additional control codes and UTF-16 surrogates
934     // (Twitter uses '*')
935     return preg_replace('/[\p{Cc}\p{Cs}]/u', '*', $str);
936 }
937
938 function common_tag_link($tag)
939 {
940     $canonical = common_canonical_tag($tag);
941     if (common_config('singleuser', 'enabled')) {
942         // regular TagAction isn't set up in 1user mode
943         $url = common_local_url('showstream',
944                                 array('nickname' => common_config('singleuser', 'nickname'),
945                                       'tag' => $canonical));
946     } else {
947         $url = common_local_url('tag', array('tag' => $canonical));
948     }
949     $xs = new XMLStringer();
950     $xs->elementStart('span', 'tag');
951     $xs->element('a', array('href' => $url,
952                             'rel' => 'tag'),
953                  $tag);
954     $xs->elementEnd('span');
955     return $xs->getString();
956 }
957
958 function common_canonical_tag($tag)
959 {
960   $tag = mb_convert_case($tag, MB_CASE_LOWER, "UTF-8");
961   return str_replace(array('-', '_', '.'), '', $tag);
962 }
963
964 function common_valid_profile_tag($str)
965 {
966     return preg_match('/^[A-Za-z0-9_\-\.]{1,64}$/', $str);
967 }
968
969 function common_group_link($sender_id, $nickname)
970 {
971     $sender = Profile::staticGet($sender_id);
972     $group = User_group::getForNickname($nickname, $sender);
973     if ($sender && $group && $sender->isMember($group)) {
974         $attrs = array('href' => $group->permalink(),
975                        'class' => 'url');
976         if (!empty($group->fullname)) {
977             $attrs['title'] = $group->fullname . ' (' . $group->nickname . ')';
978         }
979         $xs = new XMLStringer();
980         $xs->elementStart('span', 'vcard');
981         $xs->elementStart('a', $attrs);
982         $xs->element('span', 'fn nickname', $nickname);
983         $xs->elementEnd('a');
984         $xs->elementEnd('span');
985         return $xs->getString();
986     } else {
987         return $nickname;
988     }
989 }
990
991 function common_relative_profile($sender, $nickname, $dt=null)
992 {
993     // Try to find profiles this profile is subscribed to that have this nickname
994     $recipient = new Profile();
995     // XXX: use a join instead of a subquery
996     $recipient->whereAdd('EXISTS (SELECT subscribed from subscription where subscriber = '.$sender->id.' and subscribed = id)', 'AND');
997     $recipient->whereAdd("nickname = '" . trim($nickname) . "'", 'AND');
998     if ($recipient->find(true)) {
999         // XXX: should probably differentiate between profiles with
1000         // the same name by date of most recent update
1001         return $recipient;
1002     }
1003     // Try to find profiles that listen to this profile and that have this nickname
1004     $recipient = new Profile();
1005     // XXX: use a join instead of a subquery
1006     $recipient->whereAdd('EXISTS (SELECT subscriber from subscription where subscribed = '.$sender->id.' and subscriber = id)', 'AND');
1007     $recipient->whereAdd("nickname = '" . trim($nickname) . "'", 'AND');
1008     if ($recipient->find(true)) {
1009         // XXX: should probably differentiate between profiles with
1010         // the same name by date of most recent update
1011         return $recipient;
1012     }
1013     // If this is a local user, try to find a local user with that nickname.
1014     $sender = User::staticGet($sender->id);
1015     if ($sender) {
1016         $recipient_user = User::staticGet('nickname', $nickname);
1017         if ($recipient_user) {
1018             return $recipient_user->getProfile();
1019         }
1020     }
1021     // Otherwise, no links. @messages from local users to remote users,
1022     // or from remote users to other remote users, are just
1023     // outside our ability to make intelligent guesses about
1024     return null;
1025 }
1026
1027 function common_local_url($action, $args=null, $params=null, $fragment=null, $addSession=true)
1028 {
1029     $r = Router::get();
1030     $path = $r->build($action, $args, $params, $fragment);
1031
1032     $ssl = common_is_sensitive($action);
1033
1034     if (common_config('site','fancy')) {
1035         $url = common_path(mb_substr($path, 1), $ssl, $addSession);
1036     } else {
1037         if (mb_strpos($path, '/index.php') === 0) {
1038             $url = common_path(mb_substr($path, 1), $ssl, $addSession);
1039         } else {
1040             $url = common_path('index.php'.$path, $ssl, $addSession);
1041         }
1042     }
1043     return $url;
1044 }
1045
1046 function common_is_sensitive($action)
1047 {
1048     static $sensitive = array('login', 'register', 'passwordsettings',
1049                               'twittersettings', 'api');
1050     $ssl = null;
1051
1052     if (Event::handle('SensitiveAction', array($action, &$ssl))) {
1053         $ssl = in_array($action, $sensitive);
1054     }
1055
1056     return $ssl;
1057 }
1058
1059 function common_path($relative, $ssl=false, $addSession=true)
1060 {
1061     $pathpart = (common_config('site', 'path')) ? common_config('site', 'path')."/" : '';
1062
1063     if (($ssl && (common_config('site', 'ssl') === 'sometimes'))
1064         || common_config('site', 'ssl') === 'always') {
1065         $proto = 'https';
1066         if (is_string(common_config('site', 'sslserver')) &&
1067             mb_strlen(common_config('site', 'sslserver')) > 0) {
1068             $serverpart = common_config('site', 'sslserver');
1069         } else if (common_config('site', 'server')) {
1070             $serverpart = common_config('site', 'server');
1071         } else {
1072             common_log(LOG_ERR, 'Site server not configured, unable to determine site name.');
1073         }
1074     } else {
1075         $proto = 'http';
1076         if (common_config('site', 'server')) {
1077             $serverpart = common_config('site', 'server');
1078         } else {
1079             common_log(LOG_ERR, 'Site server not configured, unable to determine site name.');
1080         }
1081     }
1082
1083     if ($addSession) {
1084         $relative = common_inject_session($relative, $serverpart);
1085     }
1086
1087     return $proto.'://'.$serverpart.'/'.$pathpart.$relative;
1088 }
1089
1090 function common_inject_session($url, $serverpart = null)
1091 {
1092     if (common_have_session()) {
1093
1094         if (empty($serverpart)) {
1095             $serverpart = parse_url($url, PHP_URL_HOST);
1096         }
1097
1098         $currentServer = $_SERVER['HTTP_HOST'];
1099
1100         // Are we pointing to another server (like an SSL server?)
1101
1102         if (!empty($currentServer) &&
1103             0 != strcasecmp($currentServer, $serverpart)) {
1104             // Pass the session ID as a GET parameter
1105             $sesspart = session_name() . '=' . session_id();
1106             $i = strpos($url, '?');
1107             if ($i === false) { // no GET params, just append
1108                 $url .= '?' . $sesspart;
1109             } else {
1110                 $url = substr($url, 0, $i + 1).$sesspart.'&'.substr($url, $i + 1);
1111             }
1112         }
1113     }
1114
1115     return $url;
1116 }
1117
1118 function common_date_string($dt)
1119 {
1120     // XXX: do some sexy date formatting
1121     // return date(DATE_RFC822, $dt);
1122     $t = strtotime($dt);
1123     $now = time();
1124     $diff = $now - $t;
1125
1126     if ($now < $t) { // that shouldn't happen!
1127         return common_exact_date($dt);
1128     } else if ($diff < 60) {
1129         // TRANS: Used in notices to indicate when the notice was made compared to now.
1130         return _('a few seconds ago');
1131     } else if ($diff < 92) {
1132         // TRANS: Used in notices to indicate when the notice was made compared to now.
1133         return _('about a minute ago');
1134     } else if ($diff < 3300) {
1135         // XXX: should support plural.
1136         // TRANS: Used in notices to indicate when the notice was made compared to now.
1137         return sprintf(_('about %d minutes ago'), round($diff/60));
1138     } else if ($diff < 5400) {
1139         // TRANS: Used in notices to indicate when the notice was made compared to now.
1140         return _('about an hour ago');
1141     } else if ($diff < 22 * 3600) {
1142         // XXX: should support plural.
1143         // TRANS: Used in notices to indicate when the notice was made compared to now.
1144         return sprintf(_('about %d hours ago'), round($diff/3600));
1145     } else if ($diff < 37 * 3600) {
1146         // TRANS: Used in notices to indicate when the notice was made compared to now.
1147         return _('about a day ago');
1148     } else if ($diff < 24 * 24 * 3600) {
1149         // XXX: should support plural.
1150         // TRANS: Used in notices to indicate when the notice was made compared to now.
1151         return sprintf(_('about %d days ago'), round($diff/(24*3600)));
1152     } else if ($diff < 46 * 24 * 3600) {
1153         // TRANS: Used in notices to indicate when the notice was made compared to now.
1154         return _('about a month ago');
1155     } else if ($diff < 330 * 24 * 3600) {
1156         // XXX: should support plural.
1157         // TRANS: Used in notices to indicate when the notice was made compared to now.
1158         return sprintf(_('about %d months ago'), round($diff/(30*24*3600)));
1159     } else if ($diff < 480 * 24 * 3600) {
1160         // TRANS: Used in notices to indicate when the notice was made compared to now.
1161         return _('about a year ago');
1162     } else {
1163         return common_exact_date($dt);
1164     }
1165 }
1166
1167 function common_exact_date($dt)
1168 {
1169     static $_utc;
1170     static $_siteTz;
1171
1172     if (!$_utc) {
1173         $_utc = new DateTimeZone('UTC');
1174         $_siteTz = new DateTimeZone(common_timezone());
1175     }
1176
1177     $dateStr = date('d F Y H:i:s', strtotime($dt));
1178     $d = new DateTime($dateStr, $_utc);
1179     $d->setTimezone($_siteTz);
1180     return $d->format(DATE_RFC850);
1181 }
1182
1183 function common_date_w3dtf($dt)
1184 {
1185     $dateStr = date('d F Y H:i:s', strtotime($dt));
1186     $d = new DateTime($dateStr, new DateTimeZone('UTC'));
1187     $d->setTimezone(new DateTimeZone(common_timezone()));
1188     return $d->format(DATE_W3C);
1189 }
1190
1191 function common_date_rfc2822($dt)
1192 {
1193     $dateStr = date('d F Y H:i:s', strtotime($dt));
1194     $d = new DateTime($dateStr, new DateTimeZone('UTC'));
1195     $d->setTimezone(new DateTimeZone(common_timezone()));
1196     return $d->format('r');
1197 }
1198
1199 function common_date_iso8601($dt)
1200 {
1201     $dateStr = date('d F Y H:i:s', strtotime($dt));
1202     $d = new DateTime($dateStr, new DateTimeZone('UTC'));
1203     $d->setTimezone(new DateTimeZone(common_timezone()));
1204     return $d->format('c');
1205 }
1206
1207 function common_sql_now()
1208 {
1209     return common_sql_date(time());
1210 }
1211
1212 function common_sql_date($datetime)
1213 {
1214     return strftime('%Y-%m-%d %H:%M:%S', $datetime);
1215 }
1216
1217 /**
1218  * Return an SQL fragment to calculate an age-based weight from a given
1219  * timestamp or datetime column.
1220  *
1221  * @param string $column name of field we're comparing against current time
1222  * @param integer $dropoff divisor for age in seconds before exponentiation
1223  * @return string SQL fragment
1224  */
1225 function common_sql_weight($column, $dropoff)
1226 {
1227     if (common_config('db', 'type') == 'pgsql') {
1228         // PostgreSQL doesn't support timestampdiff function.
1229         // @fixme will this use the right time zone?
1230         // @fixme does this handle cross-year subtraction correctly?
1231         return "sum(exp(-extract(epoch from (now() - $column)) / $dropoff))";
1232     } else {
1233         return "sum(exp(timestampdiff(second, utc_timestamp(), $column) / $dropoff))";
1234     }
1235 }
1236
1237 function common_redirect($url, $code=307)
1238 {
1239     static $status = array(301 => "Moved Permanently",
1240                            302 => "Found",
1241                            303 => "See Other",
1242                            307 => "Temporary Redirect");
1243
1244     header('HTTP/1.1 '.$code.' '.$status[$code]);
1245     header("Location: $url");
1246
1247     $xo = new XMLOutputter();
1248     $xo->startXML('a',
1249                   '-//W3C//DTD XHTML 1.0 Strict//EN',
1250                   'http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd');
1251     $xo->element('a', array('href' => $url), $url);
1252     $xo->endXML();
1253     exit;
1254 }
1255
1256 function common_broadcast_notice($notice, $remote=false)
1257 {
1258     // DO NOTHING!
1259 }
1260
1261 // Stick the notice on the queue
1262
1263 function common_enqueue_notice($notice)
1264 {
1265     static $localTransports = array('omb',
1266                                     'ping');
1267
1268     $transports = array();
1269     if (common_config('sms', 'enabled')) {
1270         $transports[] = 'sms';
1271     }
1272     if (Event::hasHandler('HandleQueuedNotice')) {
1273         $transports[] = 'plugin';
1274     }
1275
1276     // We can skip these for gatewayed notices.
1277     if ($notice->isLocal()) {
1278         $transports = array_merge($transports, $localTransports);
1279     }
1280
1281     if (Event::handle('StartEnqueueNotice', array($notice, &$transports))) {
1282
1283         $qm = QueueManager::get();
1284
1285         foreach ($transports as $transport)
1286         {
1287             $qm->enqueue($notice, $transport);
1288         }
1289
1290         Event::handle('EndEnqueueNotice', array($notice, $transports));
1291     }
1292
1293     return true;
1294 }
1295
1296 /**
1297  * Broadcast profile updates to OMB and other remote subscribers.
1298  *
1299  * Since this may be slow with a lot of subscribers or bad remote sites,
1300  * this is run through the background queues if possible.
1301  */
1302 function common_broadcast_profile(Profile $profile)
1303 {
1304     $qm = QueueManager::get();
1305     $qm->enqueue($profile, "profile");
1306     return true;
1307 }
1308
1309 function common_profile_url($nickname)
1310 {
1311     return common_local_url('showstream', array('nickname' => $nickname),
1312                             null, null, false);
1313 }
1314
1315 // Should make up a reasonable root URL
1316
1317 function common_root_url($ssl=false)
1318 {
1319     $url = common_path('', $ssl, false);
1320     $i = strpos($url, '?');
1321     if ($i !== false) {
1322         $url = substr($url, 0, $i);
1323     }
1324     return $url;
1325 }
1326
1327 // returns $bytes bytes of random data as a hexadecimal string
1328 // "good" here is a goal and not a guarantee
1329
1330 function common_good_rand($bytes)
1331 {
1332     // XXX: use random.org...?
1333     if (@file_exists('/dev/urandom')) {
1334         return common_urandom($bytes);
1335     } else { // FIXME: this is probably not good enough
1336         return common_mtrand($bytes);
1337     }
1338 }
1339
1340 function common_urandom($bytes)
1341 {
1342     $h = fopen('/dev/urandom', 'rb');
1343     // should not block
1344     $src = fread($h, $bytes);
1345     fclose($h);
1346     $enc = '';
1347     for ($i = 0; $i < $bytes; $i++) {
1348         $enc .= sprintf("%02x", (ord($src[$i])));
1349     }
1350     return $enc;
1351 }
1352
1353 function common_mtrand($bytes)
1354 {
1355     $enc = '';
1356     for ($i = 0; $i < $bytes; $i++) {
1357         $enc .= sprintf("%02x", mt_rand(0, 255));
1358     }
1359     return $enc;
1360 }
1361
1362 /**
1363  * Record the given URL as the return destination for a future
1364  * form submission, to be read by common_get_returnto().
1365  * 
1366  * @param string $url
1367  * 
1368  * @fixme as a session-global setting, this can allow multiple forms
1369  * to conflict and overwrite each others' returnto destinations if
1370  * the user has multiple tabs or windows open.
1371  * 
1372  * Should refactor to index with a token or otherwise only pass the
1373  * data along its intended path.
1374  */
1375 function common_set_returnto($url)
1376 {
1377     common_ensure_session();
1378     $_SESSION['returnto'] = $url;
1379 }
1380
1381 /**
1382  * Fetch a return-destination URL previously recorded by
1383  * common_set_returnto().
1384  * 
1385  * @return mixed URL string or null
1386  * 
1387  * @fixme as a session-global setting, this can allow multiple forms
1388  * to conflict and overwrite each others' returnto destinations if
1389  * the user has multiple tabs or windows open.
1390  * 
1391  * Should refactor to index with a token or otherwise only pass the
1392  * data along its intended path.
1393  */
1394 function common_get_returnto()
1395 {
1396     common_ensure_session();
1397     return (array_key_exists('returnto', $_SESSION)) ? $_SESSION['returnto'] : null;
1398 }
1399
1400 function common_timestamp()
1401 {
1402     return date('YmdHis');
1403 }
1404
1405 function common_ensure_syslog()
1406 {
1407     static $initialized = false;
1408     if (!$initialized) {
1409         openlog(common_config('syslog', 'appname'), 0,
1410             common_config('syslog', 'facility'));
1411         $initialized = true;
1412     }
1413 }
1414
1415 function common_log_line($priority, $msg)
1416 {
1417     static $syslog_priorities = array('LOG_EMERG', 'LOG_ALERT', 'LOG_CRIT', 'LOG_ERR',
1418                                       'LOG_WARNING', 'LOG_NOTICE', 'LOG_INFO', 'LOG_DEBUG');
1419     return date('Y-m-d H:i:s') . ' ' . $syslog_priorities[$priority] . ': ' . $msg . PHP_EOL;
1420 }
1421
1422 function common_request_id()
1423 {
1424     $pid = getmypid();
1425     $server = common_config('site', 'server');
1426     if (php_sapi_name() == 'cli') {
1427         $script = basename($_SERVER['PHP_SELF']);
1428         return "$server:$script:$pid";
1429     } else {
1430         static $req_id = null;
1431         if (!isset($req_id)) {
1432             $req_id = substr(md5(mt_rand()), 0, 8);
1433         }
1434         if (isset($_SERVER['REQUEST_URI'])) {
1435             $url = $_SERVER['REQUEST_URI'];
1436         }
1437         $method = $_SERVER['REQUEST_METHOD'];
1438         return "$server:$pid.$req_id $method $url";
1439     }
1440 }
1441
1442 function common_log($priority, $msg, $filename=null)
1443 {
1444     if(Event::handle('StartLog', array(&$priority, &$msg, &$filename))){
1445         $msg = '[' . common_request_id() . '] ' . $msg;
1446         $logfile = common_config('site', 'logfile');
1447         if ($logfile) {
1448             $log = fopen($logfile, "a");
1449             if ($log) {
1450                 $output = common_log_line($priority, $msg);
1451                 fwrite($log, $output);
1452                 fclose($log);
1453             }
1454         } else {
1455             common_ensure_syslog();
1456             syslog($priority, $msg);
1457         }
1458         Event::handle('EndLog', array($priority, $msg, $filename));
1459     }
1460 }
1461
1462 function common_debug($msg, $filename=null)
1463 {
1464     if ($filename) {
1465         common_log(LOG_DEBUG, basename($filename).' - '.$msg);
1466     } else {
1467         common_log(LOG_DEBUG, $msg);
1468     }
1469 }
1470
1471 function common_log_db_error(&$object, $verb, $filename=null)
1472 {
1473     $objstr = common_log_objstring($object);
1474     $last_error = &PEAR::getStaticProperty('DB_DataObject','lastError');
1475     common_log(LOG_ERR, $last_error->message . '(' . $verb . ' on ' . $objstr . ')', $filename);
1476 }
1477
1478 function common_log_objstring(&$object)
1479 {
1480     if (is_null($object)) {
1481         return "null";
1482     }
1483     if (!($object instanceof DB_DataObject)) {
1484         return "(unknown)";
1485     }
1486     $arr = $object->toArray();
1487     $fields = array();
1488     foreach ($arr as $k => $v) {
1489         if (is_object($v)) {
1490             $fields[] = "$k='".get_class($v)."'";
1491         } else {
1492             $fields[] = "$k='$v'";
1493         }
1494     }
1495     $objstring = $object->tableName() . '[' . implode(',', $fields) . ']';
1496     return $objstring;
1497 }
1498
1499 function common_valid_http_url($url)
1500 {
1501     return Validate::uri($url, array('allowed_schemes' => array('http', 'https')));
1502 }
1503
1504 function common_valid_tag($tag)
1505 {
1506     if (preg_match('/^tag:(.*?),(\d{4}(-\d{2}(-\d{2})?)?):(.*)$/', $tag, $matches)) {
1507         return (Validate::email($matches[1]) ||
1508                 preg_match('/^([\w-\.]+)$/', $matches[1]));
1509     }
1510     return false;
1511 }
1512
1513 /**
1514  * Determine if given domain or address literal is valid
1515  * eg for use in JIDs and URLs. Does not check if the domain
1516  * exists!
1517  *
1518  * @param string $domain
1519  * @return boolean valid or not
1520  */
1521 function common_valid_domain($domain)
1522 {
1523     $octet = "(?:25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9][0-9]|[0-9])";
1524     $ipv4 = "(?:$octet(?:\.$octet){3})";
1525     if (preg_match("/^$ipv4$/u", $domain)) return true;
1526
1527     $group = "(?:[0-9a-f]{1,4})";
1528     $ipv6 = "(?:\[($group(?::$group){0,7})?(::)?($group(?::$group){0,7})?\])"; // http://tools.ietf.org/html/rfc3513#section-2.2
1529
1530     if (preg_match("/^$ipv6$/ui", $domain, $matches)) {
1531         $before = explode(":", $matches[1]);
1532         $zeroes = $matches[2];
1533         $after = explode(":", $matches[3]);
1534         if ($zeroes) {
1535             $min = 0;
1536             $max = 7;
1537         } else {
1538             $min = 1;
1539             $max = 8;
1540         }
1541         $explicit = count($before) + count($after);
1542         if ($explicit < $min || $explicit > $max) {
1543             return false;
1544         }
1545         return true;
1546     }
1547
1548     try {
1549         require_once "Net/IDNA.php";
1550         $idn = Net_IDNA::getInstance();
1551         $domain = $idn->encode($domain);
1552     } catch (Exception $e) {
1553         return false;
1554     }
1555
1556     $subdomain = "(?:[a-z0-9][a-z0-9-]*)"; // @fixme
1557     $fqdn = "(?:$subdomain(?:\.$subdomain)*\.?)";
1558
1559     return preg_match("/^$fqdn$/ui", $domain);
1560 }
1561
1562 /* Following functions are copied from MediaWiki GlobalFunctions.php
1563  * and written by Evan Prodromou. */
1564
1565 function common_accept_to_prefs($accept, $def = '*/*')
1566 {
1567     // No arg means accept anything (per HTTP spec)
1568     if(!$accept) {
1569         return array($def => 1);
1570     }
1571
1572     $prefs = array();
1573
1574     $parts = explode(',', $accept);
1575
1576     foreach($parts as $part) {
1577         // FIXME: doesn't deal with params like 'text/html; level=1'
1578         @list($value, $qpart) = explode(';', trim($part));
1579         $match = array();
1580         if(!isset($qpart)) {
1581             $prefs[$value] = 1;
1582         } elseif(preg_match('/q\s*=\s*(\d*\.\d+)/', $qpart, $match)) {
1583             $prefs[$value] = $match[1];
1584         }
1585     }
1586
1587     return $prefs;
1588 }
1589
1590 function common_mime_type_match($type, $avail)
1591 {
1592     if(array_key_exists($type, $avail)) {
1593         return $type;
1594     } else {
1595         $parts = explode('/', $type);
1596         if(array_key_exists($parts[0] . '/*', $avail)) {
1597             return $parts[0] . '/*';
1598         } elseif(array_key_exists('*/*', $avail)) {
1599             return '*/*';
1600         } else {
1601             return null;
1602         }
1603     }
1604 }
1605
1606 function common_negotiate_type($cprefs, $sprefs)
1607 {
1608     $combine = array();
1609
1610     foreach(array_keys($sprefs) as $type) {
1611         $parts = explode('/', $type);
1612         if($parts[1] != '*') {
1613             $ckey = common_mime_type_match($type, $cprefs);
1614             if($ckey) {
1615                 $combine[$type] = $sprefs[$type] * $cprefs[$ckey];
1616             }
1617         }
1618     }
1619
1620     foreach(array_keys($cprefs) as $type) {
1621         $parts = explode('/', $type);
1622         if($parts[1] != '*' && !array_key_exists($type, $sprefs)) {
1623             $skey = common_mime_type_match($type, $sprefs);
1624             if($skey) {
1625                 $combine[$type] = $sprefs[$skey] * $cprefs[$type];
1626             }
1627         }
1628     }
1629
1630     $bestq = 0;
1631     $besttype = 'text/html';
1632
1633     foreach(array_keys($combine) as $type) {
1634         if($combine[$type] > $bestq) {
1635             $besttype = $type;
1636             $bestq = $combine[$type];
1637         }
1638     }
1639
1640     if ('text/html' === $besttype) {
1641         return "text/html; charset=utf-8";
1642     }
1643     return $besttype;
1644 }
1645
1646 function common_config($main, $sub)
1647 {
1648     global $config;
1649     return (array_key_exists($main, $config) &&
1650             array_key_exists($sub, $config[$main])) ? $config[$main][$sub] : false;
1651 }
1652
1653 function common_copy_args($from)
1654 {
1655     $to = array();
1656     $strip = get_magic_quotes_gpc();
1657     foreach ($from as $k => $v) {
1658         if($strip) {
1659             if(is_array($v)) {
1660                 $to[$k] = common_copy_args($v);
1661             } else {
1662                 $to[$k] = stripslashes($v);
1663             }
1664         } else {
1665             $to[$k] = $v;
1666         }
1667     }
1668     return $to;
1669 }
1670
1671 /**
1672  * Neutralise the evil effects of magic_quotes_gpc in the current request.
1673  * This is used before handing a request off to OAuthRequest::from_request.
1674  * @fixme Doesn't consider vars other than _POST and _GET?
1675  * @fixme Can't be undone and could corrupt data if run twice.
1676  */
1677 function common_remove_magic_from_request()
1678 {
1679     if(get_magic_quotes_gpc()) {
1680         $_POST=array_map('stripslashes',$_POST);
1681         $_GET=array_map('stripslashes',$_GET);
1682     }
1683 }
1684
1685 function common_user_uri(&$user)
1686 {
1687     return common_local_url('userbyid', array('id' => $user->id),
1688                             null, null, false);
1689 }
1690
1691 function common_notice_uri(&$notice)
1692 {
1693     return common_local_url('shownotice',
1694                             array('notice' => $notice->id),
1695                             null, null, false);
1696 }
1697
1698 // 36 alphanums - lookalikes (0, O, 1, I) = 32 chars = 5 bits
1699
1700 function common_confirmation_code($bits)
1701 {
1702     // 36 alphanums - lookalikes (0, O, 1, I) = 32 chars = 5 bits
1703     static $codechars = '23456789ABCDEFGHJKLMNPQRSTUVWXYZ';
1704     $chars = ceil($bits/5);
1705     $code = '';
1706     for ($i = 0; $i < $chars; $i++) {
1707         // XXX: convert to string and back
1708         $num = hexdec(common_good_rand(1));
1709         // XXX: randomness is too precious to throw away almost
1710         // 40% of the bits we get!
1711         $code .= $codechars[$num%32];
1712     }
1713     return $code;
1714 }
1715
1716 // convert markup to HTML
1717
1718 function common_markup_to_html($c)
1719 {
1720     $c = preg_replace('/%%action.(\w+)%%/e', "common_local_url('\\1')", $c);
1721     $c = preg_replace('/%%doc.(\w+)%%/e', "common_local_url('doc', array('title'=>'\\1'))", $c);
1722     $c = preg_replace('/%%(\w+).(\w+)%%/e', 'common_config(\'\\1\', \'\\2\')', $c);
1723     return Markdown($c);
1724 }
1725
1726 function common_profile_uri($profile)
1727 {
1728     if (!$profile) {
1729         return null;
1730     }
1731     $user = User::staticGet($profile->id);
1732     if ($user) {
1733         return $user->uri;
1734     }
1735
1736     $remote = Remote_profile::staticGet($profile->id);
1737     if ($remote) {
1738         return $remote->uri;
1739     }
1740     // XXX: this is a very bad profile!
1741     return null;
1742 }
1743
1744 function common_canonical_sms($sms)
1745 {
1746     // strip non-digits
1747     preg_replace('/\D/', '', $sms);
1748     return $sms;
1749 }
1750
1751 function common_error_handler($errno, $errstr, $errfile, $errline, $errcontext)
1752 {
1753     switch ($errno) {
1754
1755      case E_ERROR:
1756      case E_COMPILE_ERROR:
1757      case E_CORE_ERROR:
1758      case E_USER_ERROR:
1759      case E_PARSE:
1760      case E_RECOVERABLE_ERROR:
1761         common_log(LOG_ERR, "[$errno] $errstr ($errfile:$errline) [ABORT]");
1762         die();
1763         break;
1764
1765      case E_WARNING:
1766      case E_COMPILE_WARNING:
1767      case E_CORE_WARNING:
1768      case E_USER_WARNING:
1769         common_log(LOG_WARNING, "[$errno] $errstr ($errfile:$errline)");
1770         break;
1771
1772      case E_NOTICE:
1773      case E_USER_NOTICE:
1774         common_log(LOG_NOTICE, "[$errno] $errstr ($errfile:$errline)");
1775         break;
1776
1777      case E_STRICT:
1778      case E_DEPRECATED:
1779      case E_USER_DEPRECATED:
1780         // XXX: config variable to log this stuff, too
1781         break;
1782
1783      default:
1784         common_log(LOG_ERR, "[$errno] $errstr ($errfile:$errline) [UNKNOWN LEVEL, die()'ing]");
1785         die();
1786         break;
1787     }
1788
1789     // FIXME: show error page if we're on the Web
1790     /* Don't execute PHP internal error handler */
1791     return true;
1792 }
1793
1794 function common_session_token()
1795 {
1796     common_ensure_session();
1797     if (!array_key_exists('token', $_SESSION)) {
1798         $_SESSION['token'] = common_good_rand(64);
1799     }
1800     return $_SESSION['token'];
1801 }
1802
1803 function common_cache_key($extra)
1804 {
1805     return Cache::key($extra);
1806 }
1807
1808 function common_keyize($str)
1809 {
1810     return Cache::keyize($str);
1811 }
1812
1813 function common_memcache()
1814 {
1815     return Cache::instance();
1816 }
1817
1818 function common_license_terms($uri)
1819 {
1820     if(preg_match('/creativecommons.org\/licenses\/([^\/]+)/', $uri, $matches)) {
1821         return explode('-',$matches[1]);
1822     }
1823     return array($uri);
1824 }
1825
1826 function common_compatible_license($from, $to)
1827 {
1828     $from_terms = common_license_terms($from);
1829     // public domain and cc-by are compatible with everything
1830     if(count($from_terms) == 1 && ($from_terms[0] == 'publicdomain' || $from_terms[0] == 'by')) {
1831         return true;
1832     }
1833     $to_terms = common_license_terms($to);
1834     // sa is compatible across versions. IANAL
1835     if(in_array('sa',$from_terms) || in_array('sa',$to_terms)) {
1836         return count(array_diff($from_terms, $to_terms)) == 0;
1837     }
1838     // XXX: better compatibility check needed here!
1839     // Should at least normalise URIs
1840     return ($from == $to);
1841 }
1842
1843 /**
1844  * returns a quoted table name, if required according to config
1845  */
1846 function common_database_tablename($tablename)
1847 {
1848
1849   if(common_config('db','quote_identifiers')) {
1850       $tablename = '"'. $tablename .'"';
1851   }
1852   //table prefixes could be added here later
1853   return $tablename;
1854 }
1855
1856 /**
1857  * Shorten a URL with the current user's configured shortening service,
1858  * or ur1.ca if configured, or not at all if no shortening is set up.
1859  *
1860  * @param string  $long_url original URL
1861  * @param boolean $force    Force shortening (used when notice is too long)
1862  *
1863  * @return string may return the original URL if shortening failed
1864  *
1865  * @fixme provide a way to specify a particular shortener
1866  * @fixme provide a way to specify to use a given user's shortening preferences
1867  */
1868
1869 function common_shorten_url($long_url, $force = false)
1870 {
1871     common_debug("Shortening URL '$long_url' (force = $force)");
1872
1873     $long_url = trim($long_url);
1874
1875     $user = common_current_user();
1876
1877     $maxUrlLength = User_urlshortener_prefs::maxUrlLength($user);
1878     common_debug("maxUrlLength = $maxUrlLength");
1879
1880     // $force forces shortening even if it's not strictly needed
1881
1882     if (mb_strlen($long_url) < $maxUrlLength && !$force) {
1883         common_debug("Skipped shortening URL.");
1884         return $long_url;
1885     }
1886
1887     $shortenerName = User_urlshortener_prefs::urlShorteningService($user);
1888
1889     common_debug("Shortener name = '$shortenerName'");
1890
1891     if (Event::handle('StartShortenUrl', array($long_url, $shortenerName, &$shortenedUrl))) {
1892         //URL wasn't shortened, so return the long url
1893         return $long_url;
1894     } else {
1895         //URL was shortened, so return the result
1896         return trim($shortenedUrl);
1897     }
1898 }
1899
1900 /**
1901  * @return mixed array($proxy, $ip) for web requests; proxy may be null
1902  *               null if not a web request
1903  *
1904  * @fixme X-Forwarded-For can be chained by multiple proxies;
1905           we should parse the list and provide a cleaner array
1906  * @fixme X-Forwarded-For can be forged by clients; only use them if trusted
1907  * @fixme X_Forwarded_For headers will override X-Forwarded-For read through $_SERVER;
1908  *        use function to get exact request headers from Apache if possible.
1909  */
1910 function common_client_ip()
1911 {
1912     if (!isset($_SERVER) || !array_key_exists('REQUEST_METHOD', $_SERVER)) {
1913         return null;
1914     }
1915
1916     if (array_key_exists('HTTP_X_FORWARDED_FOR', $_SERVER)) {
1917         if (array_key_exists('HTTP_CLIENT_IP', $_SERVER)) {
1918             $proxy = $_SERVER['HTTP_CLIENT_IP'];
1919         } else {
1920             $proxy = $_SERVER['REMOTE_ADDR'];
1921         }
1922         $ip = $_SERVER['HTTP_X_FORWARDED_FOR'];
1923     } else {
1924         $proxy = null;
1925         if (array_key_exists('HTTP_CLIENT_IP', $_SERVER)) {
1926             $ip = $_SERVER['HTTP_CLIENT_IP'];
1927         } else {
1928             $ip = $_SERVER['REMOTE_ADDR'];
1929         }
1930     }
1931
1932     return array($proxy, $ip);
1933 }
1934
1935 function common_url_to_nickname($url)
1936 {
1937     static $bad = array('query', 'user', 'password', 'port', 'fragment');
1938
1939     $parts = parse_url($url);
1940
1941     # If any of these parts exist, this won't work
1942
1943     foreach ($bad as $badpart) {
1944         if (array_key_exists($badpart, $parts)) {
1945             return null;
1946         }
1947     }
1948
1949     # We just have host and/or path
1950
1951     # If it's just a host...
1952     if (array_key_exists('host', $parts) &&
1953         (!array_key_exists('path', $parts) || strcmp($parts['path'], '/') == 0))
1954     {
1955         $hostparts = explode('.', $parts['host']);
1956
1957         # Try to catch common idiom of nickname.service.tld
1958
1959         if ((count($hostparts) > 2) &&
1960             (strlen($hostparts[count($hostparts) - 2]) > 3) && # try to skip .co.uk, .com.au
1961             (strcmp($hostparts[0], 'www') != 0))
1962         {
1963             return common_nicknamize($hostparts[0]);
1964         } else {
1965             # Do the whole hostname
1966             return common_nicknamize($parts['host']);
1967         }
1968     } else {
1969         if (array_key_exists('path', $parts)) {
1970             # Strip starting, ending slashes
1971             $path = preg_replace('@/$@', '', $parts['path']);
1972             $path = preg_replace('@^/@', '', $path);
1973             $path = basename($path);
1974
1975             // Hack for MediaWiki user pages, in the form:
1976             // http://example.com/wiki/User:Myname
1977             // ('User' may be localized.)
1978             if (strpos($path, ':')) {
1979                 $parts = array_filter(explode(':', $path));
1980                 $path = $parts[count($parts) - 1];
1981             }
1982
1983             if ($path) {
1984                 return common_nicknamize($path);
1985             }
1986         }
1987     }
1988
1989     return null;
1990 }
1991
1992 function common_nicknamize($str)
1993 {
1994     $str = preg_replace('/\W/', '', $str);
1995     return strtolower($str);
1996 }