]> git.mxchange.org Git - quix0rs-gnu-social.git/blob - plugins/OStatus/classes/Ostatus_profile.php
Add doc comments on saveHTMLFile; drop the extra <div> wrapping the contents to make...
[quix0rs-gnu-social.git] / plugins / OStatus / classes / Ostatus_profile.php
1 <?php
2 /*
3  * StatusNet - the distributed open-source microblogging tool
4  * Copyright (C) 2009-2010, StatusNet, Inc.
5  *
6  * This program is free software: you can redistribute it and/or modify
7  * it under the terms of the GNU Affero General Public License as published by
8  * the Free Software Foundation, either version 3 of the License, or
9  * (at your option) any later version.
10  *
11  * This program is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14  * GNU Affero General Public License for more details.
15  *
16  * You should have received a copy of the GNU Affero General Public License
17  * along with this program.  If not, see <http://www.gnu.org/licenses/>.
18  */
19
20 /**
21  * @package OStatusPlugin
22  * @maintainer Brion Vibber <brion@status.net>
23  */
24
25 class Ostatus_profile extends Memcached_DataObject
26 {
27     public $__table = 'ostatus_profile';
28
29     public $uri;
30
31     public $profile_id;
32     public $group_id;
33
34     public $feeduri;
35     public $salmonuri;
36     public $avatar; // remote URL of the last avatar we saved
37
38     public $created;
39     public $modified;
40
41     public /*static*/ function staticGet($k, $v=null)
42     {
43         return parent::staticGet(__CLASS__, $k, $v);
44     }
45
46     /**
47      * return table definition for DB_DataObject
48      *
49      * DB_DataObject needs to know something about the table to manipulate
50      * instances. This method provides all the DB_DataObject needs to know.
51      *
52      * @return array array of column definitions
53      */
54
55     function table()
56     {
57         return array('uri' => DB_DATAOBJECT_STR + DB_DATAOBJECT_NOTNULL,
58                      'profile_id' => DB_DATAOBJECT_INT,
59                      'group_id' => DB_DATAOBJECT_INT,
60                      'feeduri' => DB_DATAOBJECT_STR,
61                      'salmonuri' =>  DB_DATAOBJECT_STR,
62                      'avatar' =>  DB_DATAOBJECT_STR,
63                      'created' => DB_DATAOBJECT_STR + DB_DATAOBJECT_DATE + DB_DATAOBJECT_TIME + DB_DATAOBJECT_NOTNULL,
64                      'modified' => DB_DATAOBJECT_STR + DB_DATAOBJECT_DATE + DB_DATAOBJECT_TIME + DB_DATAOBJECT_NOTNULL);
65     }
66
67     static function schemaDef()
68     {
69         return array(new ColumnDef('uri', 'varchar',
70                                    255, false, 'PRI'),
71                      new ColumnDef('profile_id', 'integer',
72                                    null, true, 'UNI'),
73                      new ColumnDef('group_id', 'integer',
74                                    null, true, 'UNI'),
75                      new ColumnDef('feeduri', 'varchar',
76                                    255, true, 'UNI'),
77                      new ColumnDef('salmonuri', 'text',
78                                    null, true),
79                      new ColumnDef('avatar', 'text',
80                                    null, true),
81                      new ColumnDef('created', 'datetime',
82                                    null, false),
83                      new ColumnDef('modified', 'datetime',
84                                    null, false));
85     }
86
87     /**
88      * return key definitions for DB_DataObject
89      *
90      * DB_DataObject needs to know about keys that the table has; this function
91      * defines them.
92      *
93      * @return array key definitions
94      */
95
96     function keys()
97     {
98         return array_keys($this->keyTypes());
99     }
100
101     /**
102      * return key definitions for Memcached_DataObject
103      *
104      * Our caching system uses the same key definitions, but uses a different
105      * method to get them.
106      *
107      * @return array key definitions
108      */
109
110     function keyTypes()
111     {
112         return array('uri' => 'K', 'profile_id' => 'U', 'group_id' => 'U', 'feeduri' => 'U');
113     }
114
115     function sequenceKey()
116     {
117         return array(false, false, false);
118     }
119
120     /**
121      * Fetch the StatusNet-side profile for this feed
122      * @return Profile
123      */
124     public function localProfile()
125     {
126         if ($this->profile_id) {
127             return Profile::staticGet('id', $this->profile_id);
128         }
129         return null;
130     }
131
132     /**
133      * Fetch the StatusNet-side profile for this feed
134      * @return Profile
135      */
136     public function localGroup()
137     {
138         if ($this->group_id) {
139             return User_group::staticGet('id', $this->group_id);
140         }
141         return null;
142     }
143
144     /**
145      * Returns an ActivityObject describing this remote user or group profile.
146      * Can then be used to generate Atom chunks.
147      *
148      * @return ActivityObject
149      */
150     function asActivityObject()
151     {
152         if ($this->isGroup()) {
153             return ActivityObject::fromGroup($this->localGroup());
154         } else {
155             return ActivityObject::fromProfile($this->localProfile());
156         }
157     }
158
159     /**
160      * Returns an XML string fragment with profile information as an
161      * Activity Streams noun object with the given element type.
162      *
163      * Assumes that 'activity' namespace has been previously defined.
164      *
165      * @fixme replace with wrappers on asActivityObject when it's got everything.
166      *
167      * @param string $element one of 'actor', 'subject', 'object', 'target'
168      * @return string
169      */
170     function asActivityNoun($element)
171     {
172         if ($this->isGroup()) {
173             $noun = ActivityObject::fromGroup($this->localGroup());
174             return $noun->asString('activity:' . $element);
175         } else {
176             $noun = ActivityObject::fromProfile($this->localProfile());
177             return $noun->asString('activity:' . $element);
178         }
179     }
180
181     /**
182      * @return boolean true if this is a remote group
183      */
184     function isGroup()
185     {
186         if ($this->profile_id && !$this->group_id) {
187             return false;
188         } else if ($this->group_id && !$this->profile_id) {
189             return true;
190         } else if ($this->group_id && $this->profile_id) {
191             throw new ServerException("Invalid ostatus_profile state: both group and profile IDs set for $this->uri");
192         } else {
193             throw new ServerException("Invalid ostatus_profile state: both group and profile IDs empty for $this->uri");
194         }
195     }
196
197     /**
198      * Send a subscription request to the hub for this feed.
199      * The hub will later send us a confirmation POST to /main/push/callback.
200      *
201      * @return bool true on success, false on failure
202      * @throws ServerException if feed state is not valid
203      */
204     public function subscribe()
205     {
206         $feedsub = FeedSub::ensureFeed($this->feeduri);
207         if ($feedsub->sub_state == 'active') {
208             // Active subscription, we don't need to do anything.
209             return true;
210         } else {
211             // Inactive or we got left in an inconsistent state.
212             // Run a subscription request to make sure we're current!
213             return $feedsub->subscribe();
214         }
215     }
216
217     /**
218      * Send a PuSH unsubscription request to the hub for this feed.
219      * The hub will later send us a confirmation POST to /main/push/callback.
220      *
221      * @return bool true on success, false on failure
222      * @throws ServerException if feed state is not valid
223      */
224     public function unsubscribe() {
225         $feedsub = FeedSub::staticGet('uri', $this->feeduri);
226         if (!$feedsub || $feedsub->sub_state == '' || $feedsub->sub_state == 'inactive') {
227             // No active PuSH subscription, we can just leave it be.
228             return true;
229         } else {
230             // PuSH subscription is either active or in an indeterminate state.
231             // Send an unsubscribe.
232             return $feedsub->unsubscribe();
233         }
234     }
235
236     /**
237      * Check if this remote profile has any active local subscriptions, and
238      * if not drop the PuSH subscription feed.
239      *
240      * @return boolean
241      */
242     public function garbageCollect()
243     {
244         if ($this->isGroup()) {
245             $members = $this->localGroup()->getMembers(0, 1);
246             $count = $members->N;
247         } else {
248             $count = $this->localProfile()->subscriberCount();
249         }
250         if ($count == 0) {
251             common_log(LOG_INFO, "Unsubscribing from now-unused remote feed $this->feeduri");
252             $this->unsubscribe();
253             return true;
254         } else {
255             return false;
256         }
257     }
258
259     /**
260      * Send an Activity Streams notification to the remote Salmon endpoint,
261      * if so configured.
262      *
263      * @param Profile $actor  Actor who did the activity
264      * @param string  $verb   Activity::SUBSCRIBE or Activity::JOIN
265      * @param Object  $object object of the action; must define asActivityNoun($tag)
266      */
267     public function notify($actor, $verb, $object=null)
268     {
269         if (!($actor instanceof Profile)) {
270             $type = gettype($actor);
271             if ($type == 'object') {
272                 $type = get_class($actor);
273             }
274             throw new ServerException("Invalid actor passed to " . __METHOD__ . ": " . $type);
275         }
276         if ($object == null) {
277             $object = $this;
278         }
279         if ($this->salmonuri) {
280
281             $text = 'update';
282             $id = TagURI::mint('%s:%s:%s',
283                                $verb,
284                                $actor->getURI(),
285                                common_date_iso8601(time()));
286
287             // @fixme consolidate all these NS settings somewhere
288             $attributes = array('xmlns' => Activity::ATOM,
289                                 'xmlns:activity' => 'http://activitystrea.ms/spec/1.0/',
290                                 'xmlns:thr' => 'http://purl.org/syndication/thread/1.0',
291                                 'xmlns:georss' => 'http://www.georss.org/georss',
292                                 'xmlns:ostatus' => 'http://ostatus.org/schema/1.0',
293                                 'xmlns:poco' => 'http://portablecontacts.net/spec/1.0',
294                                 'xmlns:media' => 'http://purl.org/syndication/atommedia');
295
296             $entry = new XMLStringer();
297             $entry->elementStart('entry', $attributes);
298             $entry->element('id', null, $id);
299             $entry->element('title', null, $text);
300             $entry->element('summary', null, $text);
301             $entry->element('published', null, common_date_w3dtf(common_sql_now()));
302
303             $entry->element('activity:verb', null, $verb);
304             $entry->raw($actor->asAtomAuthor());
305             $entry->raw($actor->asActivityActor());
306             $entry->raw($object->asActivityNoun('object'));
307             $entry->elementEnd('entry');
308
309             $xml = $entry->getString();
310             common_log(LOG_INFO, "Posting to Salmon endpoint $this->salmonuri: $xml");
311
312             $salmon = new Salmon(); // ?
313             return $salmon->post($this->salmonuri, $xml, $actor);
314         }
315         return false;
316     }
317
318     /**
319      * Send a Salmon notification ping immediately, and confirm that we got
320      * an acceptable response from the remote site.
321      *
322      * @param mixed $entry XML string, Notice, or Activity
323      * @return boolean success
324      */
325     public function notifyActivity($entry, $actor)
326     {
327         if ($this->salmonuri) {
328             $salmon = new Salmon();
329             return $salmon->post($this->salmonuri, $this->notifyPrepXml($entry), $actor);
330         }
331
332         return false;
333     }
334
335     /**
336      * Queue a Salmon notification for later. If queues are disabled we'll
337      * send immediately but won't get the return value.
338      *
339      * @param mixed $entry XML string, Notice, or Activity
340      * @return boolean success
341      */
342     public function notifyDeferred($entry, $actor)
343     {
344         if ($this->salmonuri) {
345             $data = array('salmonuri' => $this->salmonuri,
346                           'entry' => $this->notifyPrepXml($entry),
347                           'actor' => $actor->id);
348
349             $qm = QueueManager::get();
350             return $qm->enqueue($data, 'salmon');
351         }
352
353         return false;
354     }
355
356     protected function notifyPrepXml($entry)
357     {
358         $preamble = '<?xml version="1.0" encoding="UTF-8" ?' . '>';
359         if (is_string($entry)) {
360             return $entry;
361         } else if ($entry instanceof Activity) {
362             return $preamble . $entry->asString(true);
363         } else if ($entry instanceof Notice) {
364             return $preamble . $entry->asAtomEntry(true, true);
365         } else {
366             throw new ServerException("Invalid type passed to Ostatus_profile::notify; must be XML string or Activity entry");
367         }
368     }
369
370     function getBestName()
371     {
372         if ($this->isGroup()) {
373             return $this->localGroup()->getBestName();
374         } else {
375             return $this->localProfile()->getBestName();
376         }
377     }
378
379     /**
380      * Read and post notices for updates from the feed.
381      * Currently assumes that all items in the feed are new,
382      * coming from a PuSH hub.
383      *
384      * @param DOMDocument $doc
385      * @param string $source identifier ("push")
386      */
387     public function processFeed(DOMDocument $doc, $source)
388     {
389         $feed = $doc->documentElement;
390
391         if ($feed->localName == 'feed' && $feed->namespaceURI == Activity::ATOM) {
392             $this->processAtomFeed($feed, $source);
393         } else if ($feed->localName == 'rss') { // @fixme check namespace
394             $this->processRssFeed($feed, $source);
395         } else {
396             throw new Exception("Unknown feed format.");
397         }
398     }
399
400     public function processAtomFeed(DOMElement $feed, $source)
401     {
402         $entries = $feed->getElementsByTagNameNS(Activity::ATOM, 'entry');
403         if ($entries->length == 0) {
404             common_log(LOG_ERR, __METHOD__ . ": no entries in feed update, ignoring");
405             return;
406         }
407
408         for ($i = 0; $i < $entries->length; $i++) {
409             $entry = $entries->item($i);
410             $this->processEntry($entry, $feed, $source);
411         }
412     }
413
414     public function processRssFeed(DOMElement $rss, $source)
415     {
416         $channels = $rss->getElementsByTagName('channel');
417
418         if ($channels->length == 0) {
419             throw new Exception("RSS feed without a channel.");
420         } else if ($channels->length > 1) {
421             common_log(LOG_WARNING, __METHOD__ . ": more than one channel in an RSS feed");
422         }
423
424         $channel = $channels->item(0);
425
426         $items = $channel->getElementsByTagName('item');
427
428         for ($i = 0; $i < $items->length; $i++) {
429             $item = $items->item($i);
430             $this->processEntry($item, $channel, $source);
431         }
432     }
433
434     /**
435      * Process a posted entry from this feed source.
436      *
437      * @param DOMElement $entry
438      * @param DOMElement $feed for context
439      * @param string $source identifier ("push" or "salmon")
440      */
441     public function processEntry($entry, $feed, $source)
442     {
443         $activity = new Activity($entry, $feed);
444
445         // @todo process all activity objects
446         switch ($activity->objects[0]->type) {
447         case ActivityObject::ARTICLE:
448         case ActivityObject::BLOGENTRY:
449         case ActivityObject::NOTE:
450         case ActivityObject::STATUS:
451         case ActivityObject::COMMENT:
452             break;
453         default:
454             throw new ClientException("Can't handle that kind of post.");
455         }
456
457         if ($activity->verb == ActivityVerb::POST) {
458             $this->processPost($activity, $source);
459         } else {
460             common_log(LOG_INFO, "Ignoring activity with unrecognized verb $activity->verb");
461         }
462     }
463
464     /**
465      * Process an incoming post activity from this remote feed.
466      * @param Activity $activity
467      * @param string $method 'push' or 'salmon'
468      * @return mixed saved Notice or false
469      * @fixme break up this function, it's getting nasty long
470      */
471     public function processPost($activity, $method)
472     {
473         if ($this->isGroup()) {
474             // A group feed will contain posts from multiple authors.
475             // @fixme validate these profiles in some way!
476             $oprofile = self::ensureActorProfile($activity);
477             if ($oprofile->isGroup()) {
478                 // Groups can't post notices in StatusNet.
479                 common_log(LOG_WARNING, "OStatus: skipping post with group listed as author: $oprofile->uri in feed from $this->uri");
480                 return false;
481             }
482         } else {
483             $actor = $activity->actor;
484
485             if (empty($actor)) {
486                 // OK here! assume the default
487             } else if ($actor->id == $this->uri || $actor->link == $this->uri) {
488                 $this->updateFromActivityObject($actor);
489             } else {
490                 throw new Exception("Got an actor '{$actor->title}' ({$actor->id}) on single-user feed for {$this->uri}");
491             }
492
493             $oprofile = $this;
494         }
495
496         // It's not always an ActivityObject::NOTE, but... let's just say it is.
497
498         $note = $activity->objects[0];
499
500         // The id URI will be used as a unique identifier for for the notice,
501         // protecting against duplicate saves. It isn't required to be a URL;
502         // tag: URIs for instance are found in Google Buzz feeds.
503         $sourceUri = $note->id;
504         $dupe = Notice::staticGet('uri', $sourceUri);
505         if ($dupe) {
506             common_log(LOG_INFO, "OStatus: ignoring duplicate post: $sourceUri");
507             return false;
508         }
509
510         // We'll also want to save a web link to the original notice, if provided.
511         $sourceUrl = null;
512         if ($note->link) {
513             $sourceUrl = $note->link;
514         } else if ($activity->link) {
515             $sourceUrl = $activity->link;
516         } else if (preg_match('!^https?://!', $note->id)) {
517             $sourceUrl = $note->id;
518         }
519
520         // Use summary as fallback for content
521
522         if (!empty($note->content)) {
523             $sourceContent = $note->content;
524         } else if (!empty($note->summary)) {
525             $sourceContent = $note->summary;
526         } else if (!empty($note->title)) {
527             $sourceContent = $note->title;
528         } else {
529             // @fixme fetch from $sourceUrl?
530             throw new ClientException("No content for notice {$sourceUri}");
531         }
532
533         // Get (safe!) HTML and text versions of the content
534
535         $rendered = $this->purify($sourceContent);
536         $content = html_entity_decode(strip_tags($rendered));
537
538         $shortened = common_shorten_links($content);
539
540         // If it's too long, try using the summary, and make the
541         // HTML an attachment.
542
543         $attachment = null;
544
545         if (Notice::contentTooLong($shortened)) {
546             $attachment = $this->saveHTMLFile($note->title, $rendered);
547             $summary = html_entity_decode(strip_tags($note->summary));
548             if (empty($summary)) {
549                 $summary = $content;
550             }
551             $shortSummary = common_shorten_links($summary);
552             if (Notice::contentTooLong($shortSummary)) {
553                 $url = common_shorten_url(common_local_url('attachment',
554                                                            array('attachment' => $attachment->id)));
555                 $shortSummary = substr($shortSummary,
556                                        0,
557                                        Notice::maxContent() - (mb_strlen($url) + 2));
558                 $content = $shortSummary . ' ' . $url;
559
560                 // We mark up the attachment link specially for the HTML output
561                 // so we can fold-out the full version inline.
562                 $attachUrl = common_local_url('attachment',
563                                               array('attachment' => $attachment->id));
564                 $rendered = common_render_text($shortSummary) .
565                             '<a href="' . htmlspecialchars($attachUrl) .'"'.
566                             ' class="attachment more"' .
567                             ' title="'. htmlspecialchars(_m('Show more')) . '">' .
568                             '&#8230;' .
569                             '</a>';
570             }
571         }
572
573         $options = array('is_local' => Notice::REMOTE_OMB,
574                         'url' => $sourceUrl,
575                         'uri' => $sourceUri,
576                         'rendered' => $rendered,
577                         'replies' => array(),
578                         'groups' => array(),
579                         'tags' => array(),
580                         'urls' => array());
581
582         // Check for optional attributes...
583
584         if (!empty($activity->time)) {
585             $options['created'] = common_sql_date($activity->time);
586         }
587
588         if ($activity->context) {
589             // Any individual or group attn: targets?
590             $replies = $activity->context->attention;
591             $options['groups'] = $this->filterReplies($oprofile, $replies);
592             $options['replies'] = $replies;
593
594             // Maintain direct reply associations
595             // @fixme what about conversation ID?
596             if (!empty($activity->context->replyToID)) {
597                 $orig = Notice::staticGet('uri',
598                                           $activity->context->replyToID);
599                 if (!empty($orig)) {
600                     $options['reply_to'] = $orig->id;
601                 }
602             }
603
604             $location = $activity->context->location;
605             if ($location) {
606                 $options['lat'] = $location->lat;
607                 $options['lon'] = $location->lon;
608                 if ($location->location_id) {
609                     $options['location_ns'] = $location->location_ns;
610                     $options['location_id'] = $location->location_id;
611                 }
612             }
613         }
614
615         // Atom categories <-> hashtags
616         foreach ($activity->categories as $cat) {
617             if ($cat->term) {
618                 $term = common_canonical_tag($cat->term);
619                 if ($term) {
620                     $options['tags'][] = $term;
621                 }
622             }
623         }
624
625         // Atom enclosures -> attachment URLs
626         foreach ($activity->enclosures as $href) {
627             // @fixme save these locally or....?
628             $options['urls'][] = $href;
629         }
630
631         try {
632             $saved = Notice::saveNew($oprofile->profile_id,
633                                      $content,
634                                      'ostatus',
635                                      $options);
636             if ($saved) {
637                 Ostatus_source::saveNew($saved, $this, $method);
638                 if (!empty($attachment)) {
639                     File_to_post::processNew($attachment->id, $saved->id);
640                 }
641             }
642         } catch (Exception $e) {
643             common_log(LOG_ERR, "OStatus save of remote message $sourceUri failed: " . $e->getMessage());
644             throw $e;
645         }
646         common_log(LOG_INFO, "OStatus saved remote message $sourceUri as notice id $saved->id");
647         return $saved;
648     }
649
650     /**
651      * Clean up HTML
652      */
653     protected function purify($html)
654     {
655         require_once INSTALLDIR.'/extlib/htmLawed/htmLawed.php';
656         $config = array('safe' => 1,
657                         'deny_attribute' => 'id,style,on*');
658         return htmLawed($html, $config);
659     }
660
661     /**
662      * Filters a list of recipient ID URIs to just those for local delivery.
663      * @param Ostatus_profile local profile of sender
664      * @param array in/out &$attention_uris set of URIs, will be pruned on output
665      * @return array of group IDs
666      */
667     protected function filterReplies($sender, &$attention_uris)
668     {
669         common_log(LOG_DEBUG, "Original reply recipients: " . implode(', ', $attention_uris));
670         $groups = array();
671         $replies = array();
672         foreach ($attention_uris as $recipient) {
673             // Is the recipient a local user?
674             $user = User::staticGet('uri', $recipient);
675             if ($user) {
676                 // @fixme sender verification, spam etc?
677                 $replies[] = $recipient;
678                 continue;
679             }
680
681             // Is the recipient a remote group?
682             $oprofile = Ostatus_profile::staticGet('uri', $recipient);
683             if ($oprofile) {
684                 if ($oprofile->isGroup()) {
685                     // Deliver to local members of this remote group.
686                     // @fixme sender verification?
687                     $groups[] = $oprofile->group_id;
688                 } else {
689                     common_log(LOG_DEBUG, "Skipping reply to remote profile $recipient");
690                 }
691                 continue;
692             }
693
694             // Is the recipient a local group?
695             // @fixme uri on user_group isn't reliable yet
696             // $group = User_group::staticGet('uri', $recipient);
697             $id = OStatusPlugin::localGroupFromUrl($recipient);
698             if ($id) {
699                 $group = User_group::staticGet('id', $id);
700                 if ($group) {
701                     // Deliver to all members of this local group if allowed.
702                     $profile = $sender->localProfile();
703                     if ($profile->isMember($group)) {
704                         $groups[] = $group->id;
705                     } else {
706                         common_log(LOG_DEBUG, "Skipping reply to local group $group->nickname as sender $profile->id is not a member");
707                     }
708                     continue;
709                 } else {
710                     common_log(LOG_DEBUG, "Skipping reply to bogus group $recipient");
711                 }
712             }
713
714             common_log(LOG_DEBUG, "Skipping reply to unrecognized profile $recipient");
715
716         }
717         $attention_uris = $replies;
718         common_log(LOG_DEBUG, "Local reply recipients: " . implode(', ', $replies));
719         common_log(LOG_DEBUG, "Local group recipients: " . implode(', ', $groups));
720         return $groups;
721     }
722
723     /**
724      * Look up and if necessary create an Ostatus_profile for the remote entity
725      * with the given profile page URL. This should never return null -- you
726      * will either get an object or an exception will be thrown.
727      *
728      * @param string $profile_url
729      * @return Ostatus_profile
730      * @throws Exception
731      */
732
733     public static function ensureProfileURL($profile_url, $hints=array())
734     {
735         $oprofile = self::getFromProfileURL($profile_url);
736
737         if (!empty($oprofile)) {
738             return $oprofile;
739         }
740
741         $hints['profileurl'] = $profile_url;
742
743         // Fetch the URL
744         // XXX: HTTP caching
745
746         $client = new HTTPClient();
747         $client->setHeader('Accept', 'text/html,application/xhtml+xml');
748         $response = $client->get($profile_url);
749
750         if (!$response->isOk()) {
751             throw new Exception("Could not reach profile page: " . $profile_url);
752         }
753
754         // Check if we have a non-canonical URL
755
756         $finalUrl = $response->getUrl();
757
758         if ($finalUrl != $profile_url) {
759
760             $hints['profileurl'] = $finalUrl;
761
762             $oprofile = self::getFromProfileURL($finalUrl);
763
764             if (!empty($oprofile)) {
765                 return $oprofile;
766             }
767         }
768
769         // Try to get some hCard data
770
771         $body = $response->getBody();
772
773         $hcardHints = DiscoveryHints::hcardHints($body, $finalUrl);
774
775         if (!empty($hcardHints)) {
776             $hints = array_merge($hints, $hcardHints);
777         }
778
779         // Check if they've got an LRDD header
780
781         $lrdd = LinkHeader::getLink($response, 'lrdd', 'application/xrd+xml');
782
783         if (!empty($lrdd)) {
784
785             $xrd = Discovery::fetchXrd($lrdd);
786             $xrdHints = DiscoveryHints::fromXRD($xrd);
787
788             $hints = array_merge($hints, $xrdHints);
789         }
790
791         // If discovery found a feedurl (probably from LRDD), use it.
792
793         if (array_key_exists('feedurl', $hints)) {
794             return self::ensureFeedURL($hints['feedurl'], $hints);
795         }
796
797         // Get the feed URL from HTML
798
799         $discover = new FeedDiscovery();
800
801         $feedurl = $discover->discoverFromHTML($finalUrl, $body);
802
803         if (!empty($feedurl)) {
804             $hints['feedurl'] = $feedurl;
805             return self::ensureFeedURL($feedurl, $hints);
806         }
807
808         throw new Exception("Could not find a feed URL for profile page " . $finalUrl);
809     }
810
811     /**
812      * Look up the Ostatus_profile, if present, for a remote entity with the
813      * given profile page URL. Will return null for both unknown and invalid
814      * remote profiles.
815      *
816      * @return mixed Ostatus_profile or null
817      * @throws Exception for local profiles
818      */
819     static function getFromProfileURL($profile_url)
820     {
821         $profile = Profile::staticGet('profileurl', $profile_url);
822
823         if (empty($profile)) {
824             return null;
825         }
826
827         // Is it a known Ostatus profile?
828
829         $oprofile = Ostatus_profile::staticGet('profile_id', $profile->id);
830
831         if (!empty($oprofile)) {
832             return $oprofile;
833         }
834
835         // Is it a local user?
836
837         $user = User::staticGet('id', $profile->id);
838
839         if (!empty($user)) {
840             throw new Exception("'$profile_url' is the profile for local user '{$user->nickname}'.");
841         }
842
843         // Continue discovery; it's a remote profile
844         // for OMB or some other protocol, may also
845         // support OStatus
846
847         return null;
848     }
849
850     /**
851      * Look up and if necessary create an Ostatus_profile for remote entity
852      * with the given update feed. This should never return null -- you will
853      * either get an object or an exception will be thrown.
854      *
855      * @return Ostatus_profile
856      * @throws Exception
857      */
858     public static function ensureFeedURL($feed_url, $hints=array())
859     {
860         $discover = new FeedDiscovery();
861
862         $feeduri = $discover->discoverFromFeedURL($feed_url);
863         $hints['feedurl'] = $feeduri;
864
865         $huburi = $discover->getAtomLink('hub');
866         $hints['hub'] = $huburi;
867         $salmonuri = $discover->getAtomLink(Salmon::NS_REPLIES);
868         $hints['salmon'] = $salmonuri;
869
870         if (!$huburi) {
871             // We can only deal with folks with a PuSH hub
872             throw new FeedSubNoHubException();
873         }
874
875         $feedEl = $discover->root;
876
877         if ($feedEl->tagName == 'feed') {
878             return self::ensureAtomFeed($feedEl, $hints);
879         } else if ($feedEl->tagName == 'channel') {
880             return self::ensureRssChannel($feedEl, $hints);
881         } else {
882             throw new FeedSubBadXmlException($feeduri);
883         }
884     }
885
886     /**
887      * Look up and, if necessary, create an Ostatus_profile for the remote
888      * profile with the given Atom feed - actually loaded from the feed.
889      * This should never return null -- you will either get an object or
890      * an exception will be thrown.
891      *
892      * @param DOMElement $feedEl root element of a loaded Atom feed
893      * @param array $hints additional discovery information passed from higher levels
894      * @fixme should this be marked public?
895      * @return Ostatus_profile
896      * @throws Exception
897      */
898     public static function ensureAtomFeed($feedEl, $hints)
899     {
900         // Try to get a profile from the feed activity:subject
901
902         $subject = ActivityUtils::child($feedEl, Activity::SUBJECT, Activity::SPEC);
903
904         if (!empty($subject)) {
905             $subjObject = new ActivityObject($subject);
906             return self::ensureActivityObjectProfile($subjObject, $hints);
907         }
908
909         // Otherwise, try the feed author
910
911         $author = ActivityUtils::child($feedEl, Activity::AUTHOR, Activity::ATOM);
912
913         if (!empty($author)) {
914             $authorObject = new ActivityObject($author);
915             return self::ensureActivityObjectProfile($authorObject, $hints);
916         }
917
918         // Sheesh. Not a very nice feed! Let's try fingerpoken in the
919         // entries.
920
921         $entries = $feedEl->getElementsByTagNameNS(Activity::ATOM, 'entry');
922
923         if (!empty($entries) && $entries->length > 0) {
924
925             $entry = $entries->item(0);
926
927             $actor = ActivityUtils::child($entry, Activity::ACTOR, Activity::SPEC);
928
929             if (!empty($actor)) {
930                 $actorObject = new ActivityObject($actor);
931                 return self::ensureActivityObjectProfile($actorObject, $hints);
932
933             }
934
935             $author = ActivityUtils::child($entry, Activity::AUTHOR, Activity::ATOM);
936
937             if (!empty($author)) {
938                 $authorObject = new ActivityObject($author);
939                 return self::ensureActivityObjectProfile($authorObject, $hints);
940             }
941         }
942
943         // XXX: make some educated guesses here
944
945         throw new FeedSubException("Can't find enough profile information to make a feed.");
946     }
947
948     /**
949      * Look up and, if necessary, create an Ostatus_profile for the remote
950      * profile with the given RSS feed - actually loaded from the feed.
951      * This should never return null -- you will either get an object or
952      * an exception will be thrown.
953      *
954      * @param DOMElement $feedEl root element of a loaded RSS feed
955      * @param array $hints additional discovery information passed from higher levels
956      * @fixme should this be marked public?
957      * @return Ostatus_profile
958      * @throws Exception
959      */
960     public static function ensureRssChannel($feedEl, $hints)
961     {
962         // Special-case for Posterous. They have some nice metadata in their
963         // posterous:author elements. We should use them instead of the channel.
964
965         $items = $feedEl->getElementsByTagName('item');
966
967         if ($items->length > 0) {
968             $item = $items->item(0);
969             $authorEl = ActivityUtils::child($item, ActivityObject::AUTHOR, ActivityObject::POSTEROUS);
970             if (!empty($authorEl)) {
971                 $obj = ActivityObject::fromPosterousAuthor($authorEl);
972                 // Posterous has multiple authors per feed, and multiple feeds
973                 // per author. We check if this is the "main" feed for this author.
974                 if (array_key_exists('profileurl', $hints) &&
975                     !empty($obj->poco) &&
976                     common_url_to_nickname($hints['profileurl']) == $obj->poco->preferredUsername) {
977                     return self::ensureActivityObjectProfile($obj, $hints);
978                 }
979             }
980         }
981
982         // @fixme we should check whether this feed has elements
983         // with different <author> or <dc:creator> elements, and... I dunno.
984         // Do something about that.
985
986         $obj = ActivityObject::fromRssChannel($feedEl);
987
988         return self::ensureActivityObjectProfile($obj, $hints);
989     }
990
991     /**
992      * Download and update given avatar image
993      *
994      * @param string $url
995      * @throws Exception in various failure cases
996      */
997     protected function updateAvatar($url)
998     {
999         if ($url == $this->avatar) {
1000             // We've already got this one.
1001             return;
1002         }
1003         if (!common_valid_http_url($url)) {
1004             throw new ServerException(_m("Invalid avatar URL %s"), $url);
1005         }
1006
1007         if ($this->isGroup()) {
1008             $self = $this->localGroup();
1009         } else {
1010             $self = $this->localProfile();
1011         }
1012         if (!$self) {
1013             throw new ServerException(sprintf(
1014                 _m("Tried to update avatar for unsaved remote profile %s"),
1015                 $this->uri));
1016         }
1017
1018         // @fixme this should be better encapsulated
1019         // ripped from oauthstore.php (for old OMB client)
1020         $temp_filename = tempnam(sys_get_temp_dir(), 'listener_avatar');
1021         if (!copy($url, $temp_filename)) {
1022             throw new ServerException(sprintf(_m("Unable to fetch avatar from %s"), $url));
1023         }
1024
1025         if ($this->isGroup()) {
1026             $id = $this->group_id;
1027         } else {
1028             $id = $this->profile_id;
1029         }
1030         // @fixme should we be using different ids?
1031         $imagefile = new ImageFile($id, $temp_filename);
1032         $filename = Avatar::filename($id,
1033                                      image_type_to_extension($imagefile->type),
1034                                      null,
1035                                      common_timestamp());
1036         rename($temp_filename, Avatar::path($filename));
1037         $self->setOriginal($filename);
1038
1039         $orig = clone($this);
1040         $this->avatar = $url;
1041         $this->update($orig);
1042     }
1043
1044     /**
1045      * Pull avatar URL from ActivityObject or profile hints
1046      *
1047      * @param ActivityObject $object
1048      * @param array $hints
1049      * @return mixed URL string or false
1050      */
1051
1052     protected static function getActivityObjectAvatar($object, $hints=array())
1053     {
1054         if ($object->avatarLinks) {
1055             $best = false;
1056             // Take the exact-size avatar, or the largest avatar, or the first avatar if all sizeless
1057             foreach ($object->avatarLinks as $avatar) {
1058                 if ($avatar->width == AVATAR_PROFILE_SIZE && $avatar->height = AVATAR_PROFILE_SIZE) {
1059                     // Exact match!
1060                     $best = $avatar;
1061                     break;
1062                 }
1063                 if (!$best || $avatar->width > $best->width) {
1064                     $best = $avatar;
1065                 }
1066             }
1067             return $best->url;
1068         } else if (array_key_exists('avatar', $hints)) {
1069             return $hints['avatar'];
1070         }
1071         return false;
1072     }
1073
1074     /**
1075      * Get an appropriate avatar image source URL, if available.
1076      *
1077      * @param ActivityObject $actor
1078      * @param DOMElement $feed
1079      * @return string
1080      */
1081
1082     protected static function getAvatar($actor, $feed)
1083     {
1084         $url = '';
1085         $icon = '';
1086         if ($actor->avatar) {
1087             $url = trim($actor->avatar);
1088         }
1089         if (!$url) {
1090             // Check <atom:logo> and <atom:icon> on the feed
1091             $els = $feed->childNodes();
1092             if ($els && $els->length) {
1093                 for ($i = 0; $i < $els->length; $i++) {
1094                     $el = $els->item($i);
1095                     if ($el->namespaceURI == Activity::ATOM) {
1096                         if (empty($url) && $el->localName == 'logo') {
1097                             $url = trim($el->textContent);
1098                             break;
1099                         }
1100                         if (empty($icon) && $el->localName == 'icon') {
1101                             // Use as a fallback
1102                             $icon = trim($el->textContent);
1103                         }
1104                     }
1105                 }
1106             }
1107             if ($icon && !$url) {
1108                 $url = $icon;
1109             }
1110         }
1111         if ($url) {
1112             $opts = array('allowed_schemes' => array('http', 'https'));
1113             if (Validate::uri($url, $opts)) {
1114                 return $url;
1115             }
1116         }
1117         return common_path('plugins/OStatus/images/96px-Feed-icon.svg.png');
1118     }
1119
1120     /**
1121      * Fetch, or build if necessary, an Ostatus_profile for the actor
1122      * in a given Activity Streams activity.
1123      * This should never return null -- you will either get an object or
1124      * an exception will be thrown.
1125      *
1126      * @param Activity $activity
1127      * @param string $feeduri if we already know the canonical feed URI!
1128      * @param string $salmonuri if we already know the salmon return channel URI
1129      * @return Ostatus_profile
1130      * @throws Exception
1131      */
1132
1133     public static function ensureActorProfile($activity, $hints=array())
1134     {
1135         return self::ensureActivityObjectProfile($activity->actor, $hints);
1136     }
1137
1138     /**
1139      * Fetch, or build if necessary, an Ostatus_profile for the profile
1140      * in a given Activity Streams object (can be subject, actor, or object).
1141      * This should never return null -- you will either get an object or
1142      * an exception will be thrown.
1143      *
1144      * @param ActivityObject $object
1145      * @param array $hints additional discovery information passed from higher levels
1146      * @return Ostatus_profile
1147      * @throws Exception
1148      */
1149
1150     public static function ensureActivityObjectProfile($object, $hints=array())
1151     {
1152         $profile = self::getActivityObjectProfile($object);
1153         if ($profile) {
1154             $profile->updateFromActivityObject($object, $hints);
1155         } else {
1156             $profile = self::createActivityObjectProfile($object, $hints);
1157         }
1158         return $profile;
1159     }
1160
1161     /**
1162      * @param Activity $activity
1163      * @return mixed matching Ostatus_profile or false if none known
1164      * @throws ServerException if feed info invalid
1165      */
1166     public static function getActorProfile($activity)
1167     {
1168         return self::getActivityObjectProfile($activity->actor);
1169     }
1170
1171     /**
1172      * @param ActivityObject $activity
1173      * @return mixed matching Ostatus_profile or false if none known
1174      * @throws ServerException if feed info invalid
1175      */
1176     protected static function getActivityObjectProfile($object)
1177     {
1178         $uri = self::getActivityObjectProfileURI($object);
1179         return Ostatus_profile::staticGet('uri', $uri);
1180     }
1181
1182     /**
1183      * Get the identifier URI for the remote entity described
1184      * by this ActivityObject. This URI is *not* guaranteed to be
1185      * a resolvable HTTP/HTTPS URL.
1186      *
1187      * @param ActivityObject $object
1188      * @return string
1189      * @throws ServerException if feed info invalid
1190      */
1191     protected static function getActivityObjectProfileURI($object)
1192     {
1193         if ($object->id) {
1194             if (ActivityUtils::validateUri($object->id)) {
1195                 return $object->id;
1196             }
1197         }
1198
1199         // If the id is missing or invalid (we've seen feeds mistakenly listing
1200         // things like local usernames in that field) then we'll use the profile
1201         // page link, if valid.
1202         if ($object->link && common_valid_http_url($object->link)) {
1203             return $object->link;
1204         }
1205         throw new ServerException("No author ID URI found");
1206     }
1207
1208     /**
1209      * @fixme validate stuff somewhere
1210      */
1211
1212     /**
1213      * Create local ostatus_profile and profile/user_group entries for
1214      * the provided remote user or group.
1215      * This should never return null -- you will either get an object or
1216      * an exception will be thrown.
1217      *
1218      * @param ActivityObject $object
1219      * @param array $hints
1220      *
1221      * @return Ostatus_profile
1222      */
1223     protected static function createActivityObjectProfile($object, $hints=array())
1224     {
1225         $homeuri = $object->id;
1226         $discover = false;
1227
1228         if (!$homeuri) {
1229             common_log(LOG_DEBUG, __METHOD__ . " empty actor profile URI: " . var_export($activity, true));
1230             throw new Exception("No profile URI");
1231         }
1232
1233         $user = User::staticGet('uri', $homeuri);
1234         if ($user) {
1235             throw new Exception("Local user can't be referenced as remote.");
1236         }
1237
1238         if (OStatusPlugin::localGroupFromUrl($homeuri)) {
1239             throw new Exception("Local group can't be referenced as remote.");
1240         }
1241
1242         if (array_key_exists('feedurl', $hints)) {
1243             $feeduri = $hints['feedurl'];
1244         } else {
1245             $discover = new FeedDiscovery();
1246             $feeduri = $discover->discoverFromURL($homeuri);
1247         }
1248
1249         if (array_key_exists('salmon', $hints)) {
1250             $salmonuri = $hints['salmon'];
1251         } else {
1252             if (!$discover) {
1253                 $discover = new FeedDiscovery();
1254                 $discover->discoverFromFeedURL($hints['feedurl']);
1255             }
1256             $salmonuri = $discover->getAtomLink(Salmon::NS_REPLIES);
1257         }
1258
1259         if (array_key_exists('hub', $hints)) {
1260             $huburi = $hints['hub'];
1261         } else {
1262             if (!$discover) {
1263                 $discover = new FeedDiscovery();
1264                 $discover->discoverFromFeedURL($hints['feedurl']);
1265             }
1266             $huburi = $discover->getAtomLink('hub');
1267         }
1268
1269         if (!$huburi) {
1270             // We can only deal with folks with a PuSH hub
1271             throw new FeedSubNoHubException();
1272         }
1273
1274         $oprofile = new Ostatus_profile();
1275
1276         $oprofile->uri        = $homeuri;
1277         $oprofile->feeduri    = $feeduri;
1278         $oprofile->salmonuri  = $salmonuri;
1279
1280         $oprofile->created    = common_sql_now();
1281         $oprofile->modified   = common_sql_now();
1282
1283         if ($object->type == ActivityObject::PERSON) {
1284             $profile = new Profile();
1285             $profile->created = common_sql_now();
1286             self::updateProfile($profile, $object, $hints);
1287
1288             $oprofile->profile_id = $profile->insert();
1289             if (!$oprofile->profile_id) {
1290                 throw new ServerException("Can't save local profile");
1291             }
1292         } else {
1293             $group = new User_group();
1294             $group->uri = $homeuri;
1295             $group->created = common_sql_now();
1296             self::updateGroup($group, $object, $hints);
1297
1298             $oprofile->group_id = $group->insert();
1299             if (!$oprofile->group_id) {
1300                 throw new ServerException("Can't save local profile");
1301             }
1302         }
1303
1304         $ok = $oprofile->insert();
1305
1306         if ($ok) {
1307             $avatar = self::getActivityObjectAvatar($object, $hints);
1308             if ($avatar) {
1309                 $oprofile->updateAvatar($avatar);
1310             }
1311             return $oprofile;
1312         } else {
1313             throw new ServerException("Can't save OStatus profile");
1314         }
1315     }
1316
1317     /**
1318      * Save any updated profile information to our local copy.
1319      * @param ActivityObject $object
1320      * @param array $hints
1321      */
1322     public function updateFromActivityObject($object, $hints=array())
1323     {
1324         if ($this->isGroup()) {
1325             $group = $this->localGroup();
1326             self::updateGroup($group, $object, $hints);
1327         } else {
1328             $profile = $this->localProfile();
1329             self::updateProfile($profile, $object, $hints);
1330         }
1331         $avatar = self::getActivityObjectAvatar($object, $hints);
1332         if ($avatar) {
1333             $this->updateAvatar($avatar);
1334         }
1335     }
1336
1337     protected static function updateProfile($profile, $object, $hints=array())
1338     {
1339         $orig = clone($profile);
1340
1341         $profile->nickname = self::getActivityObjectNickname($object, $hints);
1342
1343         if (!empty($object->title)) {
1344             $profile->fullname = $object->title;
1345         } else if (array_key_exists('fullname', $hints)) {
1346             $profile->fullname = $hints['fullname'];
1347         }
1348
1349         if (!empty($object->link)) {
1350             $profile->profileurl = $object->link;
1351         } else if (array_key_exists('profileurl', $hints)) {
1352             $profile->profileurl = $hints['profileurl'];
1353         } else if (Validate::uri($object->id, array('allowed_schemes' => array('http', 'https')))) {
1354             $profile->profileurl = $object->id;
1355         }
1356
1357         $profile->bio      = self::getActivityObjectBio($object, $hints);
1358         $profile->location = self::getActivityObjectLocation($object, $hints);
1359         $profile->homepage = self::getActivityObjectHomepage($object, $hints);
1360
1361         if (!empty($object->geopoint)) {
1362             $location = ActivityContext::locationFromPoint($object->geopoint);
1363             if (!empty($location)) {
1364                 $profile->lat = $location->lat;
1365                 $profile->lon = $location->lon;
1366             }
1367         }
1368
1369         // @fixme tags/categories
1370         // @todo tags from categories
1371
1372         if ($profile->id) {
1373             common_log(LOG_DEBUG, "Updating OStatus profile $profile->id from remote info $object->id: " . var_export($object, true) . var_export($hints, true));
1374             $profile->update($orig);
1375         }
1376     }
1377
1378     protected static function updateGroup($group, $object, $hints=array())
1379     {
1380         $orig = clone($group);
1381
1382         $group->nickname = self::getActivityObjectNickname($object, $hints);
1383         $group->fullname = $object->title;
1384
1385         if (!empty($object->link)) {
1386             $group->mainpage = $object->link;
1387         } else if (array_key_exists('profileurl', $hints)) {
1388             $group->mainpage = $hints['profileurl'];
1389         }
1390
1391         // @todo tags from categories
1392         $group->description = self::getActivityObjectBio($object, $hints);
1393         $group->location = self::getActivityObjectLocation($object, $hints);
1394         $group->homepage = self::getActivityObjectHomepage($object, $hints);
1395
1396         if ($group->id) {
1397             common_log(LOG_DEBUG, "Updating OStatus group $group->id from remote info $object->id: " . var_export($object, true) . var_export($hints, true));
1398             $group->update($orig);
1399         }
1400     }
1401
1402     protected static function getActivityObjectHomepage($object, $hints=array())
1403     {
1404         $homepage = null;
1405         $poco     = $object->poco;
1406
1407         if (!empty($poco)) {
1408             $url = $poco->getPrimaryURL();
1409             if ($url && $url->type == 'homepage') {
1410                 $homepage = $url->value;
1411             }
1412         }
1413
1414         // @todo Try for a another PoCo URL?
1415
1416         return $homepage;
1417     }
1418
1419     protected static function getActivityObjectLocation($object, $hints=array())
1420     {
1421         $location = null;
1422
1423         if (!empty($object->poco) &&
1424             isset($object->poco->address->formatted)) {
1425             $location = $object->poco->address->formatted;
1426         } else if (array_key_exists('location', $hints)) {
1427             $location = $hints['location'];
1428         }
1429
1430         if (!empty($location)) {
1431             if (mb_strlen($location) > 255) {
1432                 $location = mb_substr($note, 0, 255 - 3) . ' â€¦ ';
1433             }
1434         }
1435
1436         // @todo Try to find location some othe way? Via goerss point?
1437
1438         return $location;
1439     }
1440
1441     protected static function getActivityObjectBio($object, $hints=array())
1442     {
1443         $bio  = null;
1444
1445         if (!empty($object->poco)) {
1446             $note = $object->poco->note;
1447         } else if (array_key_exists('bio', $hints)) {
1448             $note = $hints['bio'];
1449         }
1450
1451         if (!empty($note)) {
1452             if (Profile::bioTooLong($note)) {
1453                 // XXX: truncate ok?
1454                 $bio = mb_substr($note, 0, Profile::maxBio() - 3) . ' â€¦ ';
1455             } else {
1456                 $bio = $note;
1457             }
1458         }
1459
1460         // @todo Try to get bio info some other way?
1461
1462         return $bio;
1463     }
1464
1465     protected static function getActivityObjectNickname($object, $hints=array())
1466     {
1467         if ($object->poco) {
1468             if (!empty($object->poco->preferredUsername)) {
1469                 return common_nicknamize($object->poco->preferredUsername);
1470             }
1471         }
1472
1473         if (!empty($object->nickname)) {
1474             return common_nicknamize($object->nickname);
1475         }
1476
1477         if (array_key_exists('nickname', $hints)) {
1478             return $hints['nickname'];
1479         }
1480
1481         // Try the profile url (like foo.example.com or example.com/user/foo)
1482
1483         $profileUrl = ($object->link) ? $object->link : $hints['profileurl'];
1484
1485         if (!empty($profileUrl)) {
1486             $nickname = self::nicknameFromURI($profileUrl);
1487         }
1488
1489         // Try the URI (may be a tag:, http:, acct:, ...
1490
1491         if (empty($nickname)) {
1492             $nickname = self::nicknameFromURI($object->id);
1493         }
1494
1495         // Try a Webfinger if one was passed (way) down
1496
1497         if (empty($nickname)) {
1498             if (array_key_exists('webfinger', $hints)) {
1499                 $nickname = self::nicknameFromURI($hints['webfinger']);
1500             }
1501         }
1502
1503         // Try the name
1504
1505         if (empty($nickname)) {
1506             $nickname = common_nicknamize($object->title);
1507         }
1508
1509         return $nickname;
1510     }
1511
1512     protected static function nicknameFromURI($uri)
1513     {
1514         preg_match('/(\w+):/', $uri, $matches);
1515
1516         $protocol = $matches[1];
1517
1518         switch ($protocol) {
1519         case 'acct':
1520         case 'mailto':
1521             if (preg_match("/^$protocol:(.*)?@.*\$/", $uri, $matches)) {
1522                 return common_canonical_nickname($matches[1]);
1523             }
1524             return null;
1525         case 'http':
1526             return common_url_to_nickname($uri);
1527             break;
1528         default:
1529             return null;
1530         }
1531     }
1532
1533     /**
1534      * Look up, and if necessary create, an Ostatus_profile for the remote
1535      * entity with the given webfinger address.
1536      * This should never return null -- you will either get an object or
1537      * an exception will be thrown.
1538      *
1539      * @param string $addr webfinger address
1540      * @return Ostatus_profile
1541      * @throws Exception on error conditions
1542      */
1543     public static function ensureWebfinger($addr)
1544     {
1545         // First, try the cache
1546
1547         $uri = self::cacheGet(sprintf('ostatus_profile:webfinger:%s', $addr));
1548
1549         if ($uri !== false) {
1550             if (is_null($uri)) {
1551                 // Negative cache entry
1552                 throw new Exception('Not a valid webfinger address.');
1553             }
1554             $oprofile = Ostatus_profile::staticGet('uri', $uri);
1555             if (!empty($oprofile)) {
1556                 return $oprofile;
1557             }
1558         }
1559
1560         // Try looking it up
1561
1562         $oprofile = Ostatus_profile::staticGet('uri', 'acct:'.$addr);
1563
1564         if (!empty($oprofile)) {
1565             self::cacheSet(sprintf('ostatus_profile:webfinger:%s', $addr), $oprofile->uri);
1566             return $oprofile;
1567         }
1568
1569         // Now, try some discovery
1570
1571         $disco = new Discovery();
1572
1573         try {
1574             $xrd = $disco->lookup($addr);
1575         } catch (Exception $e) {
1576             // Save negative cache entry so we don't waste time looking it up again.
1577             // @fixme distinguish temporary failures?
1578             self::cacheSet(sprintf('ostatus_profile:webfinger:%s', $addr), null);
1579             throw new Exception('Not a valid webfinger address.');
1580         }
1581
1582         $hints = array('webfinger' => $addr);
1583
1584         $dhints = DiscoveryHints::fromXRD($xrd);
1585
1586         $hints = array_merge($hints, $dhints);
1587
1588         // If there's an Hcard, let's grab its info
1589
1590         if (array_key_exists('hcard', $hints)) {
1591             if (!array_key_exists('profileurl', $hints) ||
1592                 $hints['hcard'] != $hints['profileurl']) {
1593                 $hcardHints = DiscoveryHints::fromHcardUrl($hints['hcard']);
1594                 $hints = array_merge($hcardHints, $hints);
1595             }
1596         }
1597
1598         // If we got a feed URL, try that
1599
1600         if (array_key_exists('feedurl', $hints)) {
1601             try {
1602                 common_log(LOG_INFO, "Discovery on acct:$addr with feed URL " . $hints['feedurl']);
1603                 $oprofile = self::ensureFeedURL($hints['feedurl'], $hints);
1604                 self::cacheSet(sprintf('ostatus_profile:webfinger:%s', $addr), $oprofile->uri);
1605                 return $oprofile;
1606             } catch (Exception $e) {
1607                 common_log(LOG_WARNING, "Failed creating profile from feed URL '$feedUrl': " . $e->getMessage());
1608                 // keep looking
1609             }
1610         }
1611
1612         // If we got a profile page, try that!
1613
1614         if (array_key_exists('profileurl', $hints)) {
1615             try {
1616                 common_log(LOG_INFO, "Discovery on acct:$addr with profile URL $profileUrl");
1617                 $oprofile = self::ensureProfileURL($hints['profileurl'], $hints);
1618                 self::cacheSet(sprintf('ostatus_profile:webfinger:%s', $addr), $oprofile->uri);
1619                 return $oprofile;
1620             } catch (Exception $e) {
1621                 common_log(LOG_WARNING, "Failed creating profile from profile URL '$profileUrl': " . $e->getMessage());
1622                 // keep looking
1623             }
1624         }
1625
1626         // XXX: try hcard
1627         // XXX: try FOAF
1628
1629         if (array_key_exists('salmon', $hints)) {
1630
1631             $salmonEndpoint = $hints['salmon'];
1632
1633             // An account URL, a salmon endpoint, and a dream? Not much to go
1634             // on, but let's give it a try
1635
1636             $uri = 'acct:'.$addr;
1637
1638             $profile = new Profile();
1639
1640             $profile->nickname = self::nicknameFromUri($uri);
1641             $profile->created  = common_sql_now();
1642
1643             if (isset($profileUrl)) {
1644                 $profile->profileurl = $profileUrl;
1645             }
1646
1647             $profile_id = $profile->insert();
1648
1649             if (!$profile_id) {
1650                 common_log_db_error($profile, 'INSERT', __FILE__);
1651                 throw new Exception("Couldn't save profile for '$addr'");
1652             }
1653
1654             $oprofile = new Ostatus_profile();
1655
1656             $oprofile->uri        = $uri;
1657             $oprofile->salmonuri  = $salmonEndpoint;
1658             $oprofile->profile_id = $profile_id;
1659             $oprofile->created    = common_sql_now();
1660
1661             if (isset($feedUrl)) {
1662                 $profile->feeduri = $feedUrl;
1663             }
1664
1665             $result = $oprofile->insert();
1666
1667             if (!$result) {
1668                 common_log_db_error($oprofile, 'INSERT', __FILE__);
1669                 throw new Exception("Couldn't save ostatus_profile for '$addr'");
1670             }
1671
1672             self::cacheSet(sprintf('ostatus_profile:webfinger:%s', $addr), $oprofile->uri);
1673             return $oprofile;
1674         }
1675
1676         throw new Exception("Couldn't find a valid profile for '$addr'");
1677     }
1678
1679     /**
1680      * Store the full-length scrubbed HTML of a remote notice to an attachment
1681      * file on our server. We'll link to this at the end of the cropped version.
1682      *
1683      * @param string $title plaintext for HTML page's title
1684      * @param string $rendered HTML fragment for HTML page's body
1685      * @return File
1686      */
1687     function saveHTMLFile($title, $rendered)
1688     {
1689         $final = sprintf("<!DOCTYPE html>\n<html><head><title>%s</title></head>".
1690                          '<body>%s</body></html>',
1691                          htmlspecialchars($title),
1692                          $rendered);
1693
1694         $filename = File::filename($this->localProfile(),
1695                                    'ostatus', // ignored?
1696                                    'text/html');
1697
1698         $filepath = File::path($filename);
1699
1700         file_put_contents($filepath, $final);
1701
1702         $file = new File;
1703
1704         $file->filename = $filename;
1705         $file->url      = File::url($filename);
1706         $file->size     = filesize($filepath);
1707         $file->date     = time();
1708         $file->mimetype = 'text/html';
1709
1710         $file_id = $file->insert();
1711
1712         if ($file_id === false) {
1713             common_log_db_error($file, "INSERT", __FILE__);
1714             throw new ServerException(_('Could not store HTML content of long post as file.'));
1715         }
1716
1717         return $file;
1718     }
1719 }