]> git.mxchange.org Git - quix0rs-gnu-social.git/blobdiff - scripts/twitterstatusfetcher.php
Merge branch 'master' into 0.8.x
[quix0rs-gnu-social.git] / scripts / twitterstatusfetcher.php
old mode 100644 (file)
new mode 100755 (executable)
index 5275a45..e1745cf
@@ -1,8 +1,8 @@
 #!/usr/bin/env php
 <?php
-/*
+/**
  * Laconica - a distributed open-source microblogging tool
- * Copyright (C) 2008, Controlez-Vous, Inc.
+ * Copyright (C) 2008, 2009, Control Yourself, Inc.
  *
  * This program is free software: you can redistribute it and/or modify
  * it under the terms of the GNU Affero General Public License as published by
  * along with this program.     If not, see <http://www.gnu.org/licenses/>.
  */
 
-// Abort if called from a web server
-if (isset($_SERVER) && array_key_exists('REQUEST_METHOD', $_SERVER)) {
-    print "This script must be run from the command line\n";
-    exit();
-}
-
 define('INSTALLDIR', realpath(dirname(__FILE__) . '/..'));
-define('LACONICA', true);
 
 // Tune number of processes and how often to poll Twitter
 // XXX: Should these things be in config.php?
 define('MAXCHILDREN', 2);
 define('POLL_INTERVAL', 60); // in seconds
 
-// Uncomment this to get useful console output
-define('SCRIPT_DEBUG', true);
+$shortoptions = 'di::';
+$longoptions = array('id::', 'debug');
+
+$helptext = <<<END_OF_TRIM_HELP
+Batch script for retrieving Twitter messages from foreign service.
+
+  -i --id              Identity (default 'generic')
+  -d --debug           Debug (lots of log output)
+
+END_OF_TRIM_HELP;
+
+require_once INSTALLDIR .'/scripts/commandline.inc';
+require_once INSTALLDIR . '/lib/daemon.php';
+
+/**
+ * Fetcher for statuses from Twitter
+ *
+ * Fetches statuses from Twitter and inserts them as notices in local
+ * system.
+ *
+ * @category Twitter
+ * @package  Laconica
+ * @author   Zach Copley <zach@controlyourself.ca>
+ * @author   Evan Prodromou <evan@controlyourself.ca>
+ * @license  http://www.fsf.org/licensing/licenses/agpl-3.0.html GNU Affero General Public License version 3.0
+ * @link     http://laconi.ca/
+ */
 
-require_once(INSTALLDIR . '/lib/common.php');
-require_once(INSTALLDIR . '/lib/daemon.php');
+// NOTE: an Avatar path MUST be set in config.php for this
+// script to work: e.g.: $config['avatar']['path'] = '/laconica/avatar';
 
 class TwitterStatusFetcher extends Daemon
 {
+    private $_children = array();
+
+    function __construct($id=null, $daemonize=true)
+    {
+        parent::__construct($daemonize);
+
+        if ($id) {
+            $this->set_id($id);
+        }
+    }
 
-    private $children = array();
+    /**
+     * Name of this daemon
+     *
+     * @return string Name of the daemon.
+     */
 
     function name()
     {
-        return 'twitterstatusfetcher';
+        return ('twitterstatusfetcher.'.$this->_id);
     }
 
+    /**
+     * Run the daemon
+     *
+     * @return void
+     */
+
     function run()
     {
+        if (defined('SCRIPT_DEBUG')) {
+            common_debug($this->name() .
+                ': debugging log output enabled.');
+        }
+
         do {
 
             $flinks = $this->refreshFlinks();
 
-            foreach ($flinks as $f){
+            foreach ($flinks as $f) {
 
                 // We have to disconnect from the DB before forking so
                 // each sub-process will open its own connection and
@@ -72,13 +115,12 @@ class TwitterStatusFetcher extends Daemon
                 if ($pid) {
 
                     // Parent
-                    common_debug("Parent: forked new status fetcher process " . $pid);
-
                     if (defined('SCRIPT_DEBUG')) {
-                        print "Parent: forked fetcher process " . $pid . "\n";
+                        common_debug("Parent: forked new status ".
+                                     " fetcher process " . $pid);
                     }
 
-                    $this->children[] = $pid;
+                    $this->_children[] = $pid;
 
                 } else {
 
@@ -88,81 +130,84 @@ class TwitterStatusFetcher extends Daemon
                 }
 
                 // Remove child from ps list as it finishes
-                while(($c = pcntl_wait($status, WNOHANG OR WUNTRACED)) > 0) {
-
-                    common_debug("Child $c finished.");
+                while (($c = pcntl_wait($status, WNOHANG OR WUNTRACED)) > 0) {
 
                     if (defined('SCRIPT_DEBUG')) {
-                        print "Child $c finished.\n";
+                        common_debug("Child $c finished.");
                     }
 
-                    $this->remove_ps($this->children, $c);
+                    $this->removePs($this->_children, $c);
                 }
 
                 // Wait! We have too many damn kids.
-                if (sizeof($this->children) > MAXCHILDREN) {
-
-                    common_debug('Too many children. Waiting...');
+                if (sizeof($this->_children) > MAXCHILDREN) {
 
                     if (defined('SCRIPT_DEBUG')) {
-                        print "Too many children. Waiting...\n";
+                        common_debug('Too many children. Waiting...');
                     }
 
-                    if (($c = pcntl_wait($status, WUNTRACED)) > 0){
-
-                        common_debug("Finished waiting for $c");
+                    if (($c = pcntl_wait($status, WUNTRACED)) > 0) {
 
                         if (defined('SCRIPT_DEBUG')) {
-                            print "Finished waiting for $c\n";
+                            common_debug("Finished waiting for $c");
                         }
 
-                        $this->remove_ps($this->children, $c);
+                        $this->removePs($this->_children, $c);
                     }
                 }
             }
 
             // Remove all children from the process list before restarting
-            while(($c = pcntl_wait($status, WUNTRACED)) > 0) {
-
-                common_debug("Child $c finished.");
+            while (($c = pcntl_wait($status, WUNTRACED)) > 0) {
 
                 if (defined('SCRIPT_DEBUG')) {
-                    print "Child $c finished.\n";
+                    common_debug("Child $c finished.");
                 }
 
-                $this->remove_ps($this->children, $c);
+                $this->removePs($this->_children, $c);
             }
 
             // Rest for a bit before we fetch more statuses
-            common_debug('Waiting ' . POLL_INTERVAL .
-                ' secs before hitting Twitter again.');
+
             if (defined('SCRIPT_DEBUG')) {
-                print 'Waiting ' . POLL_INTERVAL .
-                    " secs before hitting Twitter again.\n";
+                common_debug('Waiting ' . POLL_INTERVAL .
+                    ' secs before hitting Twitter again.');
             }
 
-            sleep(POLL_INTERVAL);
+            if (POLL_INTERVAL > 0) {
+                sleep(POLL_INTERVAL);
+            }
 
         } while (true);
     }
 
-    function refreshFlinks() {
+    /**
+     * Refresh the foreign links for this user
+     *
+     * @return void
+     */
 
+    function refreshFlinks()
+    {
         $flink = new Foreign_link();
+
         $flink->service = 1; // Twitter
+
         $flink->orderBy('last_noticesync');
 
         $cnt = $flink->find();
 
         if (defined('SCRIPT_DEBUG')) {
-            print "Updating Twitter friends subscriptions for $cnt users.\n";
+            common_debug('Updating Twitter friends subscriptions' .
+                " for $cnt users.");
         }
 
         $flinks = array();
 
         while ($flink->fetch()) {
 
-            if (($flink->noticesync & FOREIGN_NOTICE_RECV) == FOREIGN_NOTICE_RECV) {
+            if (($flink->noticesync & FOREIGN_NOTICE_RECV) ==
+                FOREIGN_NOTICE_RECV) {
                 $flinks[] = clone($flink);
             }
         }
@@ -173,7 +218,18 @@ class TwitterStatusFetcher extends Daemon
         return $flinks;
     }
 
-    function remove_ps(&$plist, $ps){
+    /**
+     * Unknown
+     *
+     * @param array  &$plist unknown.
+     * @param string $ps     unknown.
+     *
+     * @return unknown
+     * @todo document
+     */
+
+    function removePs(&$plist, $ps)
+    {
         for ($i = 0; $i < sizeof($plist); $i++) {
             if ($plist[$i] == $ps) {
                 unset($plist[$i]);
@@ -185,32 +241,29 @@ class TwitterStatusFetcher extends Daemon
 
     function getTimeline($flink)
     {
-
         if (empty($flink)) {
-            common_log(LOG_WARNING, "Can't retrieve Foreign_link for foreign ID $fid");
-            if (defined('SCRIPT_DEBUG')) {
-                print "Can't retrieve Foreign_link for foreign ID $fid\n";
-            }
+            common_log(LOG_WARNING,
+                "Can't retrieve Foreign_link for foreign ID $fid");
             return;
         }
 
         $fuser = $flink->getForeignUser();
 
         if (empty($fuser)) {
-            common_log(LOG_WARNING, "Unmatched user for ID " . $flink->user_id);
-            if (defined('SCRIPT_DEBUG')) {
-                print "Unmatched user for ID $flink->user_id\n";
-            }
+            common_log(LOG_WARNING, "Unmatched user for ID " .
+                $flink->user_id);
             return;
         }
 
-        common_debug('Trying to get timeline for Twitter user ' .
-            "$fuser->nickname ($flink->foreign_id).");
         if (defined('SCRIPT_DEBUG')) {
-            print 'Trying to get timeline for Twitter user ' .
-                "$fuser->nickname ($flink->foreign_id).\n";
+            common_debug('Trying to get timeline for Twitter user ' .
+                "$fuser->nickname ($flink->foreign_id).");
         }
 
+        // XXX: Biggest remaining issue - How do we know at which status
+        // to start importing?  How many statuses?  Right now I'm going
+        // with the default last 20.
+
         $url = 'http://twitter.com/statuses/friends_timeline.json';
 
         $timeline_json = get_twitter_data($url, $fuser->nickname,
@@ -220,18 +273,20 @@ class TwitterStatusFetcher extends Daemon
 
         if (empty($timeline)) {
             common_log(LOG_WARNING, "Empty timeline.");
-             if (defined('SCRIPT_DEBUG')) {
-                print "Empty timeline!\n";
-            }
             return;
         }
 
-        foreach ($timeline as $status) {
+        // Reverse to preserve order
+        foreach (array_reverse($timeline) as $status) {
 
-            // Hacktastic: filter out stuff coming from Laconica
+            // Hacktastic: filter out stuff coming from this Laconica
             $source = mb_strtolower(common_config('integration', 'source'));
 
             if (preg_match("/$source/", mb_strtolower($status->source))) {
+                if (defined('SCRIPT_DEBUG')) {
+                    common_debug('Skipping import of status ' . $status->id .
+                        ' with source ' . $source);
+                }
                 continue;
             }
 
@@ -239,7 +294,6 @@ class TwitterStatusFetcher extends Daemon
         }
 
         // Okay, record the time we synced with Twitter for posterity
-
         $flink->last_noticesync = common_sql_now();
         $flink->update();
     }
@@ -250,71 +304,49 @@ class TwitterStatusFetcher extends Daemon
         $profile = Profile::staticGet($id);
 
         if (!$profile) {
-            common_log(LOG_ERR, 'Problem saving notice. No associated Profile.');
-            if (defined('SCRIPT_DEBUG')) {
-                print "Problem saving notice. No associated Profile.\n";
-            }
+            common_log(LOG_ERR,
+                'Problem saving notice. No associated Profile.');
             return null;
         }
 
+        // XXX: change of screen name?
+
         $uri = 'http://twitter.com/' . $status->user->screen_name .
             '/status/' . $status->id;
 
-        // Skip save if notice source is Laconica or Identi.ca?
-
         $notice = Notice::staticGet('uri', $uri);
 
         // check to see if we've already imported the status
+
         if (!$notice) {
 
             $notice = new Notice();
-            $notice->profile_id = $id;
-
-            $notice->query('BEGIN');
-
-            // XXX: figure out reply_to
-            $notice->reply_to = null;
-
-            // XXX: Should this be common_sql_now() instead of status create date?
-
-            $notice->created = strftime('%Y-%m-%d %H:%M:%S',
-                strtotime($status->created_at));
-            $notice->content = $status->text;
-            $notice->rendered = common_render_content($status->text, $notice);
-            $notice->source = 'twitter';
-            $notice->is_local = 0;
-            $notice->uri = $uri;
-
-            $notice_id = $notice->insert();
-
-            if (!$notice_id) {
-                common_log_db_error($notice, 'INSERT', __FILE__);
-                if (defined('SCRIPT_DEBUG')) {
-                    print "Could not save notice!\n";
-                }
-            }
-
-            // XXX: Figure out a better way to link replies?
-            $notice->saveReplies();
-
-            // XXX: Do we want to polute our tag cloud with hashtags from Twitter?
-            $notice->saveTags();
-            $notice->saveGroups();
-
-            $notice->query('COMMIT');
 
-            if (defined('SCRIPT_DEBUG')) {
-                print "Saved status $status->id as notice $notice->id.\n";
+            $notice->profile_id = $id;
+            $notice->uri        = $uri;
+            $notice->created    = strftime('%Y-%m-%d %H:%M:%S',
+                                           strtotime($status->created_at));
+            $notice->content    = common_shorten_links($status->text); // XXX
+            $notice->rendered   = common_render_content($notice->content, $notice);
+            $notice->source     = 'twitter';
+            $notice->reply_to   = null; // XXX lookup reply
+            $notice->is_local   = Notice::GATEWAY;
+
+            if (Event::handle('StartNoticeSave', array(&$notice))) {
+                $id = $notice->insert();
+                Event::handle('EndNoticeSave', array($notice));
             }
         }
 
-        if (!Notice_inbox::staticGet('notice_id', $notice->id)) {
-
+        if (!Notice_inbox::pkeyGet(array('notice_id' => $notice->id,
+                                         'user_id' => $flink->user_id))) {
             // Add to inbox
             $inbox = new Notice_inbox();
-            $inbox->user_id = $flink->user_id;
+
+            $inbox->user_id   = $flink->user_id;
             $inbox->notice_id = $notice->id;
-            $inbox->created = common_sql_now();
+            $inbox->created   = $notice->created;
+            $inbox->source    = NOTICE_INBOX_SOURCE_GATEWAY; // From a private source
 
             $inbox->insert();
         }
@@ -327,18 +359,19 @@ class TwitterStatusFetcher extends Daemon
         $profile = Profile::staticGet('profileurl', $profileurl);
 
         if ($profile) {
-            common_debug("Profile for $profile->nickname found.");
+            if (defined('SCRIPT_DEBUG')) {
+                common_debug("Profile for $profile->nickname found.");
+            }
 
             // Check to see if the user's Avatar has changed
             $this->checkAvatar($user, $profile);
+
             return $profile->id;
 
         } else {
-            $debugmsg = 'Adding profile and remote profile ' .
-                "for Twitter user: $profileurl\n";
-            common_debug($debugmsg, __FILE__);
             if (defined('SCRIPT_DEBUG')) {
-                print $debugmsg;
+                common_debug('Adding profile and remote profile ' .
+                    "for Twitter user: $profileurl");
             }
 
             $profile = new Profile();
@@ -356,10 +389,6 @@ class TwitterStatusFetcher extends Daemon
 
             if (empty($id)) {
                 common_log_db_error($profile, 'INSERT', __FILE__);
-                if (defined('SCRIPT_DEBUG')) {
-                    print 'Could not insert Profile: ' .
-                        common_log_objstring($profile) . "\n";
-                }
                 $profile->query("ROLLBACK");
                 return false;
             }
@@ -379,10 +408,6 @@ class TwitterStatusFetcher extends Daemon
 
                 if (empty($rid)) {
                     common_log_db_error($profile, 'INSERT', __FILE__);
-                    if (defined('SCRIPT_DEBUG')) {
-                        print 'Could not insert Remote_profile: ' .
-                            common_log_objstring($remote_pro) . "\n";
-                    }
                     $profile->query("ROLLBACK");
                     return false;
                 }
@@ -396,42 +421,75 @@ class TwitterStatusFetcher extends Daemon
         }
     }
 
-    function checkAvatar($user, $profile)
+    function checkAvatar($twitter_user, $profile)
     {
         global $config;
 
-        $path_parts = pathinfo($user->profile_image_url);
-        $newname = 'Twitter_' . $user->id . '_' .
+        $path_parts = pathinfo($twitter_user->profile_image_url);
+
+        $newname = 'Twitter_' . $twitter_user->id . '_' .
             $path_parts['basename'];
 
         $oldname = $profile->getAvatar(48)->filename;
 
         if ($newname != $oldname) {
 
-            common_debug("Avatar for Twitter user $profile->nickname has changed.");
-            common_debug("old: $oldname new: $newname");
+            if (defined('SCRIPT_DEBUG')) {
+                common_debug('Avatar for Twitter user ' .
+                    "$profile->nickname has changed.");
+                common_debug("old: $oldname new: $newname");
+            }
+
+            $this->updateAvatars($twitter_user, $profile);
+        }
+
+        if ($this->missingAvatarFile($profile)) {
 
             if (defined('SCRIPT_DEBUG')) {
-                print "Avatar for Twitter user $user->id has changed.\n";
-                print "old: $oldname\n";
-                print "new: $newname\n";
+                common_debug('Twitter user ' . $profile->nickname .
+                    ' is missing one or more local avatars.');
+                common_debug("old: $oldname new: $newname");
             }
 
-            $img_root = substr($path_parts['basename'], 0, -11);
-            $ext = $path_parts['extension'];
-            $mediatype = $this->getMediatype($ext);
+            $this->updateAvatars($twitter_user, $profile);
+        }
 
-            foreach (array('mini', 'normal', 'bigger') as $size) {
-                $url = $path_parts['dirname'] . '/' .
-                    $img_root . '_' . $size . ".$ext";
-                $filename = 'Twitter_' . $user->id . '_' .
-                    $img_root . "_$size.$ext";
+    }
 
-                if ($this->fetchAvatar($url, $filename)) {
-                    $this->updateAvatar($profile->id, $size, $mediatype, $filename);
-                }
+    function updateAvatars($twitter_user, $profile) {
+
+        global $config;
+
+        $path_parts = pathinfo($twitter_user->profile_image_url);
+
+        $img_root = substr($path_parts['basename'], 0, -11);
+        $ext = $path_parts['extension'];
+        $mediatype = $this->getMediatype($ext);
+
+        foreach (array('mini', 'normal', 'bigger') as $size) {
+            $url = $path_parts['dirname'] . '/' .
+                $img_root . '_' . $size . ".$ext";
+            $filename = 'Twitter_' . $twitter_user->id . '_' .
+                $img_root . "_$size.$ext";
+
+            $this->updateAvatar($profile->id, $size, $mediatype, $filename);
+            $this->fetchAvatar($url, $filename);
+        }
+    }
+
+    function missingAvatarFile($profile) {
+
+        foreach (array(24, 48, 73) as $size) {
+
+            $filename = $profile->getAvatar($size)->filename;
+            $avatarpath = Avatar::path($filename);
+
+            if (file_exists($avatarpath) == FALSE) {
+                return true;
             }
         }
+
+        return false;
     }
 
     function getMediatype($ext)
@@ -472,26 +530,21 @@ class TwitterStatusFetcher extends Daemon
                 $this->newAvatar($id, $size, $mediatype, $filename);
             } else {
                 common_log(LOG_WARNING, "Problem fetching Avatar: $url", __FILE__);
-                if (defined('SCRIPT_DEBUG')) {
-                    print "Problem fetching Avatar: $url\n";
-                }
             }
         }
     }
 
     function updateAvatar($profile_id, $size, $mediatype, $filename) {
 
-        common_debug("Updating avatar: $size");
         if (defined('SCRIPT_DEBUG')) {
-            print "Updating avatar: $size\n";
+            common_debug("Updating avatar: $size");
         }
 
         $profile = Profile::staticGet($profile_id);
 
-        if (!$profile) {
-            common_debug("Couldn't get profile: $profile_id!");
+        if (empty($profile)) {
             if (defined('SCRIPT_DEBUG')) {
-                print "Couldn't get profile: $profile_id!\n";
+                common_debug("Couldn't get profile: $profile_id!");
             }
             return;
         }
@@ -499,9 +552,8 @@ class TwitterStatusFetcher extends Daemon
         $sizes = array('mini' => 24, 'normal' => 48, 'bigger' => 73);
         $avatar = $profile->getAvatar($sizes[$size]);
 
+        // Delete the avatar, if present
         if ($avatar) {
-            common_debug("Deleting $size avatar for $profile->nickname.");
-            @unlink(INSTALLDIR . '/avatar/' . $avatar->filename);
             $avatar->delete();
         }
 
@@ -538,27 +590,21 @@ class TwitterStatusFetcher extends Daemon
         $avatar->filename = $filename;
         $avatar->url = Avatar::url($filename);
 
-        common_debug("new filename: $avatar->url");
         if (defined('SCRIPT_DEBUG')) {
-            print "New filename: $avatar->url\n";
+            common_debug("new filename: $avatar->url");
         }
 
         $avatar->created = common_sql_now();
 
         $id = $avatar->insert();
 
-        if (!$id) {
+        if (empty($id)) {
             common_log_db_error($avatar, 'INSERT', __FILE__);
-            if (defined('SCRIPT_DEBUG')) {
-                print "Could not insert avatar!\n";
-            }
-
             return null;
         }
 
-        common_debug("Saved new $size avatar for $profile_id.");
         if (defined('SCRIPT_DEBUG')) {
-              print "Saved new $size avatar for $profile_id.\n";
+            common_debug("Saved new $size avatar for $profile_id.");
         }
 
         return $id;
@@ -573,15 +619,11 @@ class TwitterStatusFetcher extends Daemon
         $out = fopen($avatarfile, 'wb');
         if (!$out) {
             common_log(LOG_WARNING, "Couldn't open file $filename", __FILE__);
-            if (defined('SCRIPT_DEBUG')) {
-                print "Couldn't open file! $filename\n";
-            }
             return false;
         }
 
-        common_debug("Fetching avatar: $url", __FILE__);
         if (defined('SCRIPT_DEBUG')) {
-            print "Fetching avatar from Twitter: $url\n";
+            common_debug("Fetching avatar: $url");
         }
 
         $ch = curl_init();
@@ -599,12 +641,22 @@ class TwitterStatusFetcher extends Daemon
     }
 }
 
-ini_set("max_execution_time", "0");
-ini_set("max_input_time", "0");
-set_time_limit(0);
-mb_internal_encoding('UTF-8');
 declare(ticks = 1);
 
-$fetcher = new TwitterStatusFetcher();
+if (have_option('i')) {
+    $id = get_option_value('i');
+} else if (have_option('--id')) {
+    $id = get_option_value('--id');
+} else if (count($args) > 0) {
+    $id = $args[0];
+} else {
+    $id = null;
+}
+
+if (have_option('d') || have_option('debug')) {
+    define('SCRIPT_DEBUG', true);
+}
+
+$fetcher = new TwitterStatusFetcher($id);
 $fetcher->runOnce();