Merge pull request #2796 from elfiesmelfie/feat_ipmi_SEL_ignore_list
[collectd.git] / src / mcelog.c
1 /*-
2  * collectd - src/mcelog.c
3  * MIT License
4  *
5  * Copyright(c) 2016-2017 Intel Corporation. All rights reserved.
6  *
7  * Permission is hereby granted, free of charge, to any person obtaining a
8  * copy of this software and associated documentation files (the "Software"),
9  * to deal in the Software without restriction, including without limitation
10  * the rights to use, copy, modify, merge, publish, distribute, sublicense,
11  * and/or sell copies of the Software, and to permit persons to whom the
12  * Software is furnished to do so, subject to the following conditions:
13  *
14  * The above copyright notice and this permission notice shall be included in
15  * all copies or substantial portions of the Software.
16  *
17  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
18  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
19  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
20  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
21  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
22  * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
23  * DEALINGS IN THE SOFTWARE.
24
25  * Authors:
26  *   Maryam Tahhan <maryam.tahhan@intel.com>
27  *   Volodymyr Mytnyk <volodymyrx.mytnyk@intel.com>
28  *   Taras Chornyi <tarasx.chornyi@intel.com>
29  *   Krzysztof Matczak <krzysztofx.matczak@intel.com>
30  */
31
32 #include "collectd.h"
33
34 #include "common.h"
35 #include "utils_llist.h"
36
37 #include <poll.h>
38 #include <sys/socket.h>
39 #include <sys/un.h>
40 #include <unistd.h>
41
42 #define MCELOG_PLUGIN "mcelog"
43 #define MCELOG_BUFF_SIZE 1024
44 #define MCELOG_POLL_TIMEOUT 1000 /* ms */
45 #define MCELOG_SOCKET_STR "SOCKET"
46 #define MCELOG_DIMM_NAME "DMI_NAME"
47 #define MCELOG_CORRECTED_ERR "corrected memory errors"
48 #define MCELOG_UNCORRECTED_ERR "uncorrected memory errors"
49 #define MCELOG_CORRECTED_ERR_TIMED "corrected memory timed errors"
50 #define MCELOG_UNCORRECTED_ERR_TIMED "uncorrected memory timed errors"
51 #define MCELOG_CORRECTED_ERR_TYPE_INS "corrected_memory_errors"
52 #define MCELOG_UNCORRECTED_ERR_TYPE_INS "uncorrected_memory_errors"
53
54 typedef struct mcelog_config_s {
55   char logfile[PATH_MAX];     /* mcelog logfile */
56   pthread_t tid;              /* poll thread id */
57   llist_t *dimms_list;        /* DIMMs list */
58   pthread_mutex_t dimms_lock; /* lock for dimms cache */
59   bool persist;
60 } mcelog_config_t;
61
62 typedef struct socket_adapter_s socket_adapter_t;
63
64 struct socket_adapter_s {
65   int sock_fd;                  /* mcelog server socket fd */
66   struct sockaddr_un unix_sock; /* mcelog client socket */
67   pthread_rwlock_t lock;
68   /* function pointers for socket operations */
69   int (*write)(socket_adapter_t *self, const char *msg, const size_t len);
70   int (*reinit)(socket_adapter_t *self);
71   int (*receive)(socket_adapter_t *self, FILE **p_file);
72   int (*close)(socket_adapter_t *self);
73 };
74
75 typedef struct mcelog_memory_rec_s {
76   int corrected_err_total; /* x total*/
77   int corrected_err_timed; /* x in 24h*/
78   char corrected_err_timed_period[DATA_MAX_NAME_LEN / 2];
79   int uncorrected_err_total; /* x total*/
80   int uncorrected_err_timed; /* x in 24h*/
81   char uncorrected_err_timed_period[DATA_MAX_NAME_LEN / 2];
82   char location[DATA_MAX_NAME_LEN / 2];  /* SOCKET x CHANNEL x DIMM x*/
83   char dimm_name[DATA_MAX_NAME_LEN / 2]; /* DMI_NAME "DIMM_F1" */
84 } mcelog_memory_rec_t;
85
86 static int socket_close(socket_adapter_t *self);
87 static int socket_write(socket_adapter_t *self, const char *msg,
88                         const size_t len);
89 static int socket_reinit(socket_adapter_t *self);
90 static int socket_receive(socket_adapter_t *self, FILE **p_file);
91
92 static mcelog_config_t g_mcelog_config = {
93     .logfile = "/var/log/mcelog", .persist = false,
94 };
95
96 static socket_adapter_t socket_adapter = {
97     .sock_fd = -1,
98     .unix_sock =
99         {
100             .sun_family = AF_UNIX, .sun_path = "/var/run/mcelog-client",
101         },
102     .lock = PTHREAD_RWLOCK_INITIALIZER,
103     .close = socket_close,
104     .write = socket_write,
105     .reinit = socket_reinit,
106     .receive = socket_receive,
107 };
108
109 static bool mcelog_thread_running;
110 static bool mcelog_apply_defaults;
111
112 static void mcelog_free_dimms_list_records(llist_t *dimms_list) {
113
114   for (llentry_t *e = llist_head(dimms_list); e != NULL; e = e->next) {
115     sfree(e->key);
116     sfree(e->value);
117   }
118 }
119
120 /* Create or get dimm by dimm name/location */
121 static llentry_t *mcelog_dimm(const mcelog_memory_rec_t *rec,
122                               llist_t *dimms_list) {
123
124   char dimm_name[DATA_MAX_NAME_LEN];
125
126   if (strlen(rec->dimm_name) > 0) {
127     snprintf(dimm_name, sizeof(dimm_name), "%s_%s", rec->location,
128              rec->dimm_name);
129   } else
130     sstrncpy(dimm_name, rec->location, sizeof(dimm_name));
131
132   llentry_t *dimm_le = llist_search(g_mcelog_config.dimms_list, dimm_name);
133
134   if (dimm_le != NULL)
135     return dimm_le;
136
137   /* allocate new linked list entry */
138   mcelog_memory_rec_t *dimm_mr = calloc(1, sizeof(*dimm_mr));
139   if (dimm_mr == NULL) {
140     ERROR(MCELOG_PLUGIN ": Error allocating dimm memory item");
141     return NULL;
142   }
143   char *p_name = strdup(dimm_name);
144   if (p_name == NULL) {
145     ERROR(MCELOG_PLUGIN ": strdup: error");
146     free(dimm_mr);
147     return NULL;
148   }
149
150   /* add new dimm */
151   dimm_le = llentry_create(p_name, dimm_mr);
152   if (dimm_le == NULL) {
153     ERROR(MCELOG_PLUGIN ": llentry_create(): error");
154     free(dimm_mr);
155     free(p_name);
156     return NULL;
157   }
158   pthread_mutex_lock(&g_mcelog_config.dimms_lock);
159   llist_append(g_mcelog_config.dimms_list, dimm_le);
160   pthread_mutex_unlock(&g_mcelog_config.dimms_lock);
161
162   return dimm_le;
163 }
164
165 static void mcelog_update_dimm_stats(llentry_t *dimm,
166                                      const mcelog_memory_rec_t *rec) {
167   pthread_mutex_lock(&g_mcelog_config.dimms_lock);
168   memcpy(dimm->value, rec, sizeof(mcelog_memory_rec_t));
169   pthread_mutex_unlock(&g_mcelog_config.dimms_lock);
170 }
171
172 static int mcelog_config(oconfig_item_t *ci) {
173   int use_logfile = 0, use_memory = 0;
174   for (int i = 0; i < ci->children_num; i++) {
175     oconfig_item_t *child = ci->children + i;
176     if (strcasecmp("McelogLogfile", child->key) == 0) {
177       use_logfile = 1;
178       if (use_memory) {
179         ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\", Memory "
180                             "option is already configured.",
181               child->key);
182         return -1;
183       }
184       if (cf_util_get_string_buffer(child, g_mcelog_config.logfile,
185                                     sizeof(g_mcelog_config.logfile)) < 0) {
186         ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\".",
187               child->key);
188         return -1;
189       }
190       memset(socket_adapter.unix_sock.sun_path, 0,
191              sizeof(socket_adapter.unix_sock.sun_path));
192     } else if (strcasecmp("Memory", child->key) == 0) {
193       if (use_logfile) {
194         ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\", Logfile "
195                             "option is already configured.",
196               child->key);
197         return -1;
198       }
199       use_memory = 1;
200       for (int j = 0; j < child->children_num; j++) {
201         oconfig_item_t *mem_child = child->children + j;
202         if (strcasecmp("McelogClientSocket", mem_child->key) == 0) {
203           if (cf_util_get_string_buffer(
204                   mem_child, socket_adapter.unix_sock.sun_path,
205                   sizeof(socket_adapter.unix_sock.sun_path)) < 0) {
206             ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\".",
207                   mem_child->key);
208             return -1;
209           }
210         } else if (strcasecmp("PersistentNotification", mem_child->key) == 0) {
211           if (cf_util_get_boolean(mem_child, &g_mcelog_config.persist) < 0) {
212             ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\".",
213                   mem_child->key);
214             return -1;
215           }
216         } else {
217           ERROR(MCELOG_PLUGIN ": Invalid Memory configuration option: \"%s\".",
218                 mem_child->key);
219           return -1;
220         }
221       }
222       memset(g_mcelog_config.logfile, 0, sizeof(g_mcelog_config.logfile));
223     } else {
224       ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\".",
225             child->key);
226       return -1;
227     }
228   }
229
230   if (!use_logfile && !use_memory)
231     mcelog_apply_defaults = 1;
232
233   return 0;
234 }
235
236 static int socket_close(socket_adapter_t *self) {
237   int ret = 0;
238   pthread_rwlock_rdlock(&self->lock);
239   if (fcntl(self->sock_fd, F_GETFL) != -1) {
240     if (shutdown(self->sock_fd, SHUT_RDWR) != 0) {
241       ERROR(MCELOG_PLUGIN ": Socket shutdown failed: %s", STRERRNO);
242       ret = -1;
243     }
244     if (close(self->sock_fd) != 0) {
245       ERROR(MCELOG_PLUGIN ": Socket close failed: %s", STRERRNO);
246       ret = -1;
247     }
248   }
249   pthread_rwlock_unlock(&self->lock);
250   return ret;
251 }
252
253 static int socket_write(socket_adapter_t *self, const char *msg,
254                         const size_t len) {
255   int ret = 0;
256   pthread_rwlock_rdlock(&self->lock);
257   if (swrite(self->sock_fd, msg, len) != 0)
258     ret = -1;
259   pthread_rwlock_unlock(&self->lock);
260   return ret;
261 }
262
263 static void mcelog_dispatch_notification(notification_t *n) {
264   if (!n) {
265     ERROR(MCELOG_PLUGIN ": %s: NULL pointer", __FUNCTION__);
266     return;
267   }
268
269   sstrncpy(n->host, hostname_g, sizeof(n->host));
270   sstrncpy(n->type, "gauge", sizeof(n->type));
271   plugin_dispatch_notification(n);
272   if (n->meta)
273     plugin_notification_meta_free(n->meta);
274 }
275
276 static int socket_reinit(socket_adapter_t *self) {
277   int ret = -1;
278   cdtime_t interval = plugin_get_interval();
279   struct timeval socket_timeout = CDTIME_T_TO_TIMEVAL(interval);
280
281   /* synchronization via write lock since sock_fd may be changed here */
282   pthread_rwlock_wrlock(&self->lock);
283   self->sock_fd =
284       socket(PF_UNIX, SOCK_STREAM | SOCK_CLOEXEC | SOCK_NONBLOCK, 0);
285   if (self->sock_fd < 0) {
286     ERROR(MCELOG_PLUGIN ": Could not create a socket. %s", STRERRNO);
287     pthread_rwlock_unlock(&self->lock);
288     return ret;
289   }
290
291   /* Set socket timeout option */
292   if (setsockopt(self->sock_fd, SOL_SOCKET, SO_SNDTIMEO, &socket_timeout,
293                  sizeof(socket_timeout)) < 0)
294     ERROR(MCELOG_PLUGIN ": Failed to set the socket timeout option.");
295
296   /* downgrading to read lock due to possible recursive read locks
297    * in self->close(self) call */
298   pthread_rwlock_unlock(&self->lock);
299   pthread_rwlock_rdlock(&self->lock);
300   if (connect(self->sock_fd, (struct sockaddr *)&(self->unix_sock),
301               sizeof(self->unix_sock)) < 0) {
302     ERROR(MCELOG_PLUGIN ": Failed to connect to mcelog server. %s", STRERRNO);
303     self->close(self);
304     ret = -1;
305   } else {
306     ret = 0;
307     mcelog_dispatch_notification(
308         &(notification_t){.severity = NOTIF_OKAY,
309                           .time = cdtime(),
310                           .message = "Connected to mcelog server",
311                           .plugin = MCELOG_PLUGIN,
312                           .type_instance = "mcelog_status"});
313   }
314   pthread_rwlock_unlock(&self->lock);
315   return ret;
316 }
317
318 static int mcelog_dispatch_mem_notifications(const mcelog_memory_rec_t *mr) {
319   notification_t n = {.severity = NOTIF_WARNING,
320                       .time = cdtime(),
321                       .plugin = MCELOG_PLUGIN,
322                       .type = "errors"};
323
324   int dispatch_corrected_notifs = 0, dispatch_uncorrected_notifs = 0;
325
326   if (mr == NULL)
327     return -1;
328
329   llentry_t *dimm = mcelog_dimm(mr, g_mcelog_config.dimms_list);
330   if (dimm == NULL) {
331     ERROR(MCELOG_PLUGIN
332           ": Error adding/getting dimm memory item to/from cache");
333     return -1;
334   }
335   mcelog_memory_rec_t *mr_old = dimm->value;
336   if (!g_mcelog_config.persist) {
337
338     if (mr_old->corrected_err_total != mr->corrected_err_total ||
339         mr_old->corrected_err_timed != mr->corrected_err_timed)
340       dispatch_corrected_notifs = 1;
341
342     if (mr_old->uncorrected_err_total != mr->uncorrected_err_total ||
343         mr_old->uncorrected_err_timed != mr->uncorrected_err_timed)
344       dispatch_uncorrected_notifs = 1;
345
346     if (!dispatch_corrected_notifs && !dispatch_uncorrected_notifs) {
347       DEBUG("%s: No new notifications to dispatch", MCELOG_PLUGIN);
348       return 0;
349     }
350   } else {
351     dispatch_corrected_notifs = 1;
352     dispatch_uncorrected_notifs = 1;
353   }
354
355   sstrncpy(n.host, hostname_g, sizeof(n.host));
356
357   if (mr->dimm_name[0] != '\0')
358     snprintf(n.plugin_instance, sizeof(n.plugin_instance), "%s_%s",
359              mr->location, mr->dimm_name);
360   else
361     sstrncpy(n.plugin_instance, mr->location, sizeof(n.plugin_instance));
362
363   if (dispatch_corrected_notifs &&
364       (mr->corrected_err_total > 0 || mr->corrected_err_timed > 0)) {
365     /* Corrected Error Notifications */
366     plugin_notification_meta_add_signed_int(&n, MCELOG_CORRECTED_ERR,
367                                             mr->corrected_err_total);
368     plugin_notification_meta_add_signed_int(&n, MCELOG_CORRECTED_ERR_TIMED,
369                                             mr->corrected_err_timed);
370     snprintf(n.message, sizeof(n.message), MCELOG_CORRECTED_ERR);
371     sstrncpy(n.type_instance, MCELOG_CORRECTED_ERR_TYPE_INS,
372              sizeof(n.type_instance));
373     plugin_dispatch_notification(&n);
374     if (n.meta)
375       plugin_notification_meta_free(n.meta);
376     n.meta = NULL;
377   }
378
379   if (dispatch_uncorrected_notifs &&
380       (mr->uncorrected_err_total > 0 || mr->uncorrected_err_timed > 0)) {
381     /* Uncorrected Error Notifications */
382     plugin_notification_meta_add_signed_int(&n, MCELOG_UNCORRECTED_ERR,
383                                             mr->uncorrected_err_total);
384     plugin_notification_meta_add_signed_int(&n, MCELOG_UNCORRECTED_ERR_TIMED,
385                                             mr->uncorrected_err_timed);
386     snprintf(n.message, sizeof(n.message), MCELOG_UNCORRECTED_ERR);
387     sstrncpy(n.type_instance, MCELOG_UNCORRECTED_ERR_TYPE_INS,
388              sizeof(n.type_instance));
389     n.severity = NOTIF_FAILURE;
390     plugin_dispatch_notification(&n);
391     if (n.meta)
392       plugin_notification_meta_free(n.meta);
393     n.meta = NULL;
394   }
395
396   return 0;
397 }
398
399 static int mcelog_submit(const mcelog_memory_rec_t *mr) {
400
401   if (!mr) {
402     ERROR(MCELOG_PLUGIN ": %s: NULL pointer", __FUNCTION__);
403     return -1;
404   }
405
406   llentry_t *dimm = mcelog_dimm(mr, g_mcelog_config.dimms_list);
407   if (dimm == NULL) {
408     ERROR(MCELOG_PLUGIN
409           ": Error adding/getting dimm memory item to/from cache");
410     return -1;
411   }
412
413   value_list_t vl = {
414       .values_len = 1,
415       .values = &(value_t){.derive = (derive_t)mr->corrected_err_total},
416       .time = cdtime(),
417       .plugin = MCELOG_PLUGIN,
418       .type = "errors",
419       .type_instance = MCELOG_CORRECTED_ERR_TYPE_INS};
420
421   mcelog_update_dimm_stats(dimm, mr);
422
423   if (mr->dimm_name[0] != '\0')
424     snprintf(vl.plugin_instance, sizeof(vl.plugin_instance), "%s_%s",
425              mr->location, mr->dimm_name);
426   else
427     sstrncpy(vl.plugin_instance, mr->location, sizeof(vl.plugin_instance));
428
429   plugin_dispatch_values(&vl);
430
431   snprintf(vl.type_instance, sizeof(vl.type_instance),
432            "corrected_memory_errors_in_%s", mr->corrected_err_timed_period);
433   vl.values = &(value_t){.derive = (derive_t)mr->corrected_err_timed};
434   plugin_dispatch_values(&vl);
435
436   sstrncpy(vl.type_instance, MCELOG_UNCORRECTED_ERR_TYPE_INS,
437            sizeof(vl.type_instance));
438   vl.values = &(value_t){.derive = (derive_t)mr->uncorrected_err_total};
439   plugin_dispatch_values(&vl);
440
441   snprintf(vl.type_instance, sizeof(vl.type_instance),
442            "uncorrected_memory_errors_in_%s", mr->uncorrected_err_timed_period);
443   vl.values = &(value_t){.derive = (derive_t)mr->uncorrected_err_timed};
444   plugin_dispatch_values(&vl);
445
446   return 0;
447 }
448
449 static int parse_memory_info(FILE *p_file, mcelog_memory_rec_t *memory_record) {
450   char buf[DATA_MAX_NAME_LEN] = {0};
451   while (fgets(buf, sizeof(buf), p_file)) {
452     /* Got empty line or "done" */
453     if ((!strncmp("\n", buf, strlen(buf))) ||
454         (!strncmp(buf, "done\n", strlen(buf))))
455       return 1;
456     if (strlen(buf) < 5)
457       continue;
458     if (!strncmp(buf, MCELOG_SOCKET_STR, strlen(MCELOG_SOCKET_STR))) {
459       sstrncpy(memory_record->location, buf, strlen(buf));
460       /* replace spaces with '_' */
461       for (size_t i = 0; i < strlen(memory_record->location); i++)
462         if (memory_record->location[i] == ' ')
463           memory_record->location[i] = '_';
464       DEBUG(MCELOG_PLUGIN ": Got SOCKET INFO %s", memory_record->location);
465     }
466     if (!strncmp(buf, MCELOG_DIMM_NAME, strlen(MCELOG_DIMM_NAME))) {
467       char *name = NULL;
468       char *saveptr = NULL;
469       name = strtok_r(buf, "\"", &saveptr);
470       if (name != NULL && saveptr != NULL) {
471         name = strtok_r(NULL, "\"", &saveptr);
472         if (name != NULL) {
473           sstrncpy(memory_record->dimm_name, name,
474                    sizeof(memory_record->dimm_name));
475           DEBUG(MCELOG_PLUGIN ": Got DIMM NAME %s", memory_record->dimm_name);
476         }
477       }
478     }
479     if (!strncmp(buf, MCELOG_CORRECTED_ERR, strlen(MCELOG_CORRECTED_ERR))) {
480       /* Get next line*/
481       if (fgets(buf, sizeof(buf), p_file) != NULL) {
482         sscanf(buf, "\t%d total", &(memory_record->corrected_err_total));
483         DEBUG(MCELOG_PLUGIN ": Got corrected error total %d",
484               memory_record->corrected_err_total);
485       }
486       if (fgets(buf, sizeof(buf), p_file) != NULL) {
487         sscanf(buf, "\t%d in %s", &(memory_record->corrected_err_timed),
488                memory_record->corrected_err_timed_period);
489         DEBUG(MCELOG_PLUGIN ": Got timed corrected errors %d in %s",
490               memory_record->corrected_err_total,
491               memory_record->corrected_err_timed_period);
492       }
493     }
494     if (!strncmp(buf, MCELOG_UNCORRECTED_ERR, strlen(MCELOG_UNCORRECTED_ERR))) {
495       if (fgets(buf, sizeof(buf), p_file) != NULL) {
496         sscanf(buf, "\t%d total", &(memory_record->uncorrected_err_total));
497         DEBUG(MCELOG_PLUGIN ": Got uncorrected error total %d",
498               memory_record->uncorrected_err_total);
499       }
500       if (fgets(buf, sizeof(buf), p_file) != NULL) {
501         sscanf(buf, "\t%d in %s", &(memory_record->uncorrected_err_timed),
502                memory_record->uncorrected_err_timed_period);
503         DEBUG(MCELOG_PLUGIN ": Got timed uncorrected errors %d in %s",
504               memory_record->uncorrected_err_total,
505               memory_record->uncorrected_err_timed_period);
506       }
507     }
508     memset(buf, 0, sizeof(buf));
509   }
510   /* parsing definitely finished */
511   return 0;
512 }
513
514 static void poll_worker_cleanup(void *arg) {
515   mcelog_thread_running = 0;
516   FILE *p_file = *((FILE **)arg);
517   if (p_file != NULL)
518     fclose(p_file);
519   free(arg);
520 }
521
522 static int socket_receive(socket_adapter_t *self, FILE **pp_file) {
523   int res = -1;
524   pthread_rwlock_rdlock(&self->lock);
525   struct pollfd poll_fd = {
526       .fd = self->sock_fd, .events = POLLIN | POLLPRI,
527   };
528
529   if ((res = poll(&poll_fd, 1, MCELOG_POLL_TIMEOUT)) <= 0) {
530     if (res != 0 && errno != EINTR) {
531       ERROR("mcelog: poll failed: %s", STRERRNO);
532     }
533     pthread_rwlock_unlock(&self->lock);
534     return res;
535   }
536
537   if (poll_fd.revents & (POLLERR | POLLHUP | POLLNVAL)) {
538     /* connection is broken */
539     ERROR(MCELOG_PLUGIN ": Connection to socket is broken");
540     if (poll_fd.revents & (POLLERR | POLLHUP)) {
541       mcelog_dispatch_notification(
542           &(notification_t){.severity = NOTIF_FAILURE,
543                             .time = cdtime(),
544                             .message = "Connection to mcelog socket is broken.",
545                             .plugin = MCELOG_PLUGIN,
546                             .type_instance = "mcelog_status"});
547     }
548     pthread_rwlock_unlock(&self->lock);
549     return -1;
550   }
551
552   if (!(poll_fd.revents & (POLLIN | POLLPRI))) {
553     INFO(MCELOG_PLUGIN ": No data to read");
554     pthread_rwlock_unlock(&self->lock);
555     return 0;
556   }
557
558   if ((*pp_file = fdopen(dup(self->sock_fd), "r")) == NULL)
559     res = -1;
560
561   pthread_rwlock_unlock(&self->lock);
562   return res;
563 }
564
565 static void *poll_worker(__attribute__((unused)) void *arg) {
566   mcelog_thread_running = 1;
567   FILE **pp_file = calloc(1, sizeof(*pp_file));
568   if (pp_file == NULL) {
569     ERROR("mcelog: memory allocation failed: %s", STRERRNO);
570     pthread_exit((void *)1);
571   }
572
573   pthread_cleanup_push(poll_worker_cleanup, pp_file);
574
575   while (1) {
576     /* blocking call */
577     int res = socket_adapter.receive(&socket_adapter, pp_file);
578     if (res < 0) {
579       socket_adapter.close(&socket_adapter);
580       while (socket_adapter.reinit(&socket_adapter) != 0) {
581         nanosleep(&CDTIME_T_TO_TIMESPEC(MS_TO_CDTIME_T(MCELOG_POLL_TIMEOUT)),
582                   NULL);
583       }
584       continue;
585     }
586     /* timeout or no data to read */
587     else if (res == 0)
588       continue;
589
590     if (*pp_file == NULL)
591       continue;
592
593     mcelog_memory_rec_t memory_record = {0};
594     while (parse_memory_info(*pp_file, &memory_record)) {
595       /* Check if location was successfully parsed */
596       if (memory_record.location[0] == '\0') {
597         memset(&memory_record, 0, sizeof(memory_record));
598         continue;
599       }
600
601       if (mcelog_dispatch_mem_notifications(&memory_record) != 0)
602         ERROR(MCELOG_PLUGIN ": Failed to submit memory errors notification");
603       if (mcelog_submit(&memory_record) != 0)
604         ERROR(MCELOG_PLUGIN ": Failed to submit memory errors");
605       memset(&memory_record, 0, sizeof(memory_record));
606     }
607
608     fclose(*pp_file);
609     *pp_file = NULL;
610   }
611
612   mcelog_thread_running = 0;
613   pthread_cleanup_pop(1);
614   return NULL;
615 }
616
617 static int mcelog_init(void) {
618   if (mcelog_apply_defaults) {
619     INFO(MCELOG_PLUGIN
620          ": No configuration selected defaulting to memory errors.");
621     memset(g_mcelog_config.logfile, 0, sizeof(g_mcelog_config.logfile));
622   }
623   g_mcelog_config.dimms_list = llist_create();
624   int err = pthread_mutex_init(&g_mcelog_config.dimms_lock, NULL);
625   if (err < 0) {
626     ERROR(MCELOG_PLUGIN ": plugin: failed to initialize cache lock");
627     return -1;
628   }
629
630   if (socket_adapter.reinit(&socket_adapter) != 0) {
631     ERROR(MCELOG_PLUGIN ": Cannot connect to client socket");
632     return -1;
633   }
634
635   if (strlen(socket_adapter.unix_sock.sun_path)) {
636     if (plugin_thread_create(&g_mcelog_config.tid, NULL, poll_worker, NULL,
637                              NULL) != 0) {
638       ERROR(MCELOG_PLUGIN ": Error creating poll thread.");
639       return -1;
640     }
641   }
642   return 0;
643 }
644
645 static int get_memory_machine_checks(void) {
646   static const char dump[] = "dump all bios\n";
647   int ret = socket_adapter.write(&socket_adapter, dump, sizeof(dump));
648   if (ret != 0)
649     ERROR(MCELOG_PLUGIN ": SENT DUMP REQUEST FAILED");
650   else
651     DEBUG(MCELOG_PLUGIN ": SENT DUMP REQUEST OK");
652   return ret;
653 }
654
655 static int mcelog_read(__attribute__((unused)) user_data_t *ud) {
656   DEBUG(MCELOG_PLUGIN ": %s", __FUNCTION__);
657
658   if (get_memory_machine_checks() != 0)
659     ERROR(MCELOG_PLUGIN ": MACHINE CHECK INFO NOT AVAILABLE");
660
661   return 0;
662 }
663
664 static int mcelog_shutdown(void) {
665   int ret = 0;
666   if (mcelog_thread_running) {
667     pthread_cancel(g_mcelog_config.tid);
668     if (pthread_join(g_mcelog_config.tid, NULL) != 0) {
669       ERROR(MCELOG_PLUGIN ": Stopping thread failed.");
670       ret = -1;
671     }
672   }
673   pthread_mutex_lock(&g_mcelog_config.dimms_lock);
674   mcelog_free_dimms_list_records(g_mcelog_config.dimms_list);
675   llist_destroy(g_mcelog_config.dimms_list);
676   g_mcelog_config.dimms_list = NULL;
677   pthread_mutex_unlock(&g_mcelog_config.dimms_lock);
678   pthread_mutex_destroy(&g_mcelog_config.dimms_lock);
679   ret = socket_adapter.close(&socket_adapter) || ret;
680   pthread_rwlock_destroy(&(socket_adapter.lock));
681   return -ret;
682 }
683
684 void module_register(void) {
685   plugin_register_complex_config(MCELOG_PLUGIN, mcelog_config);
686   plugin_register_init(MCELOG_PLUGIN, mcelog_init);
687   plugin_register_complex_read(NULL, MCELOG_PLUGIN, mcelog_read, 0, NULL);
688   plugin_register_shutdown(MCELOG_PLUGIN, mcelog_shutdown);
689 }