OpenAI
Αυτή η σελίδα μεταφράστηκε αυτόματα. Δείτε το πρωτότυπο άρθρο στα αγγλικά.

Πώς εντοπίζουμε προβληματικό περιεχόμενο στις υπηρεσίες μας για ιδιώτες

Τελευταία ενημέρωση: 15 days ago

Πιστεύουμε στην υπεύθυνη, επαναληπτική ανάπτυξη και διάθεση ως μέσο για την επίτευξη ασφαλούς τεχνητής γενικής νοημοσύνης. Πραγματοποιούμε σημαντικό όγκο δοκιμών και μετριασμού για την ασφάλεια και την ευθυγράμμιση πριν διαθέσουμε οποιοδήποτε μοντέλο στο κοινό, και διαθέτουμε επίσης αυτοματοποιημένα και ανθρώπινα συστήματα για να βοηθούν στον εντοπισμό προβληματικού περιεχομένου που εμφανίζεται στις υπηρεσίες μας για ιδιώτες, όπως το ChatGPT και τα GPTs. Παρακάτω παρουσιάζουμε ορισμένες από αυτές τις προσπάθειες.

ChatGPT, ImageGen και SORA

Χρησιμοποιούμε αυτοματοποιημένα εργαλεία, όπως μια εσωτερική έκδοση του API /moderations, για να εντοπίζουμε περιεχόμενο (προτροπές, ολοκληρώσεις, μεταφορτώσεις) που μπορεί να είναι επιβλαβές ή να παραβιάζει τις Πολιτικές Χρήσης μας. Αν εντοπίσουμε προβληματικό περιεχόμενο, συνήθως είτε θα σας προειδοποιήσουμε ότι το περιεχόμενό σας μπορεί να παραβιάζει τις πολιτικές χρήσης μας είτε θα εμποδίσουμε το μοντέλο να απαντήσει στην προτροπή σας. Μπορεί επίσης να αποτρέψουμε την κοινοποίηση της συνομιλίας με την προβληματική προτροπή ή ολοκλήρωση. Σε ένα πολύ περιορισμένο σύνολο περιστάσεων, ενδέχεται επίσης να απαγορεύσουμε τον λογαριασμό σας για κατάφωρη συμπεριφορά.

Δεχόμαστε επίσης αναφορές από ανθρώπους για προβληματικό περιεχόμενο στο ChatGPT και το SORA. Χρησιμοποιούμε συνδυασμό αυτοματοποιημένων συστημάτων και μιας εκπαιδευμένης ομάδας ειδικών για να εξετάζουμε αυτές τις αναφορές.

  • ChatGPT: Αν κάποιος κοινοποιήσει μια συνομιλία που πιστεύετε ότι περιέχει προβληματικό περιεχόμενο, μπορείτε επίσης να μας την αναφέρετε.

  • SORA: Αν δείτε ένα βίντεο ή εικόνα στη ροή σας που πιστεύετε ότι περιέχει προβληματικό περιεχόμενο, μπορείτε να μας το αναφέρετε.

Για περισσότερες λεπτομέρειες σχετικά με το πώς να αναφέρετε περιεχόμενο απευθείας στο ChatGPT ή το SORA, δείτε αυτό το άρθρο.

GPTs

Χρησιμοποιούμε επίσης αυτοματοποιημένα εργαλεία όπως το API /moderation για να διαπιστώσουμε αν ένα GPT είναι δυνητικά προβληματικό. Αν εντοπίσουμε προβληματικό περιεχόμενο που σχετίζεται με το GPT, θα λάβουμε μέτρα, όπως να αποτρέψουμε τη διανομή του. Ο δημιουργός μπορεί να επεξεργαστεί τη διαμόρφωση του GPT ή του API για να αφαιρέσει το προβληματικό περιεχόμενο ή να ασκήσει ένσταση κατά της απόφασης μέσω μιας ροής μέσα στο προϊόν. Σε ένα πολύ περιορισμένο σύνολο περιστάσεων, ενδέχεται επίσης να απαγορεύσουμε τον λογαριασμό του δημιουργού για κατάφωρη συμπεριφορά.

Δεχόμαστε επίσης αναφορές από ανθρώπους για προβληματικά GPTs. Αν δείτε ένα GPT που πιστεύετε ότι παραβιάζει τις πολιτικές χρήσης μας ή με άλλον τρόπο αντικατοπτρίζει προβληματικό περιεχόμενο, μπορείτε επίσης να μας το αναφέρετε. Χρησιμοποιούμε συνδυασμό αυτοματοποιημένων συστημάτων και μιας εκπαιδευμένης ομάδας ειδικών για να εξετάζουμε αυτές τις αναφορές.

Σας βοήθησε αυτό το άρθρο;