¡Otro gran paso adelante! OpenAI o1 ya ha llegado, ¿será un reto a superar?

Expositor: KEPCO China

Autor: Wang Qin (Doctor, Instituto de Tecnología Informática, Academia China de Ciencias)

Supervisión: Agencia de Ciencia y Tecnología de China

Editado por: El desarrollo actual de la ciencia y la tecnología inteligentes, la introducción de la serie de artículos de ciencia y tecnología "inteligencia artificial" en China, la introducción de la historia de la inteligencia artificial y la introducción de varios tipos de investigación y curiosidad. Exploremos juntos y demos la bienvenida a la sabiduría y a la inteligencia.

En los últimos años, ChatGPT de OpenAI ha explotado en todo el mundo. Cuando se lanzó GPT-5, el 13 de septiembre, Ling Chen, OpenAI, abrió AI o1 y se resolvió el nuevo modelo de razonamiento para el problema.

(Fuente de la imagen: sitio web oficial de OpenAI)

OpenAI o1 Arita Takahiro

A principios del primer mes, el administrador jefe de OpenAI, Sam Altman, escribió una foto de su propio jardín de flores. Posteriormente se revelarán las noticias de personas y personas conocedoras, el nuevo modelo de IA del personal general de OpenAI, nombre interno Strawberry.

El predecesor del modelo de hierba es Q*, implicación Q* combinada con varios métodos famosos de inteligencia artificial: Q-learning y exploración A*. La configuración de Q * 过于 tiene una gran capacidad, los investigadores son responsables del desarrollo del poder potencial del grupo y esta es una de las causas clave de la reciente tendencia de guerra civil de OpenAI.

La cubierta de hierba de Sam Altman

(Fuente: Número X(twitter) de Sam Altman)

El modelo OpenAI o1 de OpenAI es correcto. El importante progreso logrado en el desarrollo del problema de inferencia actual, el número de nuevos modelos OpenAI iniciados y la denominación del nuevo modelo OpenAI o1. Información de OpenAI, OpenAI o1 está disponible para una amplia gama de personas, respuestas a preguntas sobre cómo utilizar más tiempo. En este modelo O1, es posible comprender la teoría de la ciencia y el problema de resolver el campo de las matemáticas japonesas es mucho más difícil que antes.

Anteriormente, la última comparación del modelo GPT-4o de OpenAI, OpenAI o1 estaba en matemáticas, se completó en el proceso, ya que se adquirió el problema de ciencia básica de doctorado, el autor era alto y el resultado del desarrollo fue más poderoso en el trabajo de razonamiento. Aproximadamente el 89% de los estudiantes son elegibles para el examen (Codeforces), el 89% de los estudiantes son elegibles para el examen (AIME) y 500 estudiantes son elegibles para las preguntas estándar físicas, biológicas y químicas (GPQA).

Comparación de problemas de matemáticas, procesamiento y ciencias de OpenAI o1 y GPT-4o

(Fuente de la imagen: sitio web oficial de OpenAI)

El arma secreta de OpenAI o1: pensamiento básico y química poderosa

La capacidad de OpenAI o1 para adquirir la capacidad de razonamiento superior de GPT-4o, la clave es utilizar la fuerte química de la Cadena de Pensamiento. El tipo de persona que actualmente está tratando de responder a un problema difícil puede ser un proceso de pensamiento de largo plazo, y OpenAI o1 se puede utilizar para resolver un problema y también se puede utilizar para pensar en él. En general, la oficina del director del comité modelo desmonta y edita los pasos simples, la solución paso a paso, y compara el modelo directamente con las preguntas y respuestas que habitualmente se actualizan.

De hecho, es un concepto nuevo, y antes del lanzamiento de GPT-3, el equipo de investigación científica pudo pensar en ello y luego se presentó como un modelo de lenguaje principal para el razonamiento.

Ejemplos reflexivos del uso del modelo de vocabulario

(Fuente original: Traducido de la bibliografía de referencia de Nezu 2)

Más arriba se muestra un ejemplo de un modelo de lenguaje grande importado y exportado, que se está importando actualmente y un modelo de cuello importado. La respuesta a la pregunta del número de la bola de cálculo, y luego la pregunta de la pregunta después del cálculo del modelo, el número del resultado del cálculo del modelo.

El lado inferior izquierdo es una respuesta directa, y la respuesta es una respuesta directa cuando se lanza el modelo. En la parte inferior derecha se encuentran las preguntas a utilizar, los investigadores para importar el modelo, la respuesta a los números de bola individuales, la respuesta a las preguntas individuales, el modelo para mostrar y el proceso de razonamiento para los jugadores individuales, y el número para responder los números para volver a examinar el modelo.

Este es el primer paso, se confirma que el modelo es correcto y se completa el cálculo de inferencia. Este es el nombre del método de razonamiento intermedio en una serie de problemas de generación de modelos. Es posible pensarlo en detalle, es posible comprender el gran modelo de lenguaje, se puede explicar en detalle, se puede mostrar directamente, pero no es posible completar el estudio. El modelo del lenguaje tiene una respuesta que se puede resolver y la respuesta es comprensible, y es completamente negro.

Después de ingresar a GPT-3, la importancia de ayudar a las personas a medida que avanzan en el proceso. Un modelo de lenguaje grande con una fuerte capacidad, tiempo presente y demanda, un ejemplo numérico de bola de cálculo frontal, solo un modelo de informe de demanda "Pensemos paso a paso" (Pensemos paso a paso), puede usar el modelo para resolver el problema.

La prueba anterior le guiará cuando llegue el momento de introducir el modelo actual. ¿Es útil pensar en la estructura del modelo? Esta es una prueba de OpenAI o1.

La fuerte química y la nueva ley de escala de OpenAI o1

Cuando el modelo GPT responde la pregunta, lo básico son las "adiciones de letras", cuando se realiza la configuración, el cálculo es aproximado, la respuesta es la más adecuada.

Por favor, déjame saber cómo usar el modelo de lenguaje grande, pero no depende de la tasa aproximada de progreso, y OpenAI o1 se ha utilizado para aprender a usar equipos químicos poderosos.

La química fuerte es un método de "prueba" más que el modelo de dedo. El resultado de este modelo son los detalles de cómo evitarlo durante la exportación después de que el modelo esté presente; Después de muchas pruebas en la serie, decidí estudiar el modelo yo mismo y hacer mi propio juicio.

Para una química fuerte, no hay diferentes tipos de respuestas, y el método de estudio es adecuado para su uso en otras áreas, como problemas de decisión ambiental, como control de equipos, intercambio financiero, juegos de ajedrez, etc. Actualmente, en un área pequeña, no podemos ir y venir con la respuesta correcta en función de la intención de uno, pero solo podemos obtener el conocimiento y tomar una acción como resultado. Por ejemplo, los equipos son derrotados, las transacciones financieras son rentables, los juegos son rentables o no.

Un ejemplo famoso de química fuerte es la IA de ajedrez AlphaGo de Deepmind de 2016. En el mundo del ajedrez, el número de situaciones posibles es extremadamente grande y el número de átomos en el universo es extremadamente alto. Si juegas al ajedrez podrás obtener el mejor método sin pasar por la ley. Antes de la llegada de AlphaGo, los humanos habían descubierto que era imposible que la inteligencia artificial ganara al ajedrez.

Utilice AlphaGo para aprender cómo proceder, jugar sus propios juegos y ganar todos los juegos. Si te clasificas como una persona poco exigente, podrás saber con cuántos ajedrecistas quieres jugar.

Durante el curso de la decisión de AlphaGo, es posible tomar una decisión exitosa en la primera posición y tomar una decisión sobre si avanzar o ganar. Esta es la sensación del ajedrez, generalmente el nombre de la persona. Una vez que se decide que es posible cambiar el juego, AlphaGo calculará la posibilidad de seguir progresando, que es el mejor método a elegir.

Debido a esto, la principal influencia de AlphaGo es la capacidad de emitir juicios sobre la situación y la cantidad de cálculo que es posible realizar. Entre ellos, la fuerte química del modelo tiene la capacidad de juzgar el progreso del modelo.

La autodefensa de AlphaGo

(Fuente: Referencia 1)

Actualmente, en el programa Advancing Chemistry de OpenAI o1, el equipo de estudio de OpenAI o1 refinó su pensamiento, perfeccionó su estrategia de uso y resolvió los problemas de la escuela de estudio de una manera más sencilla. En ese momento ya había desarrollado una capacidad de razonamiento similar a la de un modelo.

Después de finalizar mis estudios, no podré volver a importar OpenAI o1. Recíproco, construcción y uso de OpenAI, presentación de retención de tiempo de OpenAI o1, directa, evitación de uso y presentación.

Mientras los investigadores están probando actualmente OpenAI O1, podremos mejorar el rendimiento del modelo aumentando el tiempo que lleva aumentar la química y el tiempo de inferencia, y mejorar el rendimiento del modelo.

Ley de escalamiento o1 de OpenAI

(Fuente de la imagen: OpenAI)

Los investigadores de OpenAI están presentes en 2020, la Ley de Escala del gran modelo de lenguaje, el tamaño de la escala grande y pequeña del rendimiento del gran modelo de lenguaje, el tamaño de la colección de lenguajes y el aumento de la cantidad de cálculo en el momento del modelo de lenguaje.

La exposición OpenAI o1 ha completado una nueva Ley de escala, se ha mejorado el rendimiento de los modelos existentes, se ha aumentado el rendimiento de los modelos que se pueden usar en tiempo de inferencia adicional, se ha mejorado el rendimiento de los modelos y se ha presentado el futuro del futuro modelo de lenguaje como un nuevo modelo.

Modelo de tres piezas de inclusión inmediata de la serie o1 de OpenAI, o1, o1-preview, o1-mini. El tamaño del modelo pequeño es diferente, el o1-mini es el más grande y tiene la capacidad de razonamiento más fuerte, y el o1-mini es el más pequeño, pero el tamaño del modelo es pequeño y el tamaño es pequeño. O1-mini actualmente tiene una presentación matemática como se muestra a continuación, o1-mini actualmente tiene una presentación matemática que es muy sólida. Al mismo tiempo, la inferencia aumenta con el tiempo y el modelo de tres partes presenta una solución de propiedad urbana.

Representación matemática del modelo de libro de versiones diferentes de OpenAI o1

(Fuente de la imagen: OpenAI)

¿Volverá la reunión de OpenAI o1 con más problemas de seguridad?

El avance del modelo o1 de OpenAI, sin duda, supone un paso más en la capacidad de ofrecer un gran modelo de lenguaje. OpenAI ha propuesto cinco etapas de inteligencia artificial de propósito general (AGI), la primera etapa es una inteligencia artificial de interacción humana que se puede realizar, y la segunda etapa es una inteligencia artificial realista con capacidad de razonamiento. ChatGPT ha alcanzado la meta de la primera etapa, ha aparecido OpenAI o1 y nos hemos alejado de la segunda etapa.

Al mismo tiempo que OpenAI o1 ha desarrollado una gran capacidad de razonamiento, el personal de investigación de Zheng Rui, Q*, también está preocupado por la seguridad de OpenAI o1.

OpenAI ofrece una nueva oportunidad para explorar la seguridad de los modelos y ofrecer nuevas oportunidades. Durante el transcurso del estudio, es posible que el modelo sea rechazado y se produzcan conductas perjudiciales. Al mismo tiempo, podemos pensar con más claridad sobre el modelo, pero también aumentar la seguridad del modelo.

El futuro puede estar más allá de la imaginación.

Por el momento, se puede utilizar la versión preliminar de OpenAI o1, la versión mini japonesa del libro, para el lanzamiento del libro, así como adiciones generales, elementos de texto, imágenes japonesas, etc. y otras funciones prácticas. ¿Cuál es el efecto de la situación real en la escena? Sin embargo, OpenAI o1 es un paso importante en la capacidad de razonamiento y también significa que recientemente hemos completado el progreso de la inteligencia artificial general. ¿Cuál es la dirección de la futura sociedad en general de la inteligencia artificial y, independientemente de si es capaz o no, esperamos que la sociedad humana haga contribuciones aún mayores y que sigamos manteniendo nuestra estructura?

Referencias:

1.Silver, D., Schrittwieser, J., Simonyan, K. et al. Dominar el juego de Go sin conocimientos humanos. Naturaleza 550, 354–359 (2017). https://doi.org/10.1038/nature24270

2. https://proceedings.neurips.cc/paper_files/paper/2022/hash/9d5609613524ecf4f15af0f7b31abca4-Abstract-Conference.html

<<: ¿La epidemia de este año? Las 14 preguntas más importantes para la familia, primer examen

>>: Coche de tecnología eléctrica: nueva selección Tonan DX3 Tobi Rui Wind S3 por 80.000

¿Volver a ganar peso y aumentar la grasa fácilmente causa cáncer? Los médicos desmienten mitos...

Artículos

¿Es el frío y la frialdad de Taisei Shigeo "todo en uno, algo canceroso"? Policía: La nevera no es una "caja de protección"

Artículos

[Preguntas Médicas] ¿Cómo se utiliza exactamente el paño para cortar la nariz y la nariz?

Artículos

Una reseña completa del DISCO DE GRACIAS de Kuroko's Basketball ~¡10º aniversario~! ¿Qué es lo que los fanáticos deben ver obligatoriamente?

Dibujos animados

Recomendar artículo

Alimentos (peces, peces, insectos acuáticos, animales carnívoros, insectos, etc.)

...

Business Insider: Facebook no pudo interpretar la canción "Transcendental Valley" de dos personas durante 11 años. La diferencia es 10 veces.

Hermoso país visitante de ciencia y tecnología Bu...

[Sala de Publicaciones Físicas] ¿Cómo recuperarse de una neumonía grave y de una enfermedad infecciosa?

...

Guía de selección de asientos de seguridad para niños en automóviles Selección de asientos de seguridad para niños en automóviles

La seguridad de la carrera de un niño es muy impo...

Hay 4 tipos diferentes de peligro de comida nocturna, ¡Ning se puede pagar por separado! Hígado y riñones dañados, intestinos dañados…

Manuscrito del texto principal: Yong Lize, Médico...

¡Otro gran paso adelante! OpenAI o1 ya ha llegado, ¿será un reto a superar?

¿Volver a ganar peso y aumentar la grasa fácilmente causa cáncer? Los médicos desmienten mitos...

¿Es el frío y la frialdad de Taisei Shigeo "todo en uno, algo canceroso"? Policía: La nevera no es una "caja de protección"

[Preguntas Médicas] ¿Cómo se utiliza exactamente el paño para cortar la nariz y la nariz?

Una reseña completa del DISCO DE GRACIAS de Kuroko's Basketball ~¡10º aniversario~! ¿Qué es lo que los fanáticos deben ver obligatoriamente?

Nueva corona última canción sagrada Paxlovid, ¿qué debo hacer? ¡No es una necesidad de todos!

Encuentra el teléfono que deseas comprar.

El atractivo y la valoración de "Hoero Bun Bun": una reseña imprescindible para los fans del anime

¿Por qué nadie puede comer verduras? Qué comer

¿El azúcar rojo y el azúcar rojo son un buen producto? La verdad está oculta a tu conocimiento.

Después de levantarme temprano, vi a 4 personas y les dije que estaba físicamente en forma y saludable. ! !

Recomendar artículo

Alimentos (peces, peces, insectos acuáticos, animales carnívoros, insectos, etc.)

Business Insider: Facebook no pudo interpretar la canción "Transcendental Valley" de dos personas durante 11 años. La diferencia es 10 veces.

[Sala de Publicaciones Físicas] ¿Cómo recuperarse de una neumonía grave y de una enfermedad infecciosa?

Guía de selección de asientos de seguridad para niños en automóviles Selección de asientos de seguridad para niños en automóviles

¿Qué diablos es el jengibre? ¿Comer demasiada carne y adelgazar?

¿Cuál es la forma de una berenjena? ¿Tiene algún significado el método del pescado y la berenjena?

喂、Estás ahí、Hongo espiral de varilla Yumen

“¡El mundo ha pasado!” Hay 8 grandes señales de muerte psicógena, en promedio, una persona por minuto.

Proteína amarilla dulce de larga duración, con alto contenido en antioxidantes, alimento rico y bueno.

¿Cuál es la diferencia entre emoción y emoción? Características emocionales

Reseña de la película Pokémon Best Wishes: ¿Cuál es el atractivo de Pikachu y sus amigos Eevee?

Encuentro con viento durante la fría temporada de invierno

Se han publicado más de 5.000 reseñas: ¿Es agua pura para beber durante mucho tiempo?

Estudio: El vegetarianismo reduce el riesgo de diabetes, rompiendo dos mitos sobre el vegetarianismo saludable

Hay 4 tipos diferentes de peligro de comida nocturna, ¡Ning se puede pagar por separado! Hígado y riñones dañados, intestinos dañados…