Simulación y optimización avanzadas en la industria química y de procesos: HYSYS
Susana Luque Rodríguez Aurelio B. Vega Granda Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Tercera edición ISBN: 84-689-3028-8 D.L. AS/3604-2005 Editora: Susana Luque Rodríguez © Los autores, 2005. TODOS LOS DERECHOS RESERVADOS. Ninguna parte de esta publicación se puede reproducir, guardar o transmitir de ningún modo, electrónico o de otro tipo, sin el permiso de los autores. Impreso y encuadernado en España Universidad de Oviedo, Oviedo
Índice general
ÍNDICE GENERAL
Tema 1.
Introducción. La simulación de procesos en la industria química actual Susana Luque Rodríguez y Aurelio B. Vega Granda
Página 1
I. Termodinámica y modelización rigurosa de procesos Termodinámica de sistemas no ideales Julio L. Bueno de las Heras Modelos de predicción de propiedades físico-químicas M. Carmen Pazos Medina
17
Tema 4.
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección Aurelio B. Vega Granda
77
Tema 5.
Modelos rigurosos de separaciones de equilibrio Fernando V. Díez Sanz
97
Tema 6.
Modelos rigurosos de operaciones unitarias Aurelio B. Vega Granda
Tema 2. Tema 3.
47
107
II. Simulación de procesos en la industria química y de procesos. HYSYS Tema 7.
Modos de simulación de procesos Aurelio B. Vega Granda
125
Tema 8.
Métodos de resolución de ecuaciones no lineales I: métodos tipo Newton José Ramón Álvarez Saiz
137
Tema 9.
Métodos de resolución de ecuaciones no lineales II: métodos que no requieren derivadas y de primer orden José Ramón Álvarez Saiz
149
Tema 10.
Recirculaciones: partición y seccionado de corrientes Susana Luque Rodríguez
163
Tema 11.
Simulación en diseño y operación de procesos. Aplicaciones Aurelio B. Vega Granda
179
III. Optimización de diagramas de flujo con HYSYS Tema 12.
Introducción a la programación no lineal (NLP) con restricciones José Ramón Álvarez Saiz
195
Tema 13.
Programación cuadrática sucesiva (SQP) José Ramón Álvarez Saiz
217
Tema 14.
Optimización de procesos con simuladores modulares Susana Luque Rodríguez
231
Tema 15.
Optimización de procesos con simuladores orientados a ecuaciones Susana Luque Rodríguez
243
Tema 16.
Optimización en diseño y operación en la industria química. Aplicaciones Susana Luque Rodríguez
257
i
Índice general Tema H1. Introducción al uso de HYSYS. Modelos simples de operaciones unitarias Aurelio B. Vega Granda y Susana Luque Rodríguez Tema H2. Simulación de procesos con HYSYS. Aspectos básicos Susana Luque Rodríguez y Aurelio B. Vega Granda Tema H3. Simulación de procesos con HYSYS. Sistemas de reacción y
275 289 303
recirculaciones
Aurelio B. Vega Granda y Susana Luque Rodríguez Tema H4. Simulación de procesos con HYSYS. Especificaciones de diseño Susana Luque Rodríguez y Aurelio B. Vega Granda Tema H5. Simulación de procesos con HYSYS. Optimización de diagramas de flujo Susana Luque Rodríguez y Aurelio B. Vega Granda
ii
313 327
Introducción. La simulación de procesos en la industria química actual Susana Luque Rodríguez Aurelio B. Vega Granda Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Introducción y planificación del curso. La simulación de procesos en la industria química actual
ÍNDICE 1. INTRODUCCIÓN ........................................................................................................3 2. ORGANIZACIÓN DEL CURSO................................................................................4 2.1. Objetivos del curso................................................................................................4 2.2. Programa del curso................................................................................................4 2.3. Evaluación.............................................................................................................6 2.4. Bibliografía............................................................................................................6 3. LA SIMULACIÓN DE PROCESOS EN LA INDUSTRIA QUÍMICA ACTUAL .7 4. DISEÑO GLOBAL DE PROCESOS QUÍMICOS Y EL “MODELO DE CEBOLLA”...................................................................................................................9 5. MODELIZACIÓN EN PROCESOS QUÍMICOS ..................................................12 5.1. Los métodos numéricos como herramienta para la modelización de procesos en ingeniería química ...............................................................................................13 6. TENDENCIAS ACTUALES EN EL DISEÑO DE PROCESOS ...........................16 7. BIBLIOGRAFÍA ........................................................................................................16
1. INTRODUCCIÓN El desarrollo de modelos de balances de materia y energía es la base para la evaluación de procesos y la toma de decisiones en el diseño de nuevas plantas o modificaciones de las ya existentes. El modelo del diagrama de flujo comprende un conjunto grande de ecuaciones no lineales que describen: 1. las condiciones de las unidades del proceso mediante corrientes de proceso 2. las ecuaciones específicas de cada unidad (leyes de conservación y ecuaciones de diseño específicas) 3. los datos y relaciones de éstos con las propiedades físicas de las sustancias procesadas En este curso veremos todos estos aspectos incluyendo la influencia que tiene el comportamiento real (no ideal) de los sistemas en equilibrio, así como el desarrollo de modelos detallados, que se encuentran implementados en los simuladores comerciales. Los modelos detallados se basan en relaciones de equilibrio entre fases (para lo cual se repasarán algunos conceptos termodinámicos) y balances de materia y energía. Los cálculos en los simuladores comerciales se simplifican bastante al no incluir en muchos casos las propiedades de transporte. Es decir, se aprovecha la posibilidad de llevar a cabo los balances de materia y energía sin conocer la capacidad o geometría de las unidades. Esto implica que para llevar a cabo una estimación económica del proceso, tras la simulación se tiene que llevar a cabo un diseño de las unidades, que incluya su dimensionado y estimación de coste. Los simuladores comerciales tienen esta opción disponible, habitualmente como un paquete informático adicional, al que se pueden incorporar los datos obtenidos en la simulación. 3
Introducción y planificación del curso. La simulación de procesos en la industria química actual
Otra de las implicaciones importantes de esta forma de trabajo es que, aunque resulta correcta para nuevos diseño de plantas o secciones de planta, su aplicación a simulación de equipos existentes es más problemática (ya que se precisarían modelos del funcionamiento de dichos equipos). En otros casos, por ejemplo en operaciones no controladas por el equilibrio sino por un proceso de velocidad, los modelos basados en consideraciones termodinámicas tampoco son adecuados. En el curso también se abordarán los métodos de resolución de los sistemas de ecuaciones no lineales que resultan de los modelos de las unidades del proceso y de las propiedades físicoquímicas de las corrientes involucradas. Para ello se introducirán métodos numéricos que permiten trabajar con sistemas a gran escala, como los habitualmente encontrados en simulación de procesos. Con este objetivo se introducirán brevemente los algoritmos de resolución más habituales en los simuladores comerciales. Una vez que se tienen las ideas de simulación de procesos y de la estructura de los modelos de proceso, se va a considerar un aspecto clave en diseño de procesos. El objetivo de muchas simulaciones en Ingeniería es el desarrollo de un modelo predictivo que se pueda usar en mejorar el proceso. Con esta idea se verán las estrategias de optimización para procesos químicos con variables continuas. En particular nos centraremos en el algoritmo de programación cuadrática sucesiva (SQP o “Successive Quadratic Programming”) que se ha convertido en el estándar en optimación de procesos.
2. ORGANIZACIÓN DEL CURSO 2.1. Objetivos del curso El curso profundiza en las herramientas actualmente disponibles para la simulación de procesos reales de la industria química y de procesos. Se pretende que los participantes adquieran: •
los conocimientos teóricos básicos necesarios para comprender la implementación de los modelos en los simuladores y su resolución
•
las estrategias actualmente empleadas en optimización de procesos químicos
•
experiencia en la formulación y resolución de problemas industriales de diseño y optimización, con una herramienta informática que en la actualidad emplea la industria de procesos: HYSYS v. 3.
2.2. Programa del curso El curso consta de 30 horas lectivas, 15 de las cuales se imparten en el aula 26 y 15 en aula de informática (aula D, edificio de departamentos), con una ratio máxima de 2 alumnos/ordenador. El curso es convalidable por 4.5 créditos de libre configuración. El curso se ha estructurado en tres bloques temáticos:
4
I.
Introducción. Termodinámica y modelización rigurosa de procesos
II.
Simulación de procesos en la industria química y de procesos: HYSYS
III.
Optimización de diagramas de flujo con HYSYS
Introducción y planificación del curso. La simulación de procesos en la industria química actual
El curso incluye, además de los aspectos teóricos básicos necesarios para comprender la implementación de los modelos en los simuladores y su resolución, un gran número de horas de clases en las que es posible, mediante el acceso directo a un ordenador con un programa de simulación comercial (HYSYS, v.3.) adquirir experiencia en la formulación y resolución de problemas industriales de diseño y optimización, con las mismas herramientas que en la actualidad emplea la industria de procesos. El temario detallado del curso se indica a continuación: Tema Título 0
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 H1 H2 H3 H4 H5
Profesor/a
Duración (h) 1
Introducción y planificación del curso. La simulación Susana Luque de procesos en la industria química actual I. Introducción. Termodinámica y modelización rigurosa de procesos Termodinámica de sistemas no ideales Julio Bueno Modelos de predicción de propiedades físico-químicas Carmen Pazos Implementación de modelos de propiedades físicas y Aurelio Vega criterios de selección Modelos rigurosos de separaciones de equilibrio Fernando Díez Modelos rigurosos de operaciones unitarias Aurelio Vega II. Simulación de procesos en la industria química y de procesos HYSYS Modos de simulación de procesos Aurelio Vega Métodos de resolución de ecuaciones no lineales I: José R. Álvarez métodos tipo Newton Métodos de resolución de ecuaciones no lineales II: José R. Álvarez métodos que no requieren derivadas y de primer orden Recirculaciones: partición y seccionado de corrientes Susana Luque Simulación en diseño y operación de procesos. Aurelio Vega Aplicaciones III. Optimización de diagramas de flujo con HYSYS Introducción a la programación no lineal (NLP) con José R. Álvarez restricciones Programación cuadrática sucesiva (SQP) José R. Álvarez Optimización de procesos con simuladores modulares Susana Luque Optimización de procesos con simuladores orientados Susana Luque a ecuaciones Optimización en diseño y operación en la industria Susana Luque / química. Aplicaciones Aurelio Vega Introducción al uso de HYSYS. Modelos simples de Aurelio Vega / Susana Luque operaciones unitarias Simulación de procesos con HYSYS. Aspectos básicos Aurelio Vega / Susana Luque Simulación de procesos con HYSYS. Sistemas de Aurelio Vega / Susana Luque reacción y recirculaciones Simulación de procesos con HYSYS. Especificaciones Susana Luque / Aurelio Vega de diseño Simulación de procesos con HYSYS. Optimización de Susana Luque / Aurelio Vega diagramas de flujo
1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 2 3 3 3 3 5
Introducción y planificación del curso. La simulación de procesos en la industria química actual
La carga docente se haya repartida de forma relativamente uniforme, como se muestra en la figura 1.
I.Termodinámica y modelización rigurosa 20 %
II. Simulación de procesos 17 %
III. Optimización de diagramas de flujo 13 % HYSYS 50 %
Fig. 1. Distribución de la carga docente del curso, según bloques temáticos
2.3. Evaluación A los efectos de la obtención del certificado de homologación de créditos de libre configuración es obligatoria la asistencia en un 80 % como mínimo. La evaluación se llevará a cabo mediante la realización de una prueba escrita (1 hora de duración, inmediata a la finalización del curso) y un trabajo adicional sobre alguno de los temas tratados en el curso, que los alumnos tendrán que entregar antes del 31 de julio a los directores del curso.
2.4. Bibliografía La documentación que se entrega está fundamentalmente obtenida de las siguientes fuentes: •
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech “HYSYS user’s guide”, disponible http://engineering.eng.rowan.edu/~hesketh/hysyshelp/Menu.pdf, www.hyprotech.com y en support.aspectech.com
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999).
en en
Otros libros de consulta son los siguientes:
6
•
Bequette, B.W., “Process Dynamics: Modeling, Analysis and Simulation”, Prentice Hall, New Jersey (1998).
•
Ingham, J., Dunn, I.J., Keinzle, E., Prenosil, J.E., “Chemical Engineering Dynamics”, Verlagsgesellschaft, Weinheim (1994).
•
Turton, R., Bailie, R.C., Whiting, W.B., Shaeiwitz, J.A., “Analysis, Synthesis, and Design of Chemical Processes”, Prentice Hall, Nueva Jersey (1998).
Introducción y planificación del curso. La simulación de procesos en la industria química actual
3. LA SIMULACIÓN QUÍMICA ACTUAL
DE
PROCESOS
EN
LA
INDUSTRIA
En un proceso químico, la transformación de materias primas en los productos deseados habitualmente conlleva más de una etapa. El proceso suele constar de una serie de etapas de transformación intermedias que involucran, por ejemplo, reacción, separación, mezcla, calentamiento, enfriamiento, cambio de presión, reducción o aumento del tamaño de partícula, etc. Una vez que se han seleccionado las etapas individuales, es necesario interconectarlas para llevar a cabo la transformación global.
Materias primas
¿PROCESO?
Productos deseados
Fig. 2. Esquema genérico del diseño de un proceso químico El diseño de un proceso involucra una descripción abstracta de lo que se quiere, y otra descripción más detallada (esto es, más refinada) en cada una de las etapas del diseño, construcción y operación del proceso. Por ejemplo, la dirección de la empresa desea mejorar el valor futuro de la empresa, lo que constituye la descripción abstracta de sus deseos. En consecuencia genera y selecciona entre las alternativas posibles a llevar a cabo en la empresa para lograr este fin; esto representa una descripción más detallada de lo que se quiere llevar a cabo. Esta descripción se transforma en la descripción abstracta para aquellos que trabajan en las siguientes etapas del diseño. Por ejemplo, en el diseño preliminar del proceso, la descripción abstracta podría ser convertir el exceso de etileno de la planta en alcohol etílico. La descripción más detallada será el diseño preliminar necesario para llevar a cabo este fin. Denominamos síntesis al proceso de transformar la descripción abstracta en otra más detallada, y comprende varias etapas como se indica en la figura 3. La primera etapa es la generación del concepto, donde se identifican las claves principales en que se basará el diseño. Para el ejemplo anterior, deberemos decidir si nos restringimos a la química que se encuentra en la bibliografía, si sólo consideramos procesos convencionales bien contrastados o por el contrario optamos por procesos novedosos. Se debe considerar aquí también si se compra un proceso llave en mano, etc. En la siguiente etapa consideramos la generación de alternativas, para ello se suele partir de fuentes bibliográficas (patentes, artículos científicos, enciclopedias de tecnología). La siguiente etapa es el análisis de cada una de las alternativas propuestas para evaluar su funcionamiento. Típicamente, esto significa llevar a cabo los balances de materia y energía del proceso para calcular los flujos, temperaturas, presiones, composiciones, etc.
7
Introducción y planificación del curso. La simulación de procesos en la industria química actual Descripción inicial
Entradas y Resultados Especific ación del Pr oblema
(Nuevo) Enfoque del Diseño
Etapas Gener ación de Conc eptos
Gener ac ión de Alter nativas
En la siguiente etapa tenemos que evaluar el funcionamiento del proceso, tanto desde el punto de vista de su rentabilidad económica, como flexibilidad, seguridad, de impacto medioambiental, etc. Finalmente, se requiere llevar a cabo una optimización para mejorar el diseño. Al final de todo este proceso se espera tener el mejor diseño que satisface nuestro objetivo inicial, y habremos transformado una descripción abstracta en una más detallada que da lugar al diagrama de flujo del proceso.
Alter nativas de Diseño
Análisis Repr esentac ión
Evaluac ión Coste, Segur idad, etc .
Un DIAGRAMA DE FLUJO (Process Flow Diagram, PFD) no es más que la representación de las etapas del proceso y sus interconexiones.
Comparación y Optimizac ión
Por tanto, una vez que se ha definido la estructura del diagrama, es posible llevar a cabo un ANALISIS y SIMULACIÓN del proceso. La simulación requiere un modelo Descripción refinada matemático del proceso que intenta predecir el comportamiento del proceso si éste se Fig. 3. Etapas en la síntesis de un proceso construyese (Fig. 4). químico
Materias primas
PROCESO
¿Productos?
Fig. 4. Flujo de información en la simulación de procesos Una vez que se tiene un modelo del proceso, suponiendo conocidos unos caudales, composiciones, temperaturas y presiones de las corrientes correspondientes a las materias primas, la simulación permite predecir caudales, composiciones, temperaturas y presiones de las corrientes producto. También permite el dimensionado de equipos y el cálculo del consumo de materias primas y energía. De esta forma se puede evaluar el diseño. En la evaluación del diseño hay muchos aspectos involucrados: la economía del proceso es el primer criterio obvio, pero no el único. Los procesos químicos se han de diseñar como parte de un desarrollo industrial sostenible, que permite mantener la capacidad de nuestro ecosistema para seguir permitiendo las actividades industriales y la vida. En la práctica, esto significa que se deben minimizar las emisiones de residuos y que los subproductos residuales no han de ser perjudiciales para el medio ambiente. El desarrollo sostenible también implica que el consumo energético sea el mínimo posible. El proceso, además, ha de cumplir con 8
Introducción y planificación del curso. La simulación de procesos en la industria química actual
criterios de seguridad e higiene (salud). La puesta en marcha, la parada en caso de emergencia y la facilidad de control son otros factores importantes. La flexibilidad (posibilidad de operar en otras condiciones, tales como materias primas diferentes o diferentes especificaciones de productos) puede ser también importante, al igual que la disponibilidad anual de tiempo. Algunos de estos factores se pueden cuantificar fácilmente (economía), otros con frecuencia no. Para estos últimos el criterio del ingeniero de diseño juega un papel importante. Una vez que se ha evaluado el diseño básico, es posible mejorar éste realizando cambios, es decir, optimizándolo. La OPTIMIZACIÓN puede involucrar la síntesis de estructuras alternativas (optimización estructural) en cuyo caso se realizaría una nueva simulación y evaluación, y así sucesivamente. O, alternativamente, se puede realizar una optimización paramétrica de una estructura, modificando las condiciones de operación.
El hecho de que hasta los procesos ya establecidos y que llevan operando un gran número de años se siguen modificando hoy en día es una muestra de lo difícil que todo este mecanismo de SÍNTESIS+SIMULACIÓN+OPTIMIZACIÓN resulta en la práctica.
4. DISEÑO GLOBAL DE PROCESOS QUÍMICOS Y EL “MODELO DE CEBOLLA” El diseño del proceso comienza en el reactor. El diseño del reactor dicta las necesidades de separación y recirculación del proceso. Alimentación
Reactor
Producto Subproductos + Reactivos no reaccionados
Pero no toda la alimentación reacciona, además, también se generan subproductos, que es preciso separar para obtener el producto en la pureza requerida. Recirculación de reactivos Alimentación Reactor
Producto
Subproducto
En este diagrama de flujo, las necesidades energéticas (calentamiento/enfriamiento) se obtienen de sistemas auxiliares externos (vapor y agua de refrigeración), por lo que es ineficaz energéticamente. Por ello se debe intentar recuperar la energía: integración energética (intercambio de calor entre las corrientes que tienen que enfriarse y los que tienen que 9
Introducción y planificación del curso. La simulación de procesos en la industria química actual
calentarse, resultando en una red de cambiadores de calor (HEN)–cuya estructura tiene muchas posibilidades).
Sin embargo, si cambiamos el reactor o las condiciones del mismo, se modifica el problema de separación y recirculación. Por ejemplo, si queremos, aumentado el tamaño del reactor, aumentar la conversión, el resultado será que hay menos reactivos no reaccionados, más cantidad de producto y una cantidad significativamente mayor de subproductos, por lo que puede ser necesaria una secuencia diferente de los procesos de separación posterior. Recirculación de reactivos
Alimentación Reactor
Producto
Subproducto
Si además realizamos la integración energética, tendremos nuevos esquemas de HEN.
Los diferentes diagramas de flujo se pueden evaluar mediante simulación y cálculos económicos (por ejemplo, dando como resultado que una de las opciones es más prometedora que las demás). Sin embargo, no podemos estar seguros de haber encontrado el diagrama de 10
Introducción y planificación del curso. La simulación de procesos en la industria química actual
flujo óptimo antes de haber optimizado las condiciones de operación para cada uno de ellos (por ejemplo, puede haber otra alternativa con más posibilidades de mejora). Por lo tanto, la complejidad de la síntesis de procesos es doble: •
¿Podemos identificar todas las estructuras posibles?
•
¿Podemos optimizar cada estructura para obtener una comparación válida? (en la optimización de una estructura puede haber muchas maneras en las que llevar a cabo una tarea dada, y también muchas formas de interconectar las tareas individuales...)
Todo esto implica simular y optimizar un gran número de opciones, lo que supone una complejidad abrumadora. Por ello, para desarrollar una metodología es preciso tener una idea clara de la estructura del problema. Si el proceso requiere un reactor, entonces el diseño comienza con éste. Como hemos visto, la selección del reactor dicta los problemas posteriores de separación y recirculación, que son los pasos siguientes en el diseño. Conjuntamente con el reactor, definen las necesidades energéticas del proceso, por que el diseño de la HEN viene a continuación. Las necesidades energéticas que no se pueden suplir mediante integración energética originan las necesidades de sistemas auxiliares (vapor, agua de refrigeración, etc.). Esta jerarquía se puede representar simbólicamente por las capas de una cebolla, diagrama que enfatiza la naturaleza secuencial (o jerárquica) del diseño de procesos químicos: REACTOR SEPARACIONES Y RECIRCULACIONES
Fig. 5. Diagrama de “cebolla” del diseño jerarquizado de procesos químicos Por supuesto, algunos procesos no necesitan un reactor (por ejemplo, en refino de petróleo). En estos casos el diseño comienza con el sistema de separación y va también hacia la parte exterior. La jerarquía se mantiene. En la práctica hay muchas opciones y para su evaluación completa es preciso llegar al diseño completo, lo cual muchas veces no es posible, prácticamente hablando. Por lo tanto, como vemos, la tarea de diseño involucra un procedimiento iterativo, en el cual la etapa de síntesis está siempre seguida por una etapa de análisis, la cual determina si la estructura y los parámetros propuestos funcionarán como se espera. Si las metas de diseño no se alcanzan, se requiere un nuevo paso de síntesis para crear o una solución factible o una solución mejorada. En cualquier caso, para el diseño de un proceso siempre se necesita un modelo matemático del proceso que nos permita efectuar el análisis y optimización de las diferentes alternativas posibles.
11
Introducción y planificación del curso. La simulación de procesos en la industria química actual
5. MODELIZACIÓN EN PROCESOS QUÍMICOS Es sabido que el procedimiento metodológico fundamental para resolver un problema en ingeniería consiste en representarlo de una manera adecuada, para lograr una sustitución del sistema real (equipo, proceso, etc.) por uno más adecuado para su tratamiento formal. Por lo general, las herramientas lógico-matemáticas nos brindan un marco útil para representar mediante un sistema de símbolos y reglas, el comportamiento de los sistemas reales. Bajo el método científico, por ejemplo, se consolidan leyes y teorías en diversas ramas del conocimiento, las cuales son expresables por medio de sistemas de ecuaciones diferenciales. En otras palabras, se logra construir un nuevo sistema, del cual conocemos sus reglas de juego y símbolos, como un resultado de un proceso de abstracción de la realidad. Obviamente, dado la infinita complejidad de los fenómenos fisicoquímicos, estas construcciones abstractas, conocidas genéricamente como modelos, son sólo meras aproximaciones de la realidad. En efecto, no es otra cosa lo que se realiza cuando en física utilizamos ecuaciones para describir el movimiento de una partícula, o resolvemos los balances correspondientes aplicando las leyes de conservación de la materia, energía o cantidad de movimiento; o bien cuando nos enfrentamos al diseño de un equipo según los procedimientos que conocemos a partir del campo de las operaciones unitarias. De aquí se desprende que si bien el sistema real a estudiar es único, puede existir un número muy grande de modelos asociados al mismo. En efecto, para obtener un modelo que pueda resolverse (es decir que sea útil), resulta necesario adoptar un conjunto de hipótesis. Por ejemplo, si consideramos la fricción, si es importante o no contemplar el intercambio de energía por radiación, etc. Las necesidades de exactitud que el problema a resolver nos impone, determinan el conjunto de hipótesis a utilizar. En resumen, dado el sistema real y los objetivos tecnológicos perseguidos, existirá un conjunto de hipótesis adecuadas que determinarán las características del modelo, o sistema de ecuaciones a resolver. Resulta evidente que no todo sistema de ecuaciones puede resolverse fácilmente, al menos desde el punto de vista analítico. Esto impuso a lo largo de la historia limitaciones importantes al tipo de modelos que podían resolverse, o de otra forma, la necesidad de recurrir a hipótesis inadecuadas o restrictivas (supersimplificaciones) para al menos poder tratar el problema. Es por ello también que en los orígenes de las ciencias tecnológicas los modelos podían ser considerados en gran medida como empíricos, esto es, con parámetros incorporados que surgían de experiencias, y no a partir de los primeros principios o leyes fundamentales. No debe extrañar que aún hoy, pese a todos nuestros avances, exista la necesidad de utilizar permanentemente parámetros en nuestros modelos, que no son otra cosa que la medida de nuestra ignorancia, y por lo tanto, implican la necesidad de reemplazar las leyes básicas por aproximaciones causales obtenidas de datos experimentales. Este es el caso, por ejemplo, de la estimación de las propiedades de equilibrio de mezclas de comportamiento altamente no ideal. A medida que evolucionaron las diversas ramas de las matemáticas y con la incorporación de la ciencia de la computación, poderosa herramienta complementaria al análisis numérico y simbólico, se abrieron caminos revolucionarios. Contar con herramientas más potentes para resolver sistemas de ecuaciones, o lo que es lo mismo, relativizar la necesidad de adoptar hipótesis inadecuadas al plantear modelos para resolver problemas complejos, resultó un gran paso adelante. Más aún, la velocidad de cálculo provocó que la dimensión abordable se incrementara rápidamente. En efecto, si bien el grado de complejidad conceptual para resolver 12
Introducción y planificación del curso. La simulación de procesos en la industria química actual
la inversa de una matriz de dimensión tres es equivalente al de una de cinco mil, resulta obvio que la complejidad operativa no resulta comparable. La computación ha acabado literalmente con dicha limitación, haciendo ahora tratables problemas cuya dimensión es tal, que décadas atrás ni siquiera era pensable plantearlos. Dentro de este contexto, el propósito de los siguientes capítulos es mostrar cómo implementar modelos para resolver problemas comunes en el campo de la ingeniería química, cómo resolverlos desde el punto de vista computacional, y otro punto importante, qué tipos de problemas (modelos) surgen al cubrir distintos aspectos de la ingeniería. En este punto resulta necesario comentar que los problemas de diseño, optimización, simulación dinámica o estacionaria, supervisión o diagnóstico de fallos en tiempo real, etc., tienen cada uno particularidades específicas, lo cual a su vez implica la conveniencia de utilizar modelos apropiados para cada caso.
5.1. Los métodos numéricos como herramienta para la modelización de procesos en ingeniería química La simulación digital constituye una poderosa herramienta para la resolución de las ecuaciones que describen a los sistemas en ingeniería química. Las principales dificultades que se plantean son principalmente: a) Encontrar la solución de un sistema de ecuaciones algebraicas no lineales (que usualmente se efectúa mediante un método iterativo. b) Efectuar la integración numérica de ecuaciones diferenciales ordinarias y en derivadas parciales mediante ecuaciones discretizadas en diferencias finitas que aproximan a las soluciones de las ecuaciones diferenciales continuas. Los métodos numéricos son una clase de algoritmos para resolver una amplia variedad de problemas matemáticos. Únicamente se emplean operaciones lógicas y aritméticas; por consiguiente, pueden implementarse fácilmente sobre ordenadores digitales. En realidad, los métodos numéricos fueron desarrollados muchos años antes que surgieran los ordenadores electrónicos digitales. En efecto, un gran número de los métodos numéricos usualmente utilizados datan de los comienzos de las matemáticas modernas. Sin embargo, el empleo de tales métodos estuvo restringido hasta la llegada de los ordenadores, incrementándose drásticamente al llegar a la mayoría de edad con la introducción de los ordenadores electrónicos digitales. La combinación de métodos numéricos y ordenadores digitales constituye una poderosa herramienta para el análisis matemático. Por ejemplo, los métodos numéricos son capaces de manejar no linealidades, modelos asociados a geometrías complejas y sistemas de ecuaciones acopladas que son necesarios para la modelización eficiente de muchos sistemas fisicoquímicos que se presentan en ingeniería. En la práctica, rara vez se consideran enfoques analíticos a los problemas de ingeniería en razón de la complejidad de los sistemas a resolver. Aún en problemas para los que podrían obtenerse con cierto esfuerzo soluciones analíticas, los métodos numéricos son poco costosos, fáciles de emplear y con frecuencia se dispone de ellos en programas comerciales. Es sabido que si un problema no puede resolverse analíticamente, lo mejor es programarlo en un ordenador (mediante un algoritmo adecuado). Este punto de vista se debe, sin lugar a 13
Introducción y planificación del curso. La simulación de procesos en la industria química actual
dudas, al enorme poder de cálculo de los métodos numéricos. Sin embargo, también es cierto que existen muchos problemas que son imposibles de resolver utilizando métodos numéricos. Para diversos problemas no se ha encontrado todavía un modelo matemático completo y seguro, de manera que resulta obvio que es imposible encontrarles una solución numérica. La dimensión de otros problemas es tan grande que su solución está más allá de los límites prácticos en términos de la tecnología computacional disponible. Por ejemplo, en problemas fluido-dinámicos que involucran flujos turbulentos, en estimaciones meteorológicas o c1imáticas (campos de vientos, presiones, temperaturas, etc.), y como veremos más adelante, en diversos problemas que se plantean en el área de la ingeniería química, existen serias limitaciones en el área de diseño y de optimización en tiempo real, etc. En los últimos años se han desarrollado grandes programas computacionales comerciales para simular el comportamiento de sistemas de ingeniería de todo tipo. Usualmente, estos programas se diseñan para que sean utilizados por aquellos profesionales de la ingeniería sin un conocimiento intensivo de su funcionamiento interno. Por otra parte, existen bibliotecas (en continua expansión) de subrutinas de cálculo que utilizan sofisticados métodos numéricos para realizar una amplia variedad de tareas matemáticas, cubriendo virtualmente todos los campos del análisis numérico, aplicaciones estadísticas, etc. Resulta obvio que cuando se disponga de programas o subprogramas que han sido probados y demostrado su buen funcionamiento, lo más razonable es utilizarlos. No obstante, es altamente valioso el conocimiento del funcionamiento de tales herramientas, dado que por lo general el usuario de tales programas o subrutinas encontrará dificultades en su utilización. Estas dificultades pueden provenir de múltiples causas. Por ejemplo, es necesario remarcar que los métodos numéricos no están completamente libres de dificultades en todas las situaciones en las que se los utilice. Por otra parte, aún en el caso que no presenten dificultades de cálculo, podrían no funcionar de manera óptima en todas las situaciones que se planteen. Siempre debe tenerse presente que la exactitud y la estabilidad numérica afectan a la ecuación discretizada utilizada (algoritmo de integración). En la literatura respectiva se han propuesto muchos algoritmos. Algunos de ellos trabajan mejor que otros sobre determinados problemas (por ejemplo más rápido y por consiguiente son menos costosos para un grado especificado de exactitud). Desgraciadamente no existe un algoritmo que funcione en forma óptima para todos los problemas que se plantean. Por otra parte, el usuario en búsqueda de una subrutina de cálculo para realizar una determinada tarea, puede encontrar una agobiante variedad de subprogramas que pueden ser aplicables, pero el material descriptivo rara vez dará una indicación sobre la eficiencia de la subrutina para resolver un problema específico. Esto sucede además, en la mayoría de los productos comerciales más elaborados, por ejemplo, para la modelización en ingeniería. Dentro de este contexto, es muy probable que el ingeniero que espera utilizar un programa o una subrutina de una biblioteca para resolver un problema matemático determinado encuentre dificultades inesperadas, a menos que tenga una preparación adecuada. En efecto, la selección y aplicación de un método numérico en una situación específica, por lo general resulta más una actividad propia de un arte que de una ciencia. Por último, nunca resulta trivial la interpretación de los resultados obtenidos. Por consiguiente, el usuario que no tenga la habilidad ni el conocimiento para seleccionar y utilizar un método numérico para aplicar a un problema específico y efectuar la programación del método, encontrará una severa restricción en el rango de problemas que puede manejar. En general deberá buscar a alguien con la información necesaria, si es que existe ese alguien a 14
Introducción y planificación del curso. La simulación de procesos en la industria química actual
quien consultar. Más aún, en esta situación resultará poco probable que el usuario pueda formular las preguntas correctas y el consultor suministrar las respuestas adecuadas, dado que el nivel de conocimientos de ambos resultaría muy diferente, dificultando la comunicación entre ambos. En resumen, en los últimos tiempos se ha desarrollado una gran variedad de paquetes informáticos para resolver numéricamente sistemas de ecuaciones que se plantean en problemas en modelización en ingeniería. En teoría, estos paquetes relevan al ingeniero de adquirir conocimientos acerca de los métodos de integración numérica. Supervisan automáticamente los errores y la estabilidad del método ajustando el paso o intervalo de integración para satisfacer un criterio de exactitud. En la práctica, es sabido que estos lenguajes no resuelven todos los problemas. En su afán por generalizar, usualmente se vuelven ineficientes en muchas aplicaciones específicas, por ejemplo, desde el punto de vista del tiempo computacional. En estos casos resulta más conveniente desarrollar un programa específico escrito, por ejemplo, en lenguaje FORTRAN, BASIC o PASCAL. Con respecto a los productos informáticos que utilizan para la modelización un lenguaje de alto nivel, debe remarcarse que el tiempo de formulación y de resolución del modelo se reduce, en especial para aquellos ingenieros que no dominan métodos de programación y utilizan el ordenador ocasionalmente. Cualquiera que sea la situación, es evidente que la utilización de un paquete integrado que facilite escribir un modelo para simulación y permita directamente la resolución numérica requiere el aprendizaje de un nuevo lenguaje y de un nuevo utilitario. En el caso que se conozca algún lenguaje de programación, dado que las técnicas numéricas programadas de manera sencilla funcionan bien, deberá compararse el esfuerzo que implica desarrollar un programa específico para el problema que se desea resolver, con el uso de subprogramas. En efecto, la experiencia demuestra que es más conveniente el desarrollo propio, ya que no sólo es computacionalmente más eficiente, sino que además garantiza al estudiante o ingeniero el conocimiento de cómo funciona el programa (por ejemplo, un simulador para un equipo dado) y cuáles son las hipótesis realizadas y las técnicas utilizadas. Esta metodología permite la supervisión del programa y su modificación, para manejar de manera más fácil y eficiente nuevas situaciones que se planteen. Una solución intermedia es programar el modelo particular (sistema específico de ecuaciones a resolver), utilizando para el cálculo alguno de los métodos disponibles para tal fin, aprovechando la disponibilidad de los numerosos paquetes numéricos de resolución, tanto de sistemas de ecuaciones algebraicas como de ecuaciones diferenciales, ordinarias o a derivadas parciales. En muchos lugares (universidades, institutos de investigación, etc.) y en el mercado, se dispone de bibliotecas de subrutinas de cálculo como las IMSL, NAG, Numerical Recipes, entre otras. En general, para cada rama, tanto de las matemáticas, de la estadística y/o de las aplicaciones de ingeniería, se han presentado en el mercado un gran número de aplicaciones para resolver muchos problemas de modelización de procesos, tales como diseño, simulación, síntesis, optimización, etc. Además, desde el punto de vista del alcance, los hay diseñados para un uso general así como para uno específico (por ejemplo, hornos, procesos petroquímicos, procesos que manipulan sólidos, sistemas con electrolitos, reactores biológicos, síntesis de moléculas, etc.). No es el objetivo del presente curso efectuar un análisis detallado del software disponible comercialmente ni de las aplicaciones específicas desarrolladas, ni realizar una descripción 15
Introducción y planificación del curso. La simulación de procesos en la industria química actual
exhaustiva de todos los paquetes informáticos existentes, dado que el mercado actual es muy dinámico. Sí resulta importante que el alumno adquiera habilidad para comprender claramente el alcance general de los instrumentos computacionales disponibles, las tendencias, la necesidad de disponer de capacidad para generar sus propias herramientas para modelizar problemas específicos o para adquirir o utilizar nuevos productos.
6. TENDENCIAS ACTUALES EN EL DISEÑO DE PROCESOS Las tendencias actuales en el diseño de procesos pasan por: • Reducción de los costes de las materias primas • Reducción de la inversión de capital • Reducción del consumo energético • Incremento de la flexibilidad del proceso y reducción del almacenamiento de productos • Mayor énfasis en seguridad • Mayor atención a la calidad • Mejor comportamiento medioambiental Para la consecución de todos estos objetivos la simulación de procesos juega un papel muy importante, ya que: •
Reduce el tiempo de diseño de la planta, permitiendo al diseñador comprobar varias configuraciones de planta
•
Ayuda a optimizar el proceso, permitiendo responder a preguntas del tipo “y si”, así como determinar las condiciones de proceso óptimas para unas restricciones dadas.
•
Predice los costes de planta y la viabilidad económica
7. BIBLIOGRAFÍA •
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Turton, R., Bailie, R.C., Whiting, W.B., Shaeiwitz, J.A., “Analysis, Synthesis, and Design of Chemical Processes”, Prentice Hall, Nueva Jersey (1998).
•
Scenna, N.J.; Editor, “Modelado, Simulación y Optimización de Procesos Químicos”, Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica
16
I.
Termodinámica y modelización rigurosa de procesos
Termodinámica de sistemas no ideales Julio L. Bueno de las Heras Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Termodinámica de sistemas no ideales
ÍNDICE CONTEXTO, OBJETIVOS Y CONTENIDO ...............................................................19 1. MODELOS PARA DESCRIBIR PROCESOS QUÍMICOS ..................................19 1.1. El modelo termodinámico .....................................................................................22 2. MODELO TERMODINÁMICO PARA EQUILIBRIO ENTRE FASES .............25 2.1. Equilibrio de sustancias puras ...............................................................................25 2.2. Equilibrio de mezclas multicomponentes..............................................................34 3. PRINCIPALES LIBROS RECOMENDADOS .......................................................45
CONTEXTO, OBJETIVOS Y CONTENIDO Estamos en un curso sobre modelización avanzada de procesos químicos. La modelización es una forma eficaz de aproximarse a una realidad compleja sustituyéndola por interpretaciones fragmentarias o particularmente focalizadas de sus distintas facetas o elementos integrantes. Lenguaje, filosofía y matemáticas, por citar obviedades, son ámbitos de modelización, donde fonemas vehiculizan conceptos de acuerdo con convenios idiomáticos, morfológicos y sintácticos; donde conceptos, definiciones y convenios aproximan ordenadamente a la percepción de la realidad material e inmaterial al socaire de teorías o principios; y donde operadores, ecuaciones, algoritmos, transformaciones y otros recursos configuran probablemente su interpretación cuantitativa más eficaz, abstracta, y universal. La Termodinámica es una ciencia teórica y experimental que aporta un eficaz bagaje de modelos, capaces de describir las complejas relaciones de equilibrio que se producen entre las sustancias químicas. Los modelos termodinámicos pretenden interpretar y predecir el comportamiento físicoquímico de la materia en equilibrio estático o dinámico. De introducir y justificar de forma somera estos modelos de forma práctica se trata en este tema, y de describirlos de forma resumida se ocupa el siguiente.
1. MODELOS PARA DESCRIBIR PROCESOS QUÍMICOS Parece asumido que un proceso químico es un conjunto armónico, espontáneo o finalista, de transformaciones de la energía, incluida la materia como forma sustanciada de aquélla. La naturaleza es un bullente escenario de procesos químicos, buena parte de los cuales, probablemente los más complejos, son las transformaciones que configuran las distintas formas de la vida. Generalmente el concepto de proceso químico se aplica a transformaciones artificiales, con las que se pretende producir unas sustancias a partir de otras, aislar unas sustancias de otras, o modificar sus características. Los procesos químicos naturales son el resultado de complejos fenómenos interactivos y evolutivos. Los procesos químicos artificiales son el resultado de una selección inteligente entre las más afortunadas sugerencias, resultantes ocasionalmente de casualidades y frecuentemente de pruebas sucesivas, ejecutadas con variopintas tácticas y recompensadas con diferente fortuna. La experiencia -saber qué- y la habilidad técnica saber hacer- terminan por suscitar, antes o después, el pensamiento reflexivo - saber por qué-. La reflexión
19
Termodinámica de sistemas no ideales tiene una proyección generalista, el conocimiento filosófico y científico de la realidad tangible - y una finalidad práctica - el conocimiento estratégico que permite adelantarse a la experiencia o encauzarla para hacerla más eficaz. Las ingenierías son las disciplinas resultantes de la aplicación sistemática de la intuición - de ahí su componente artística-, de principios heurísticos - de ahí su componente “ingeniosa”- y de conocimientos científicos a la resolución de problemas preexistentes, a la satisfacción de necesidades y a la búsqueda de retos, resolviendo eficazmente el compromiso entre tiempo, medios y objetivos (ingenio = maquina). Toda ingeniería se vincula a máquinas, a artefactos o a protocolos pautados capaces de coordinar ordenadamente esfuerzos para hacer cosas útiles. La Ingeniería de Procesos ofrece recursos versátiles para la gestión de situaciones complejas integradas por fenómenos interrelacionados. La Química y la Ingeniería Química ofrecen recursos eficaces para dar contenido científico riguroso de esos fenómenos. La convolución de un saber hacer genérico y de un saber qué concreto crea el ámbito científico y profesional de la Ingeniería de los Procesos Químicos.
Fig.1. Modelos y conceptos termodinámicos en su contexto 20
Termodinámica de sistemas no ideales
La pieza clave del conocimiento científico analítico y sintético- el learning object por excelencia- es su unidad lógica, el modelo. Ante la imposibilidad radical o coyuntural del conocimiento absoluto- probablemente vedado a la humana condición- no existe otra forma de construcción del edificio de la ciencia que la aproximación analógica - el como-si, el modelo -. Los modelos son válidos en tanto explican la realidad y permiten interpretar o predecir sus cambios. Si un modelo falla se sustituye, o más frecuentemente, se apuntala con otros modelos que tratan de explicar sus desviaciones, hasta que resulta más rentable intelectualmente introducir otro modelo radicalmente innovador, que ha de resolver lo que el anterior resolvía y ser capaz de superar con elegancia y éxito sus limitaciones Los modelos han de resolver, también, muchos compromisos, principalmente los que existen entre precisión y tiempo, y los que existen entre complejidad y disponibilidad de información.
Figura 2. Modelización lógica típica de ingeniería de procesos: Un proceso complejo resulta de la interrelación de unidades más sencillas tipo caja negra, convencionalmente identificadas, sometidas a condicionantes externos, interconectadas a través del flujo de información común y provistas de ciertos grados de libertad.
Fig.3. Modelización fenomenológica típica en Ingeniería Química 21
Termodinámica de sistemas no ideales
El subsistema - la pieza funcionalmente diferencial- en un proceso químico es la operación básica. El modelo de operaciones básicas en un modelo basado en ecuaciones de diseño de etapas discernibles y repetitivas dentro de los procesos. Miles de procesos que manejan y producen millones de sustancias químicas se configuran a partir de una decenas de operaciones básicas. El modelo de operaciones básicas, que se describe en la Fig. 3. muestra cómo se integran los modelos de equilibrio (Termodinámica) con los modelos cinéticos (Fenómenos de transporte y Reactividad Química) y con los modelos estequiométricos, que no son otra cosa que traducciones del principio de conservación.
1.1. El modelo termodinámico La Termodinámica es una ciencia que nació de la necesidad de optimizar el rendimiento de procesos de separación y de conversión termomecánica.. La Termodinámica clásica es una termodinámica macroscópica de equilibrio. La Termodinámica actual abarca la energética de reacciones y buena parte de los fenómenos de transporte y reactividad química en el contexto de la llamada Termodinámica de los procesos irreversibles, proyectándose en el ámbito corpuscular a través de los modelos de Termodinámica Estadística.
Fig. 4. El “modelo Termodinámico” resulta de la integración de definiciones, recursos, principios y modelos de comportamiento a distintos niveles de descripción.
a. Ámbito de la termodinámica El procedimiento termodinámico se basa en la introducción coherente de propiedades de interés práctico - P, V, T, H, F, G, S, F...- asume unos principios generales de evidencia 22
Termodinámica de sistemas no ideales
incuestionable - por el momento cuatro- y adopta unos formalismos matemáticos - relaciones de Maxwell- derivados de las cualidades atribuidas a estas propiedades - ligadas por ecuaciones diferenciales exactas en campos continuos-. En torno a este ámbito formal, la Termodinámica discurre en dos dominios paralelos y permeables. En el dominio experimental se nutre de constantes aportaciones de la experimentación sistemática y de la propia práctica de los procesos, que son fuente inagotable de datos. El análisis de estos datos ha permitido inferir algunos principios generales de la naturaleza concernientes a las relaciones energéticas - equilibrio térmico, equivalencia teórica y práctica entre calor-trabajo y orígenes de entropía, así como la correlación de estos para deducir modelos empíricos de comportamiento. En el dominio teórico la Termodinámica desarrolla modelos ideales - gas ideal, principio de estados correspondientes, mezcla ideal...- que contrasta con la evidencia experimental introduciendo sucesivas correcciones - modelos de estado de fluido reales, discrepancias del P.E.C., fugacidades, modelos para mezclas reales, coeficientes de actividad, etc.- Los modelos de estado son relaciones PVT macroscópicas que permiten obtener formas prácticas de las relaciones entre otras propiedades termodinámicas de significación más compleja y que, auxiliados por modelos de estructura molecular (corpusculares y estadísticos) permiten una explicación mecanística de las propias teorías de estado y una interpretación rigurosa de las propiedades.
b. Propiedades y principios termodinámicos Las propiedades termodinámicas son las piezas conceptuales con las que explicar las leyes y describir los fenómenos. La única restricción en la definición de propiedades termodinámicas está en su utilidad, en su coherencia interna y en la coherencia de su incorporación al contexto de otras propiedades predefinidas y consolidadas. Las propiedades termodinámicas básicas se introducen a partir de la experiencia, y parece consensuado que sean P y V. La temperatura T se introduce a partir de la evidencia conocida como “principio cero” y las demás propiedades energéticas -U, H, F y G y sus derivadas- se introducen a partir de los principios primero y segundo. Los conceptos de entropía -S- y reversibilidad surgen de la evidencia titulada “tercer principio”. Salvo en el caso de la temperatura, el volumen y la entropía, no es preciso especificar ningún origen, atendiéndose sólo a las variaciones que experimentan en el transcurso de los procesos. Hay otras propiedades termodinámicas que permiten describir otros fenómenos -eléctricos o magnéticos- o modelizar otras situaciones más complejas, como es el caso sistemas multifásicos y multicomponentes. Por ejemplo, la composición como descriptor de mezclas, la tensión superficial, como descriptor de la energía vinculada a la presencia de interfases, las funciones de trabajo para describir las vías de comunicación del sistema termodinámico con el entorno o el potencial químico para describir la tendencia hacia equilibrio entre fases o a través de reacciones químicas.
El calor y el trabajo son formas de relacionarse los sistemas con otros sistemas concretos o con un entorno abstracto, modificando su estado. Como es sabido, el estado es reproducible en todas sus propiedades cuando un número determinado de propiedades intrínsecas independientes adopta los mismos valores (coordenadas de estado), pero se puede cambiar de estados con muy diferentes intercambios de calor y de trabajo. Las leyes de la termodinámica son evidencias experimentales de carácter general, independientes de cualquier teoría de estado. La naturaleza establece también una correspondencia biunívoca entre los valores de un determinado número de propiedades de estado del sistema y ese estado. Ese número depende de la complejidad del sistema a través de un modelo de estado o regla lógica que establece dos grados de libertad para fases simples de un solo componente, un grado de libertad más por cada componente y un grado menos por cada fase más en equilibrio. Es la llamada regla de las fases, que bien podría ser considerada como una ley o principio termodinámico más.
23
Termodinámica de sistemas no ideales
c. Termodinámica formal La naturaleza ha establecido que las sustancias puras ven definido inequívocamente su estado termodinámico, es decir, el valor de todas sus propiedades termodinámicas, cuando dos de éstas adoptan valores concretos. Trasponiendo esta evidencia al ámbito matemático, resulta que cualquier variable de estado se vincula a una superficie continua Z(X,Y), en principio indefinida, pero en la práctica reducida e las coordenadas de existencia de la materia en los distintos estados en los que esta se pueda encontrar. Una vez establecida una correspondencia entre definiciones (propiedades) y funciones matemáticas (coordenadas), los propios mecanismos matemáticos permiten establecer relaciones que podrían no ser evidentes por un procedimiento inductivo directo. Los principales mecanismos matemáticos de relación son las llamadas relaciones de Maxwell, que establecen relaciones bien conocidas, como: dz= (∂z/∂x)y dx + (∂z/∂Y)x dY = mdx + n dY ∂m/∂Y = ∂n/∂X y las de ellas derivadas, que permiten establecer relaciones concatenadas entre variables termodinámicas del tenor : (∂G/∂P)T=V
-(∂S/∂P)T=(∂V/∂T)P
F= G- P(∂G/∂P)T
F= H-S(∂U/∂S)V-V(∂U/∂V)S
que facilitan acometer la resolución de problemas termodinámicos con gran eficacia en un campo imagen que no precisa sentido físico evidente, pero sí muy fiable en los cálculos:
Fig.5. Simulación gráfica de algunas cualidades de las diferenciales exactas útiles en la formulación y análisis de rutas termodinámicas 24
Termodinámica de sistemas no ideales
De hecho el estado de una substancia viene integrado por tantas superficies continuas de estado yuxtapuestas como fases en las que tenga existencia, limitadas por las coordenadas de existencia de la substancia (por ejemplo, hasta temperaturas inferiores a las de autoreactividad o descomposición química, que son puertas a otros escenarios de fases). El equilibrio entre fases para sustancias puras será una región común a dos superficies de estado- asimilable una línea- y el equilibrio entre tres fases será una región común a tres superficies de estado asimilable a un punto-. En situaciones termodinámicas más complejas, por ejemplo sistemas multicomponentes, la definición del estado va vinculada matemáticamente a la de un hiperespacio
2. MODELO TERMODINÁMICO PARA EQUILIBRIO ENTRE FASES 2.1. Equilibrio de sustancias puras a. Relaciones entre propiedades termodinámicas Según el primer principio, un cambio discreto de energía interna se debe al balance: U = Calor recibido + trabajo realizado sobre el sistema = =- calor cedido- trabajo realizado por el sistema sobre el entorno En ausencia de otras formas posibles de trabajo distintas al mecánico de expansión compresión, restricción que se mantendrá en lo sucesivo en tanto no se diga lo contrario, para un cambio diferencial y reversible, y de acuerdo con el tercer principio, dS= dq/T, resulta dU = dq - pdV = TdS - pdV Si el proceso no es reversible, ni el calor es TdS ni el trabajo se puede calcular mediante la integración de la función continua pdV, aunque sí se puede deducir su balance neto a través de los cambios de energía interna. De la misma forma, si se conocen estos datos, calor recibido y trabajo realizado, sí que se puede calcular el cambio de energía interna experimentado por el sistema. El concepto de trabajo útil va vinculado a la capacidad de producir cambios en el entorno y, por tanto, al grado de reversibilidad, por lo que es un concepto vinculado al tipo de proceso. De hecho hay procesos de expansión que no producen trabajo útil alguno, como la expansión libre irreversible de gases, lo cual no quiere decir que no haya cambios del tipo p∆V o V∆p invertidos en turbulencia interna y, por tanto, en un aumento de entropía no predecible teóricamente, pero sí evaluable a partir de las condiciones finales (por ejemplo en coordenadas P, T).
La entalpía se define incluyendo el término de entidad PV en la forma H = U + PV por lo que para un cambio diferencial resulta dH= dq + VdP= TdS+VdP Las propiedades que pueden definirse sin una vinculación a la materia se denominan propiedades de campo. Las más intuitivas son P y T. Las propiedades vinculadas a la materia se denominan propiedades de densidad (V, U, H y S). Si se definen para un sistema lo hacen en forma extensiva, pero si se refieren a una unidad de referencia lo hacen de forma intensiva (por ejemplo la densidad, el volumen molar o la energía interna específica). Obviamente, y para mayor generalidad, las propiedades se correlacionan en sus formas intensivas.
25
Termodinámica de sistemas no ideales
De la misma forma se introducen las funciones de trabajo útil - funciones de Gibbs y Helmoltz- excluyendo de las formas energéticas anteriores la fracción vinculada al desorden térmico, y por tanto, la parte de la capacidad energética incapaz de ser puesta en juego en la producción de trabajo útil reversible. Así: F = U - TS dF= -pdV-SdT G = H - TS dG= Vdp-SdT Como se verá más adelante, la función de Gibbs es igual para fases en equilibrio, es decir, que no depende de la densidad, por lo que resulta la propiedad más adecuada para definir el equilibrio, junto con la presión y la temperatura que son propiedades de campo. Su utilidad se pone de manifiesto al tratar de mezclas en equilibrio, ya que a partir de ella se define el concepto de potencial químico µ. La ventaja de las formulaciones típicas de las propiedades termodinámicas es su significación en situaciones simples, como cambios isotermos, isóbaros, isócoros, etc. Así los cambios de entalpía pueden calcularse a partir del balance calorífico en condiciones isóbaras, y la variación de la función de Gibbs, G, representa el trabajo de flujo en condiciones isotermas. Gracias a las características de estado, un proceso real entre dos estados conduce a los mismos cambios en propiedades de estado que estos cambios producidos a través de procesos ficticios, lo que es un excelente recurso para optar por sendas de cálculo alternativas cuando se disponga de los datos oportunos. Cualquier formulación termodinámica representa casos particulares de una forma no restringida de vinculación de las propiedades tomadas como variables dependientes de otra pareja tomada como variables dependientes De hecho, cualquier propiedad puede analizarse en función de cambios experimentados en otras dos cualesquiera, es decir, que serían posibles formulaciones U(P,V), F(P,T), G(H,S), V(H,G), H(F,G) etc. Estas otras formas más infrecuentes de las formulaciones no suelen introducirse directamente como las anteriores, sino que suelen aparecer en el contexto de cálculos, y su único problema es la posible incomodidad del manejo de las propiedades implicadas, cuestión menor que se resuelve gracias a las relaciones formales ya mencionadas.
b. Estado de componentes puros En principio cualquier pareja de propiedades puede adoptarse como coordenadas para definir el estado, pero la práctica ha decantado P y T como variables primarias, no tanto por su simplicidad teórica (de hecho el concepto de entropía pudiera ser más simple o primigenio con respecto al de temperatura) como por su carácter de propiedades de campo y su más fácil mensurabilidad experimental. b.1. Modelos ideales El modelo de estado ideal es el modelo de gas perfecto. El gas ideal puede definirse a partir de distintas interpretaciones (Leyes de Boyle, Joule, Gay Lussac y Amagat) que no son más que aspectos parciales del modelo de Clapeyron, PV= nRT. Una evidencia de que estas leyes son redundantes está en que pueden obtenerse unas a partir de otras. Por ejemplo, la misma relación de Joule: dU = dq - pdV = TdS - pdV
(si PV= RT) dUT= 0
Llevando este modelo a las relaciones termodinámicas en las formas dependientes de PVT que pueden inferirse de las relaciones de Maxwell se obtienen relaciones teóricas que 26
Termodinámica de sistemas no ideales
permiten estimar los cambios de las propiedades energéticas en condiciones de idealidad, por ejemplo variaciones de energía interna o entalpía simplemente a partir de calores específicos ideales:
∆U ∗ = ∫ c v dT ∗
y
∆H ∗ = ∫ c p dT ∗
y análogamente para otras propiedades termodinámicas. En fluidos reales estos cambios pueden tomarse como referencia sobre la que evaluar los modelos reales a partir de discrepancias (Ver Figura 6).
b.2. Modelos para fluidos reales En la Figura 7 se presentan las evidencias experimentales de la discrepancia entre un gas real y un gas ideal. La naturaleza pone de manifiesto que estas discrepancias cuantitativas pueden hacerse cualitativas, apareciendo fases condensadas imprevisibles por el modelo de fluido ideal, de forma que, en distintas regiones, las sustancias pueden encontrase en distinto estado de agregación y que el estado de agregación de distintas sustancias las mismas coordenadas de estado puede no ser el mismo. El concepto de estado de agregación concierne a las relaciones intermoleculares, por lo que en la termodinámica clásica se ha definido tradicionalmente en función de la manifestación macroscópica estereotipada de estas interacciones: Estado sólido, cohesionado de forma invariante debido a las fuertes interacciones, estado líquido deformable pero cohesionado debido a interacciones fuertes pero difusas y estado gaseoso, deformable y escasamente cohesionado. La naturaleza permite todas las formas de equilibrio binario (SL, SV y LV) en un amplio intervalo de condiciones, y permite el equilibrio ternario en el llamado punto triple (SLV), por debajo de cuya temperatura y presión no puede darse el estado líquido. Otro punto característico es el llamado punto crítico, por encima de cuya temperatura no puede existir estado líquido.
Fig.6. Interpretación de un cambio real a partir de cambios virtuales 27
Termodinámica de sistemas no ideales
El estado de fluidos reales se puede modelizar por ecuaciones que introducen desviaciones con respecto al modelo de Clapeyron (Fig.7). Las principales correlaciones corresponden a los tipos de discrepancia aditiva (modelos de virial) y discrepancia factorial (modelos de coeficiente de compresibilidad), existiendo modelos mixtos, como los de Van der Waals, Beattie-Bridgeman, Benedict-Webb-Rubin, Redlich-Kwong, etc.
Onnes
P=
RT ⎛ B C D 1 + + + +...⎞⎠ 2 V ⎝ V V V3
Factor de compresibilidad P =
RT Z V
Van der Waals Redlich-Kwong P =
P=
RT a − 2 V −b V
RT a − 0,5 V − b T V (V + b)
La correlación del coeficiente de compresibilidad es muy útil para cálculo de propiedades de fases de un solo componente. Sin embargo, para cálculos rigurosos y para la deducción de equilibrio en sistemas multicomponentes son más útiles las formas paramétricas con adecuadas reglas de mezcla para definir los coeficientes particulares.
Fig.7. Evidencia experimental de las discrepancias entre fluidos reales y gas ideal al correlacionar determinadas propiedades o grupos de propiedades. En la Fig. 8 en se puede apreciar que estas diferencias meramente cuantitativas dan lugar, en otras regiones, a discrepancias cualitativas de las sustancias son calificadas convencionalmente como sólidos, líquidos o gases en función de cuál sea su estado de agregación en la región de estado que coincide con las condiciones ambientales más frecuentes (recuadro), pero que, en principio, cualquier sustancia puede encontrase en cualquier estado si su estructura es estable en sus coordenadas definitorias. Si bien diagramas caricaturescos como los de la figura ponen de manifiesto que hay múltiples formas de discrepar de la idealidad, también ponen de manifiesto una cierta analogía morfológica en torno a puntos o regiones características. Estos diagramas ponen de manifiesto también que las propiedades de campo son iguales en fases en equilibrio, mientras que las propiedades de densidad, vinculadas a la agregación, difieren entre fases en equilibrio.
La ecuación de Van der Waals permite inferir el modelo del factor de compresibilidad de una forma generalizada que se sustancia en el llamado Principio de Estados correspondientes, (PEC), que Young extendió con gran éxito a las regiones condensadas y que otros autores han extendido, a su vez, a la correlación de propiedades de transporte. Según este principio, muchas substancias presentan un estado similar cuando se encuentran en situaciones homólogas con respecto al punto crítico. La mejor concordancia se observa cuando estas coordenadas son las llamadas coordenadas reducidas, Pr=P/Pc, Tr=T/Tc. El valor de la compresibilidad en el punto crítico adopta un valor teórico a partir del modelo de Van der Waals, zc=3/8, que no coincide con los valores observados en la realidad, que oscilan en torno a zc=0,27 como valor
28
Termodinámica de sistemas no ideales más frecuente para muchas substancias de interés. Según este principio, las discrepancias existentes entre modelos ideales y reales (Fig.9) son o adoptan formas funcionales análogas en las mismas coordenadas termodinámicas reducidas (primer nivel de discrepancia) pero, además, las discrepancias observadas en sustancias que no tienen una compresibilidad crítica similar a la predicha por el modelo pueden correlacionarse a su vez (segundo nivel de discrepancia) en función de parámetros característicos, como el factor de Riedel o de Pitzer o, con un mayor sentido práctico, en función de la diferencia entre el valor real y el teórico del coeficiente de compresibilidad, [zc - 0,27].
Fig. 8. Representación cualitativa de las regiones de estado de sustancias puras en las coordenadas más frecuentes
Fig.9. Discrepancia de la idealidad. Inferencia de la correlación del coeficiente de compresibilidad y de las discrepancias de otras funciones termodinámicas
De esta forma, las discrepancias indicadas en la figura 6 están integradas por dos componentes: 29
Termodinámica de sistemas no ideales
Fig.10. Morfología de los diagramas termodinámicos de uso más frecuente Primera componente de discrepancia : f1(P *-P)= f2(Tr,Pr). Las funciones f1 y f2 han de esbozarse teóricamente a partir de las diferencias resultantes de calcular las respectivas funciones a través de las distintas ecuaciones de estado, P * a partir de P*V*= RT y P a partir de PV= zRT. ej: V*-V= RT(1-z) /P =α
Pr ⎛ ∂ z ⎞ H∗ − H 2 ⎟ dPr = RT r ∫ ⎜ 0 Tc ⎝ ∂ Tr ⎠ P Pr r
y análogamente (U*-U)/Tc=f(Pr,Tr), (S*-S)=f(Tr,Pr), (Véase Fig.10), así como las funciones termodinámicas derivadas, (cp* - cp), (kp* - kp), Estas ecuaciones permiten deducir los diagramas de discrepancia de cualquier propiedad a partir del diagrama matriz z(Tr,Pr) o tener una guía para una más eficaz correlación de datos experimentales.
Segunda componente: f1(P *- P) (zc#0,27) =f1(P *- P)PEC + f2(Tr,Pr) Un caso particular es la función de Gibbs, que da lugar a una correlación más útil, en forma de discrepancia factorial, a través de la introducción del concepto de fugacidad, una presión aparente vinculada a la presión real, que permite formular la variación isotérmica de G con el mismo tipo de expresión que la deducida para el gas ideal (ver figura 11): (G*2-G*1)T = RT ln (P*2/P*1) (G2-G 1)T = RT ln (P2/P1)
30
P*1= P1= P0= 1
(G*= G0 +RTlnP)T
(baja presión, ideal = real)
(G= G0+ RTlnf)T f
Termodinámica de sistemas no ideales P
G − G = ∫1 α dP = − RT ln ∗
f P
por lo que la correlación de la discrepancia se hace en forma factorial, introduciendo el concepto de coeficiente de fugacidad ø= f/P Nótese que el modelo matemático puede tener limitaciones que hay que sortear. De hecho, si el concepto de baja presión o presión en la que el modelo real y el ideal conducen a valores similares de la función en estudio se asimilase a 0 y no a 1, la formulación matemática conduciría a una expresión embarazosa de manejar y sin sentido físico práctico.
Fig.11. Introducción del concepto de fugacidad y su correspondiente correlación generalizada de acuerdo con el PEC. c. Equilibrio de fases en componentes puros Las condiciones de equilibrio entre fases de componentes puros pueden determinarse experimentalmente o predecirse a partir de estimaciones teóricas. Cualquier pareja de propiedades invariantes, dX=0, dY=0, puede ser elegida para definir el equilibrio. Sin embargo las propiedades de campo no dan lugar a ambigüedades matemáticas, ya que sus valores son independientes del estado de agregación entre fases en equilibrio (P,T), mientras que las propiedades energéticas, como se ha visto, experimentan una discontinuidad vinculada al balance energético del propio cambio de estado. Por ello se prefiere utilizar la función de Gibbs, que no da lugar a indeterminación cuando dP=0 y dT=0 (dGPT=0, es decir, que G pasa por un mínimo). En la práctica suelen correlacionarse los datos obtenidos para sustancias de interés de acuerdo con formulaciones sugeridas por la teoría, ya que facilitan detectar las formas de correlación más efectiva. Aquí no nos referiremos a ellos, pero unos métodos eficaces para la estimación de propiedades termodinámicas macroscópicas es a partir de los parámetros característicos de los modelos moleculares, y viceversa. De esta forma pueden estimarse directamente muchas propiedades, como las propiedades críticas desconocidas experimentalmente o los parámetros de Riedel y Pitzer, y acceder por esta vía a todas las posibilidades de las correlaciones basadas en el PEC. Una forma derivada de ésta es la estimación de propiedades de densidad a partir de contribuciones de grupo, de forma que muchas propiedades macroscópicas de moléculas complejas, particularmente orgánicas, pueden inferirse por sencillas reglas de combinación en función de la aportación que cada grupo funcional hace al conjunto en función de su entidad absoluta y de su influencia relativa.
31
Termodinámica de sistemas no ideales
Fig.12. Regiones de estado típicas de los diagramas de fases
Fig.13. Teoría y experimentación se complementan recíprocamente para abrir vías opcionales de estimación y correlación de propiedades Veamos algunos ejemplos: Las condiciones de equilibrio entre fases (LV vaporización-condensación, S-L, fusión solidificación, y S-V, sublimación condensación) pueden hacerse directamente tabulando datos de presión de vapor en función de la temperatura, o de calores latentes de cambio de estado en función d e las condiciones de equilibrio o deducirse a partir de los modelos disponibles. En la práctica suelen correlacionarse los datos obtenidos para sustancias de interés de acuerdo con formulaciones sugeridas por la teoría, ya que facilitan acertar con las formas de correlación más eficaz o con sentido físico más evidente. 32
Termodinámica de sistemas no ideales
Así, en condiciones de equilibrio líquido vapor la teoría permite deducir la relación de Clapeyron para la presión de vapor:
ln Pv = −
∆Hv +k RT
en función de la entalpía de vaporización y la temperatura absoluta, a la que se remedan otras A ecuaciones del tipo ln Pv = − y similares, como las ecuaciones de Antoine o Kirchov, bT + c encuentran una significación física razonable para sus parámetros de ajuste A, b y c, singulares para cada substancia. Otra forma sería el diagrama de Cox (Ver fig.12.a) De la misma forma, los calores específicos del gas ideal suelen correlacionarse por expresiones de ajuste del tipo: c*p= a+ bT + cT2 En la bibliografía hay numerosas correlaciones de datos. En la Figura 14 se presentan algunas de ellas. Si se permite una recomendación, lo más conveniente es no perder una referencia global con el manejo de gráficos tan dispares y, a la vez, tan similares morfológicamente; trátese de ubicar estas propiedades en el contexto de los diagramas de estado de más amplio escenario, Tipos I,II y III ( los dos primeros referidos ya en la Figura 8)
Fig.14. Morfología de algunas correlaciones de datos frecuentes en la bibliografía. a. Diagrama de Cox, b. Diagrama de Brown para densidades de olefinas; c y d. Otros diagramas para propiedades energéticas de hidrocarburos.
d. Aplicaciones prácticas La Termodinámica de fases de un solo componente es la base para la caracterización de mezclas multicomponentes, pero por sí misma tiene interés práctico en las llamadas operaciones termomecánicas. Las operaciones termomecánicas son transformaciones en las que se pretende modificar las características de estado de un fluido (básicamente compresiones, expansiones e intercambios de calor) , en las que se pretende convertir el calor en trabajo (máquinas y motores térmicos) o en las que se pretende acceder de forma autosuficiente a determinadas regiones de estado (licuaciones o solidificaciones totales o parciales). Frecuentemente el fluido que experimenta estas transformaciones experimenta un ciclo, es decir, que pasa sucesivamente por las condiciones iniciales dando lugar a transformaciones con un balance neto nulo de calor y trabajo. La utilidad de los ciclos está precisamente en conseguir calor o trabajo en unas condiciones más inaccesibles a partir de consumirlo en otras 33
Termodinámica de sistemas no ideales
más accesibles, siempre con las limitaciones impuestas por las reglas del juego, los llamados principios de la termodinámica. La razón de los procesos cíclicos es doble: Por una parte, hay ciclos cerrados. Hay fluidos que se emplean como vehiculizantes de materia y energía, y debido a su costo o a las dificultades de su manejo, permanecen encerrados en un circuito sin salidas ni entradas netas, más que las accidentales debidas a pérdidas y fugas y a la necesidad de reponer el material. Por ello es preciso llevarlos a las condiciones iniciales para reutilizarlos, procurando aprovechar inteligentemente -dentro del propio proceso o enlazando con otros- los balances energéticos de estas operaciones subsidiarias de recuperación. Tal es el caso de las centrales térmicas que utilizan agua ultrapura en circuito cerrado (Ciclo de Rankine) o de las máquinas frigoríficas (ciclo inverso). Por otra parte hay ciclos abiertos, en los que se mantienen las condiciones de cada etapa y se reiteran las transformaciones termomecánicas, pero el fluido que circula va cambiando total o parcialmente. Ello se debe a que parte de las transformaciones son irreversibles (caso del motor de explosión interna de acuerdo con los ciclos de Carnot, Otto, etc.), a que parte del material se destina a un uso específico y se retira fraccionalmente (caso de los ciclos de licuación de Linde y Claude, por ejemplo) o a que se producen pérdidas que no compensa paliar (máquinas de vapor).
2.2. Equilibrio de mezclas multicomponentes a. Propiedades termodinámicas para mezclas La extensión de los conceptos termodinámicos a mezclas multicomponentes pasa por dos etapas. En primer lugar caracterizar la mezcla monofásica y sus propiedades. En segundo lugar caracterizar las condiciones de equilibrio entre fases multicomponentes. Ello requiere introducir nuevas propiedades termodinámicas - las necesarias para caracterizar las proporciones entre los distintos integrantes de la mezcla, la composición -y redefinir adecuadamente todas las propiedades termodinámicas a tenor de la disponibilidad de este nuevo grado de libertad, estableciendo criterios precisos para identificar la contribución de cada sustancia a las propiedades de la mezcla. Luego habrá de resolverse el problema de cómo extender las ecuaciones de estado a mezclas, mediante adecuadas reglas de ponderación de la participación de cada componente en los parámetros del modelo. Finalmente requiere establecer las condiciones de equilibrio entre fases y traducirlas a variables fácilmente medibles o controlables. Para sistemas de dos o más componentes, todas las propiedades extensivas dependen de la cantidad de cada componente presente, y todas las propiedades intensivas dependen de las proporciones en las que estos componentes estén presentes. De acuerdo con lo visto, todas podrán expresarse en función de otras dos propiedades independientes y, además, también serán función de la masa o del número de moles de cada uno de los componentes: U = f(S, V, n1, n2, ... ni) U = f(P,T, n1, n2, ... ni) ... H = f(P,S, n1, n2, ... ni) H = f(P,T, n1, n2, ... ni) ... G = f(P,T, n1, n2, ... ni) 34
Termodinámica de sistemas no ideales
A = f(T,V, n1, n2, ... ni) ... De forma que sus variaciones se escribirán:
⎛ ∂Z ⎞ ⎛ ∂Z ⎞ ⎛ ∂Z ⎞ ⎟ ⎟ ⎟ dZ = ⎜ dX + ⎜ dY + ⎜ dn +... ⎝ ∂ nA ⎠ X ,Y ,nB A ⎝ ∂ X ⎠ Y ,nA,nB,... ⎝ ∂ Y ⎠ X , nA,nB... así, por ejemplo: dU = -SdT +VdP + Σ ⎜⎛ ∂ U ⎞⎟
⎝ ∂ ni ⎠ S ,V
dni
⎛ ∂ G⎞ ⎟ dG = T dS - P dV + Σ ⎜ dni ⎝ ∂ni ⎠ P, T, nj
y análogamente para cualquier propiedad expresada de cualquier forma.
⎛ ∂Z ⎞ ⎟ Cualquiera de los términos del tipo ⎜ sirve para definir la contribución de cada ⎝ ∂n A ⎠ X ,Y ,nB componente a las propiedades de la mezcla, y recibe el nombre de potencial químico µ. Se puede demostrar que todas las expresiones de este tipo conducen al mismo valor, por lo que cualquiera de ellas podría representar al potencial químico: Si se define el potencial químico como: ⎛ ∂U ⎞ ⎟⎟ µ i = ⎜⎜ ∂ n ⎝ i ⎠ S,V ,n j
la ecuación anterior adopta la forma: dU = T dS - P dV + Σµi dni y si se define como
⎛ ∂G ⎞ ⎟⎟ µ i = ⎜⎜ ⎝ ∂n i ⎠ T ,P ,n j
dG = -S dT + V dP + Σµi dni ⎛ ∂G ⎞ ⎛ ∂G ⎞ siendo, como es sabido − S = ⎜ ⎟ ⎟ ; V=⎜ ⎝ ∂T ⎠ P ,n i ⎝ ∂P ⎠ T , n i Se ha preferido esta última forma de expresión como la más afortunada, ya que presupone la constancia de las dos variables termodinámicas más vinculadas al concepto de potencial, la temperatura como indicador del potencial impulsor térmico y la presión como indicador del potencial impulsor mecánico. Además, se verá a continuación que esta forma de definición permite considera al potencial químico en su sentido físico de propiedad parcial. (En lo sucesivo no se volverá a reiterar la justificación de por qué se prefieren P y T como coordenadas para definir el estado de un sistema).
Si se utilizan como formas prácticas de expresar la composición la fracción másica o, preferentemente, la fracción molar: n xi = i Σni 35
Termodinámica de sistemas no ideales
las expresiones anteriores adoptan formas específicas más prácticas (referidas a la unidad de siendo G, S y V propiedades masa, a un mol), por ejemplo: dG = -S dT + V dP + Σµi dxi molares. Nótese que el potencial químico ya se define como una propiedad molar y que, de disponerse de simbología adecuada, las propiedades molares se suelen representar con una tilde como la letra ñ y que las propiedades específicas lo hacen bajo un ángulo, como el acento circunflejo francés.
b. Modelos de mezcla
b.1. Mezcla ideal Sean o no ideales las susbtancias que componen una mezcla, el concepto de idealidad de mezcla está vinculado a la función que define las propiedades de la mezcla a partir de las de sus componentes. Arbitrariamente podría considerase mezcla ideal aquella en la que esta dependencia es lineal, definiéndose a P y T preestablecidas:
ZP, T = (Z A + ZB + ...) P, T = Σ P ,T Zi y en coordenadas molares o específicas Z = Σ i Zi .Esta definición, modelo lineal, puede aceptarse teóricamente para propiedades energéticas como H ó U y para el volumen. La ley de Amagat de aditividad lineal de volúmenes molares para gases, como traducción de la ley de Dalton de aditividad de moles (principio de conservación de la materia) son ejemplos de mezcla ideal lineal. De partida cabe esperar que los líquidos no sigan exactamente este comportamiento. Esta sencilla regla de mezcla permite también aplicar a una mezcla modelos definidos para sustancias puras. En el modelo del factor de compresibilidad las reglas de mezcla ideal pueden aplicarse a la definición de las coordenadas del nodo crítico ideal: m
m i
Tc = ΣxiTc
;P
m c
m
= Σxi Pc
i
;V
m c
m
= ΣxiV c
i
;
o a la definición de los parámetros del modelo característicos de la mezcla, por ejemplo, los coeficientes de Van del Waals o de virial.
Sin embargo se verá que esta sencilla regla resulta inadecuada para otras propiedades como la entropía o las funciones de trabajo G y A(F), que, incluso en el caso de gases, experimentan variaciones por el mero hecho de producirse la mezcla, por lo que el concepto de mezcla ideal se vinculará, para esas propiedades, a la predicción teórica a partir de las ecuaciones de definición. En efecto, la aditividad de volúmenes molares lleva a la aditividad de presiones parciales. Por el mero hecho de integrarse en una mezcla a P y T constantes, cada componente pasa de encontrarse a la presión P a encontrarse a la presión parcial Pi, con el consiguiente cambio vinculado de entropía y energía libre, que puede escribirse bien en función de presiones (comportamiento individual supuesto ideal) o más adecuadamente, en función de fugacidades, tomado como referencia común la fugacidad de cada componente puro en una mezcla a baja presión:
∆Gi, mPT = RT ln
fi P ≅ RT ln i = RT ln xi f P
Esta discrepancia teórica, aditiva de la linealidad, permite introducir el concepto de función de mezcla,
V m PT = [Σx iVi ]PT H m PT = [Σxi Hi ]PT 36
Termodinámica de sistemas no ideales m S m PT = [Σx i Si ]PT + ∆SPT
m G mPT = [Σxi Gi ]PT + ∆G PT m
i
m
i
de forma que ∆GRT = Σ ni RT ln xi , y para un mol: ∆GRT = Σ x i RT ln xi Obviamente, las teorías atómico moleculares permiten aventurar explicaciones sobre la idealidad o no idealidad de las mezclas. Las disoluciones líquidas ideales se presentan cuando los diámetros moleculares son iguales, no existen interacciones químicas y las fuerzas intermoleculares entre moléculas de la misma especie o de otras son similares. Estos mismos requerimientos se aplican a la fase gaseosa, donde a bajas presiones las moléculas no están próximas entre sí y el comportamiento se aproxima al de una disolución o mezcla gaseosa ideal (moléculas de volumen nulo con respecto al volumen del sistema sin fuerzas intermoleculares). Como ejemplo ilustrativo puede servir el incremento o decremento de volumen que darían lugar canicas de distintos tamaños al ser empaquetadas juntas.
b.2. Mezcla real La propiedad que una mezcla real exhibe para una determinada composición puede diferir por exceso o por defecto de la propiedad predicha en condiciones de mezcla ideal. Esa discrepancia puede cuantificarse al menos por tres vías compatibles, definiendo las correspondientes propiedades Discrepancia aditiva
Discrepancias factoriales:
Propiedades en exceso
Pseudopropiedades
Pseudocompociciones
Es la forma más frecuente de aproximarse experimentalmente al comportamiento de la mezcla real
Valor de la composición que daría lugar en una mezcla ideal a similar valor de la propiedad partiendo de las mismas propiedades de los componentes puros.
Valor de la propiedad molar del componente puro que daría lugar en una mezcla ideal de la misma composición a similar valor de la propiedad.
En determinadas condiciones sirve para En determinadas condiciones sirve introducir el concepto de propiedad parcial . introducir el concepto de actividad
para
Fig.15. Definición de propiedades para una mezcla monofásica binaria 37
Termodinámica de sistemas no ideales
Así en el caso de la función de Gibbs, puesto que se define habitualmente en forma de P y T, se introduce directamente el concepto de propiedad molar parcial, que se suele representar con una raya recta
y análogamente para otras propiedades
El concepto de propiedad parcial representa la repercusión que sobre la propiedad de la mezcla, a presión y temperatura constante, tiene la variación diferencial en la composición de cada componente en torno a un valor dado. Las propiedades parciales son pues función de las propiedades molares a cada presión y temperatura, de la composición y de la naturaleza de los demás componentes de la mezcla. Otra propiedad interesante es la actividad. Así como la fugacidad no se introdujo en la ecuación de estado, la introducción de una pseudocomposición no se ha hecho en la forma insinuada, sino también a través de la variación isotérmica de la energía libre, de forma que se pueda aplicar a la mezcla real la misma formulación que a la mezcla real. Así se introduce la actividad y su relación con la forma elegida para medir la composición. el coeficiente de actividad: f ∆Gi, mPT = RT ln i = RT ln ai = RT ln γ i xi f i
m ∆GPT = Σ x i RT ln γ i x i
forma que la discrepancia con el comportamiento ideal, la función en exceso, se puede escribir, para la función de trabajo, como:
[
E ∆GPT = Gi, propiedad i i
parcial
∆GPT = Σ x i RT ln γ i E
38
− Gi , propiedad molar
]
PT , xi
= RT ln ai − RT ln xi = RT ln γ i
Termodinámica de sistemas no ideales Esta expresión permite derivar los datos experimentales, generalmente obtenidos en forma de funciones en exceso (o defecto) de variables más fácilmente medibles, como V (por picnometría), H o U (por calorimetría), al cálculo de coeficientes de actividad, que es una forma más versátil de modelizar la no idealidad a efectos de correlaciones de equilibrio. En efecto, el volumen parcial molar del componente y puede calcularse a partir de su definición o a partir de la relación de Maxwell en función de la energía libre molar parcial, que es el potencial químico.
⎛ ∂V ⎞ ⎟⎟ v i = ⎜⎜ ⎝ ∂n i ⎠ T , P , n j
⎛ ∂µ ⎞ vi = ⎜ i ⎟ ⎝ ∂P ⎠ T
pudiendo formularse su variación en exceso respecto a la mezcla ideal en función del coeficiente de actividad a partir de la propia definición de potencial químico:
⎛⎜ ∆V iE ⎞ ⎛ ∂ ln γ i ⎞ = ⎝ ∂P ⎠ T, x ⎝ RT ⎠ T , x y análogamente sucedería para medidas calorimétricas:
⎛ ∆HiE ⎞ ⎛ ∂ ln γ i ⎞ =⎜ ⎝ ∂T ⎠ P ,x ⎝ RT 2 ⎠ P, x
Las mezclas reales pueden clasificarse en función del tipo de propiedades termodinámicas que discrepan del comportamiento ideal, ya que no suelen ser todas o, al menos, no suelen serlo con la misma intensidad. Cuando sólo existen discrepancias en G y S las mezclas se denominan semiideales. Cuando también se presentan discrepancias en exceso en H y U se tienen las llamadas soluciones regulares, etc. c. Equilibrio entre fases
c.1. Cálculo y correlación de coeficientes de actividad Datos experimentales, obtenidos generalmente a partir de propiedades en exceso , V (picnometría) y U y H (calorimetría) permiten obtener coeficientes de actividad en distintas condiciones de presión , temperatura y composición, a través de las ecuaciones de equivalencia. Tras ser depurados por tests de consistencia, estos coeficientes permiten calcular las constantes de Van Laar de sustancias, por ejemplo en mezclas binarias a partir de datos de equilibrio LV. La formulación de la función de Gibbs para cada fase en condiciones isotérmicas permite obtener las llamadas ecuaciones de Gibbs-Duhem, cuya solución puede acometerse por medio de diversos procedimiento, Margules, Redlich Kister y Van Laar, entre otros. La ecuación de Gibbs Duhem en su forma general para cada fase: i i ⎛i ⎞ ⎝ Σ xi dµi ⎠ TP = Σ x id(Gi + RT ln ai ) TP = Σ x i (d ln γ i )TP = 0
adopta la forma
x1
⎛ ∂ ln γ 1 ⎞ ⎛ ∂ ln γ 2 ⎞ − (1− x1 ) =0 ⎝ ∂x ⎠ PT ⎝ ∂x ⎠ PT
cuya solución, según el modelo de Van Laar es:
39
Termodinámica de sistemas no ideales
ln γ 1 =
A ⎛ ⎜ 1 + Ax1 ⎞⎟ ⎝ Bx2 ⎠
2
;
ln γ 2 =
B ⎛ ⎜ 1 + Bx2 ⎞⎟ ⎝ Ax1 ⎠
2
adoptando las constantes los valores : 2
⎡ x ln γ 2 ⎤ A = ln γ 1 1 + 2 ; ⎢⎣ x1 ln γ 1 ⎥⎦
⎡ x ln γ 1 ⎤ B = ln γ 2 1 + 1 ⎢⎣ x2 ln γ 2 ⎥⎦
2
Estas constantes permiten estimar coeficientes de actividad en otras condiciones, con el objeto de estimar y correlacionar condiciones de equilibrio en más amplias regiones.
Por otra parte si para cada fase puede escribirse una ecuación de este tipo, con tantas incógnitas como componentes n, el número de grados de libertad será L=n+2-F, la llamada regla de las fases, que no es otra cosa que un principio de consistencia lógica. Estas relaciones establecen que a P y T constante, los potenciales químicos de todos los componentes habrán de ser iguales en todas las fases, por lo que se tendrá la base de las relaciones de equilibrio. Desafortunadamente el potencial químico no es muy manejable, ni matemática ni experimentalmente, por lo que el equilibrio se define a partir de su relación de definición con la presión y la temperatura, resultando que, a igualdad de potencial químico resulta igualdad de actividad, por lo que puede emplearse esta variable para correlacionar el equilibrio. 40
Termodinámica de sistemas no ideales
c.2. Determinación experimental del equilibrio En la Fig. 16 se ilustra un procedimiento para la obtención experimental de datos de equilibrio.
Fig.16. Procedimiento experimental para obtener datos de equilibrio isóbaro de mezclas binarias en la región LV.
c.3. Formulación analítica del equilibrio c.3.1. Formulación general Las ecuaciones de estado pueden utilizarse para describir equilibrio en sistemas multicomponentes utilizando adecuadas reglas de combinación para definir sus parámetros característicos. Todas las ecuaciones de estado se pueden aplicar a mezclas utilizando reglas de mezcla para combinar constantes de las especies puras. La ecuación del gas ideal se utiliza ampliamente, tanto para gases puros como para mezclas gaseosas. Las reglas de mezcla son lineales y corresponden a los modelos de Dalton y Amagat. La ley de los gases ideales es generalmente bastante precisa para presiones hasta una atmósfera. Por encima de tres o cuatro atmósferas da lugar a desviaciones con respecto a los datos experimentales del 10% y superiores. Cuando un gas o vapor no se comporta como un gas ideal resulta difícil formular una ecuación de estado exacta debido a la necesidad de tener en cuenta las interacciones moleculares. El principio de los estados correspondientes permite utilizar las correlaciones de substancias puras para mezclas si se definen adecuadamente las coordenadas del nodo crítico, que en condiciones de idealidad obedecen a relaciones de mezcla lineal. No obstante hay fuertes discrepancias que no pueden ser asumidas por este planteamiento simple, por lo que han de utilizarse reglas de mezcla más complejas.
41
Termodinámica de sistemas no ideales La ecuación de estado del virial proporciona una buena base teórica para el cálculo de las relaciones P-v-T de especies puras, tanto polares como no polares, y de mezclas en fase vapor para densidades inferiores a la del punto crítico. Los coeficientes del virial pueden obtenerse a partir de parámetros moleculares. El resto de las ecuaciones paramétricas derivadas de la de Van der Waals tienen en común que son de tercer orden en volumen y que resultan aplicables en un amplio intervalo de valores de presión. La ecuación RedlichKwong da muy buenos resultado para predecir hiperespacios de equilibrio. Cuando se emplea en función del factor de compresibilidad pueden utilizarse las siguientes reglas de mezcla:
A2 h 1 − Z= 1 − h B (1 + h ) C
siendo A = ∑ A i y i i =1
⎞ ⎛ A2 A2 ⎟ ⎜ (BP )2 = 0 Z − Z + BP⎜ − BP − 1⎟ Z − B ⎠ ⎝ B 3
y
2
C
C
i =1
i =1
C
A = ∑ A i x i y B = ∑ Bi y i
B = ∑ Bi x i i =1
Mientras que las reglas de mezcla para los parámetros característicos son: C ⎛ C ⎞ a = ∑ ⎜⎜ ∑ y i y j a ij ⎟⎟ i =1 ⎝ j=1 ⎠
( )1 / 2
a ij = a i a j
C
b = ∑ yi bi i =1
c.3.2. Formulación particular: Equilibrio L-V Se ha visto que equilibrio se alcanza a P y T constante cuando los potenciales químicos de todos los componentes son iguales en cada fase. En el caso particular de un sistema de n componentes con una fase líquida y una fase vapor en equilibrio se cumple que: TV = TL PV = PL
µ1V = µ1L µ2V = µ2L ...
µnV = µnL Prausnitz demostró que en el equilibrio: f1V = f1L f2V = f2L ... fnV = fnL Para un gas ideal puro la fugacidad es igual a la presión y, para un componente de una mezcla gaseosa ideal, es igual a su presión parcial, pi = yiP. Si la fugacidad reemplaza al potencial químico como criterio de equilibrio, las condiciones de equilibrio se pueden expresar en términos de valores experimentales de presión, volumen, temperatura y concentración. Para equilibrio LV f iV = y i f iVo , f iL = x i f iLo Para una mezcla binaria, la temperatura y la presión determinan las composiciones de las fases en equilibrio. Para mezclas que tienen más de dos componentes, se dispone de otro grado de libertad para cada componente. Por este motivo, resulta conveniente definir una relación de equilibrio, o volatilidad absoluta, como el cociente entre las fracciones molares 42
Termodinámica de sistemas no ideales
de una especie en dos fases que se encuentran en equilibrio K i = relativa, como: α ij =
yi y la volatilidad xi
Ki Kj
Para formar una relación de equilibrio entre actividades o fugacidades puede recurrirse a las posibles definiciones para una u otra fase en función del grado de idealidad de la mezcla y de los propios componentes con respecto al comportamiento del gas ideal, pudiendo utilizarse formulaciones simétricas o asimétricas: fiV = γiV yi y
f iVo fiL = γiL xi f iLo
fiV = φiV yi P
o bien
y
fiL = φiL xi P
K adopta las formas ⎛γ K i = ⎜⎜ iL ⎝ γ iV
⎞⎛ f iLo ⎟⎟⎜ o ⎜ ⎠⎝ f iV
⎞ φ ⎟ y K i = iL ⎟ φ iV ⎠
para formulaciones simétricas y Ki =
φ iL φ iL P = o o γ iV ν iV γ iV f iV
y
Ki =
γ iL f iLo γ νo = iL iL φ iV P φ iV
para formulaciones asimétricas.
c.4. Representación gráfica de diagramas de equilibrio Los diagramas de estado para fases multicomponentes resultan hiperespacios de complejo trazado, salvo en el caso particular de sistemas binarios. En la Figura 17 se muestra un amplio hiperespacio para una mezcla binaria ideal en la región SLG utilizando composición y propiedades de campo como coordenadas.
Fig. 17. Hiperespacio de equilibrio SLV para sistemas ideales en coordenadas de campo y composición. 43
Termodinámica de sistemas no ideales
En la Fig. 18 se muestra un hiperespacio más restringido, región LV, utilizando propiedades de densidad en las coordenadas. En la Figura 19 se representan las proyecciones más habituales del hiperespacio de la figura 17 en las coordenadas habitualmente utilizadas para describir el equilibrio LV.
Fig.18. Hiperespacio de equilibrio LV en coordenadas de campo, de densidad y composición
Fig. 19. Regiones de equilibrio LV en coordenadas PT , Pxy(T) y Txy(P) como fragmento del hiperespacio descrito en la Fig. 15 44
Termodinámica de sistemas no ideales
3. PRINCIPALES LIBROS RECOMENDADOS •
HOUGEN, WATSON, RAGATZ, Principios de los procesos químicos: (II) Termodinámica, Ed.Reverté (1964)
•
SMITH, VAN NESS, Introducción a la Termodinámica en Ingeniería Química, Ed. McGraw Hill (1986)
•
REID, SHERWOOD, PRAUSNITZ, Properties of Gases and Liquids, Ed. McGraw Hill (1977)
45
I.
Termodinámica y modelización rigurosa de procesos
Modelos de predicción de propiedades físico-químicas M. Carmen Pazos Medina Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Modelos de predicción de propiedades físico-químicas
ÍNDICE 1. INTRODUCCIÓN ............................................................................................................49 2. MODELOS DE ECUACIONES DE ESTADO..............................................................51 2.1. Propiedades termodinámicas para las fases líquida y vapor a partir de modelos de ecuaciones de estado ................................................................................................56 2.1.1. Ecuación de estado R-K .................................................................................57 2.1.2. Ecuación de estado S-R-K..............................................................................60 3. MODELOS DE COEFICIENTES DE ACTIVIDAD....................................................61 3.1. Disoluciones regulares. Correlación de Chao-Seader (C-S)....................................62 3.2. Mezclas no ideales que contienen compuestos polares ...........................................66 3.3. Ecuación de Wilson .................................................................................................68 3.4. Ecuación NRTL (Non-Random Two-Liquid)..........................................................69 3.5. Ecuación UNIQUAC (Universal Quasi-Chemical) .................................................70 3.6. Modelos de contribución de grupos: UNIFAC ........................................................72 3.7. Determinación de los parámetros de interacción molecular ....................................75 4. BIBLIOGRAFÍA ..............................................................................................................75
1. INTRODUCCIÓN Los datos de equilibrio entre fases son indispensables para el cálculo y diseño de los equipos donde se desarrollan las operaciones que impliquen transferencia de materia entre ellas. El número y la complejidad de los sistemas que pueden presentarse con las cuatro combinaciones de fases (líquido-gas, líquido-líquido, sólido-gas y sólido-líquido) que resultan prácticas desde el punto de vista de la transferencia de materia es tan grande, que sólo muy raramente se localizan los correspondientes datos de equilibrio experimentales en la bibliografía. Descartada la obtención experimental de tales datos en cada situación particular, dada la dificultad y delicadeza de las técnicas disponibles para ello, aun en los casos más sencillos de sistemas de dos componentes, no queda más remedio que recurrir a su predicción termodinámica basándose en el mínimo número de datos posibles sobre los componentes (presiones de vapor, constantes críticas, etc.), o sobre las distintas mezclas binarias que puedan considerarse con ellos, ya que casi nunca se encontrarán datos sobre mezclas de orden superior de dichos componentes. En este tema se van a presentar las dos alternativas más importantes para la predicción, no sólo de datos de equilibrio, sino también de otras propiedades termodinámicas, como la entalpía, y la densidad de las fases en equilibrio: modelos de ecuaciones de estado y modelos de coeficientes de actividad. Sin embargo, y debido a la limitación de tiempo, se centrará el estudio de estos modelos en el equilibrio vapor-líquido. Antes de pasar a su presentación, se van a recordar muy brevemente las expresiones que describen el equilibrio entre fases. 49
Modelos de predicción de propiedades físico-químicas
Para una mezcla binaria, la temperatura y la presión determinan las composiciones de las fases en equilibrio. Para mezclas que tienen más de dos componentes, se dispone de otro grado de libertad para cada componente. Por este motivo, resulta conveniente definir una relación de equilibrio, como el cociente entre las fracciones molares de una especie en dos fases que se encuentran en equilibrio. Para el equilibrio vapor-líquido, la constante se denomina valor K o relación de equilibrio vapor-líquido. Ki =
yi xi
(1)
Para los cálculos de procesos por etapas de equilibrio que intervienen en la separación de dos o más componentes, se definen factores de separación formando cocientes de relaciones de equilibrio. Para el caso del equilibrio vapor-líquido, se define la volatilidad relativa, como: α ij =
Ki Kj
(2)
Los valores K se conocen también como volatilidad absoluta. Equilibrio vapor-líquido fiV = fiL
(3)
Para formar una relación de equilibrio se sustituyen las fugacidades por las expresiones equivalentes en función de fracciones molares, Las sustituciones pueden ser muy diversas. Dos parejas comunes, son: Pareja 1 fiV = γiV yi f iVo
(4)
fiL = γiL xi f iLo
(5)
fiV = φiV yi P
(6)
Pareja 2 fiL = φiL xi P
(7) o
Siendo, f la fugacidad de la especie en la mezcla, f la fugacidad de la especie pura, φ el coeficiente de fugacidad en la mezcla y γ el coeficiente de actividad en la mezcla. x e y representan las fracciones molares en las fases líquida y vapor, respectivamente. Los subíndices i, V y L, indican, respectivamente, componente, fase vapor y fase líquida. Estas ecuaciones representan dos formulaciones simétricas y otras dos no simétricas para los valores K. Las simétricas son: ⎛γ K i = ⎜⎜ iL ⎝ γ iV φ K i = iL φ iV
⎞⎛ f iLo ⎟⎟⎜ o ⎜ ⎠⎝ f iV
⎞ ⎟ ⎟ ⎠
(8) (9)
Las formulaciones no simétricas son: Ki = 50
φ iL P φ iL = o o γ iV f iV γ iV ν iV
(10)
Modelos de predicción de propiedades físico-químicas
Ki =
γ iL f iLo γ νo = iL iL φ iV P φ iV
(11)
νo representa el coeficiente de fugacidad de la especie pura.
Con independencia de la formulación termodinámica que se utilice para predecir los valores K, la exactitud depende de la veracidad de las correlaciones particulares empleadas para estimar las diferentes magnitudes termodinámicas. Para aplicaciones prácticas, la elección de la formulación del valor K es un compromiso entre consideraciones de exactitud, complejidad y conveniencia. Las formulaciones más importantes son las representadas por las ecuaciones (9) y (11). La primera, es la denominada expresión del valor K en forma de ecuación de estado, mientras que la segunda corresponde a la expresión del valor K en forma de coeficiente de actividad. En la Tabla 1 se presentan las expresiones más útiles y por tanto más empleadas para la estimación de valores K en el equilibrio vapor-líquido. Se incluyen las dos expresiones rigurosas mencionadas, a partir de las cuales se deducen otras expresiones aproximadas. Tabla 1. Expresiones para la estimación de valores K en el equilibrio vapor-líquido
Formas rigurosas: Ecuación de estado Coef. actividad
Aplicación recomendada φiL φiV γ fo γ νo K i = iL iL = iL iL φiV P φiV
Mezclas de hidrocarburos y gases ligeros desde T criogénicas hasta región crítica
Pis P γ Ps K i = iL i P ⎛ 1 P ⎞ γ iL ν iVS Pis Ki = exp⎜ v iL dP ⎟ ∫ ⎜ RT PS ⎟ P ⎝ ⎠ i Hi Ki = P
Disoluciones ideales a P próxima a atmosférica
Ki =
Todas las mezclas desde T ambiente hasta casi crítica
Formas aproximadas: Ley Raoult (ideal) Ley Raoult modificada Corrección Poynting Ley Henry
Ki =
Disoluciones líquidas no ideales a P próxima a atmosférica Disoluciones líquidas no ideales a P moderada por debajo de T crítica Especies a P baja o moderada a T supercrítica
Como se puede apreciar, se requieren correlaciones para coeficientes de fugacidad y coeficientes de actividad. A continuación se presentan de forma resumida los modelos de ecuaciones de estado.
2. MODELOS DE ECUACIONES DE ESTADO Los procedimientos de diseño del equipo para las operaciones de separación requieren el conocimiento de entalpías y densidades, además de las relaciones de equilibrio entre fases. La termodinámica clásica proporciona un medio de obtener todas estas magnitudes a partir de las 51
Modelos de predicción de propiedades físico-químicas
relaciones P-v-T, que se conocen como ecuaciones de estado. Si bien se han propuesto un gran número de ecuaciones de estado, la mayoría para la fase vapor, relativamente pocas resultan adecuadas para los cálculos prácticos de diseño. Algunas de éstas se indican en la Tabla 2. Todas las ecuaciones de estado se pueden aplicar a mezclas utilizando reglas de mezcla para combinar constantes de las especies puras. Tabla 2. Ecuaciones de estado de mayor utilidad en cálculos de ingeniería química Nombre
Ecuación
Constantes y funciones
Gas ideal
P=
RT v
Ninguna
Generalizada
P=
ZRT v
Z = f(Pr, Tr, Zc o ω)
RT a − 2 v − b v + bv
Redlich-Kwong (R-K)
P=
Soave-Redlich-Kwong
RT a P= − 2 v − b v + bv
(S-R-K o R-K-S)
Peng-Robinson (P-R)
RT a P= − 2 v − b v + 2bv − b 2
b = 0.08664RTc/Pc a = 0.42748R2Tc2.5/PcT0.5 b = 0.08664RTc/Pc a = 0.42748R2Tc2[1 + fw(1-Tr0.5)]2 /Pc fw = 0.48 + 1.574ω - 0.176ω2
b = 0.07780RTc/Pc a = 0.45724R2Tc2[1 + fw(1-Tr0.5)]2 /Pc fw = 0.37464+ 1.54226ω - 0.26992ω2
La ecuación del gas ideal se utiliza ampliamente, tanto para gases puros como para mezclas gaseosas. Cuando cada una de las especies de una mezcla, así como la mezcla misma, sigue la ley de los gases ideales, se cumplen la ley de Dalton de la aditividad de las presiones parciales y la ley de Amagat de la aditividad de los volúmenes de las especies puras. La ecuación de mezcla en función de la densidad molar, ρ/M, es: C
∑ ni
1 P ρ = = = i =1 M v RT V
(12)
La ley de los gases ideales es generalmente exacta para presiones hasta una atmósfera. A tres atmósferas, la ecuación (12) puede presentar desviaciones con respecto a los datos experimentales de hasta un 10%. Este hecho se debe a que esta ecuación no tiene en cuenta el tamaño molecular o volumen ocupado por las moléculas, ni las fuerzas de interacción entre éstas. Todas las otras ecuaciones de estado incluidas en la Tabla 2 tratan de corregir estas dos deficiencias. Aunque no se ha incluido en la Tabla 2, la ecuación de van der Waals, P = RT/(v –b) – a/v2, en donde a y b son constantes que dependen de las especies y pueden estimarse a partir de los valores de presión y temperatura crítica, se puede considerar la primera ecuación de estado para gases no ideales. A pesar de que su intervalo de aplicación es bastante estrecho y no se 52
Modelos de predicción de propiedades físico-químicas
emplea prácticamente en la actualidad, se debe destacar que en su desarrollo se puso de manifiesto que todas las especies pueden tener volúmenes molares reducidos iguales, para los mismos valores de presión reducida y temperatura reducida. Este hecho, conocido como principio de los estados correspondientes, ha sido el punto de partida para el desarrollo de la ecuación de estado generalizada, indicada en la Tabla 2. La ecuación de estado generalizada define el factor de compresibilidad, Z, el cual es función de la temperatura absoluta reducida Tr = T/Tc, de la presión absoluta reducida Pr = P/Pc y del factor de compresibilidad crítica, Zr, o del factor acéntrico, el cual se determina a partir de datos experimentales P-v-T. El factor acéntrico, introducido por Pitzer y col., tiene en cuenta las diferencias de forma molecular y se determina a partir de la curva de presión de vapor: ⎡ ⎤ ⎛ PS ⎞ ⎥ − 1.000 ω i = ⎢− log ⎜⎜ i ⎟⎟ P ⎢ ⎝ c ⎠ Tr = 0.7 ⎥⎦ ⎣
(13)
Esta definición conduce a un valor de ω prácticamente igual a cero para moléculas de simetría esférica (gases nobles, por ejemplo). Algunos valores típicos de ω son 0, 0.263, 0.489 y 0.644, para metano, tolueno, n-decano y alcohol etílico, respectivamente. En 1949, Redlich y Kwong publicaron una ecuación de estado que, como la de van der Waals, solamente tiene dos constantes que pueden determinarse directamente a partir de la temperatura y presión críticas. Además, la ecuación R-K tiene una exactitud comparable a otras ecuaciones más complejas y es capaz de aproximar la región líquida. La ecuación de van der Waals falla considerablemente en este aspecto. Sin embargo, la ecuación R-K presenta la desventaja de que su aplicabilidad se restringe a sistemas que no se desvíen mucho de la idealidad. Cuando la ecuación R-K se aplica a mezclas, se utiliza la expresión indicada en la Tabla 2, o bien se transforma y combina con la ecuación de estado generalizada para llegar a la ecuación siguiente: A2 h 1 Z= − (14) 1 − h B (1 + h ) ⎛ A2 ⎞ A2 ⎜ ⎟ (BP)2 = 0 Z − Z + BP⎜ − BP − 1⎟ Z − B ⎝ B ⎠ 3
2
(15)
La resolución analítica de esta ecuación lleva a la obtención de tres raíces. En general, para temperaturas supercríticas, donde solo existe una fase, se obtiene una raíz real y dos raíces complejas. Por debajo de la temperatura crítica, donde pueden coexistir una fase líquida y una vapor, se obtienen tres raíces reales, correspondiendo el mayor valor de Z (mayor v) a la fase vapor (ZV), y el menor valor de Z (menor v) a la fase líquida (ZL). El valor intermedio no tiene uso práctico. Para aplicar la ecuación R-K a mezclas, se necesitan reglas de mezcla para obtener los valores medios de las constantes A y B para cada componente en la mezcla: C
A = ∑ Ai yi i =1
o bien
C
A = ∑ Ai xi i =1
(16)
53
Modelos de predicción de propiedades físico-químicas C
B = ∑ Bi y i
C
B = ∑ Bi x i
o bien
i =1
⎛ a A i = ⎜⎜ 2 i 2.5 ⎝R T
⎞ ⎟ ⎟ ⎠
1/ 2
⎛ 0.4728 ⎞ ⎟ =⎜ ⎜ P T 2.5 ⎟ ⎝ c r ⎠
(17)
1/ 2
bi 0.0867 = RT Pc Tr
Bi =
h =
i =1
BP Z
(18) (19) (20)
Si se utiliza la ecuación de la Tabla 2 directamente, las reglas de mezcla son: C ⎛ C ⎞ a = ∑ ⎜⎜ ∑ y i y j a ij ⎟⎟ i =1 ⎝ j=1 ⎠
(
a ij = a i a j
)1 / 2
C
b = ∑ yi bi i =1
(21)
(22) (23)
La principal dificultad de la ecuación R-K es su incapacidad para predecir con exactitud la presión de vapor. Tomando como base el trabajo realizado por Wilson, Soave adicionó un tercer parámetro, el factor acéntrico de Pitzer, a la ecuación R-K y obtuvo una concordancia casi exacta con los datos de presión de vapor de hidrocarburos puros, al mismo tiempo que mejoraba la capacidad de la ecuación para predecir propiedades de la fase líquida. Esta ecuación de estado fue aceptada de inmediato para su aplicación a mezclas conteniendo hidrocarburos y/o gases ligeros, debido a su simplicidad y precisión. La modificación de Soave de la ecuación R-K, denominada ecuación de estado S-R-K (o RK-S), es la siguiente: P=
RT a − 2 v − b v + bv
(24)
b = 0.08664RTc/Pc
(25)
a = 0.42748R2Tc2[1 + fw(1-Tr0.5)]2 /Pc
(26)
fw = 0.48 + 1.574ω - 0.176ω2
(27)
Cuatro años después de la publicación de la ecuación S-R-K, Peng y Robinson presentaron una modificación adicional a las ecuaciones de estado R-K y S-R-K, en un intento de mejorar el ajuste a los valores experimentales en la región crítica y para volúmenes molares de líquidos. En la Tabla 3 se muestra esta ecuación de estado junto a la S-R-K. Las principales características de la ecuación P-R se indican a continuación:
54
•
Intervalo más amplio de condiciones de operación
•
Mayor número de componentes, tanto hidrocarburos como no hidrocarburos.
•
En reglas de mezcla emplea coeficientes de interacción binarios (kij), obtenidos de datos experimentales.
Modelos de predicción de propiedades físico-químicas
•
Genera, al igual que la ecuación S-R-K, todos los valores de las propiedades termodinámicas y datos de equilibrio directamente.
•
No se puede emplear con mezclas líquidas no ideales de compuestos polares. Tabla 3. Comparación entre las ecuaciones de estado S-R-K y P-R
Otra base teórica para sustancias polares y no polares es la ecuación de estado del virial, debida a Thiesen y Onnes, que no se ha incluido en la Tabla 2. Una representación habitual de esta ecuación de estado es la que se indica a continuación, en donde los coeficientes del virial B, C y superiores pueden en principio obtenerse a partir de la mecánica estadística: Z = 1+
B C + + ...... v v2
(28)
A partir de esta ecuación se han realizado modificaciones que han conducido a otras ecuaciones de estado como, por ejemplo, la ecuación de Benedict-Webb-Rubin (B-W-R). Esta ecuación de estado, debido al elevado número de constantes que precisa (al menos ocho), tan 55
Modelos de predicción de propiedades físico-químicas
solo se ha aplicado a sustancias puras en condiciones criogénicas. Sin embargo, una modificación de la ecuación B-W-R, realizada por Lee y Kesler, con una importante extensión para su aplicación a mezclas, llevada a cabo por Plocker, ha conducido a la ecuación de estado L-K-P, mostrada en la Tabla 4, de la que pueden destacarse las siguientes características: •
Resulta de una modificación de la ecuación B-W-R, basada en la generalización de los estados correspondientes.
•
Las constantes de la ecuación vienen dadas en función de la temperatura y de la presión reducidas y del factor acéntrico, obtenidos a partir de datos P-v-T de metano, argon y kripton (ϖ = 0) y de un fluido de referencia, n-octano (ϖ = 0.398).
•
Describe adecuadamente mezclas de hidrocarburos y gases ligeros, en fase líquida y vapor, en un amplio intervalo de presiones y temperaturas.
•
Se utiliza mucho en simuladores para el cálculo de entalpías y entropías con otros modelos (expresiones semi-empíricas para coeficientes de actividad, presión de vapor, etc.). Tabla 4 Ecuación de estado L-K-P Compuestos puros
Mezclas
2.1. Propiedades termodinámicas para las fases líquida y vapor a partir de modelos de ecuaciones de estado
Si se dispone de ecuaciones para el calor específico o la entalpía del gas ideal (presión nula), así como de una ecuación de estado, se pueden deducir en forma consistente propiedades termodinámicas por aplicación de las ecuaciones de la termodinámica clásica indicadas en la Tabla 5. Para una temperatura y composición dadas, estas ecuaciones representan el efecto de la presión, para valores superiores a los que se puede considerar comportamiento de gas ideal. 56
Modelos de predicción de propiedades físico-químicas
Tabla 5. Ecuaciones útiles de la termodinámica clásica para la estimación de propiedades • Entalpía de mezcla
(h − h ) = Pv − RT − ∫
⎛ ∂P ⎞ ⎤ P −T⎜ ⎟ ⎥dv ⎢ ∞ ⎝ ∂T ⎠ v ⎦ ⎣
o V
v⎡
• Entropía de mezcla
(s − s ) = ∫ ⎛⎜⎝ ∂∂TP ⎞⎟⎠ dv − ∫ o V
v
v
∞
∞
v
R dv v
• Coeficiente de fugacidad del componente puro ⎡ 1 ν o = exp ⎢ ⎣ RT
P⎛
∫0 ⎜⎝ v −
⎡ 1 RT ⎞ ⎤ ⎟ dP ⎥ = exp ⎢ P ⎠ ⎦ ⎣ RT
⎤ RT ⎞ ⎜P− ⎟dv − lnZ + (Z − 1)⎥ v ⎠ ⎝ ⎦
∞⎛
∫v
• Coeficiente de fugacidad de mezclas ⎧ ⎪ 1 φi = exp ⎨ ⎪⎩ RT
⎫ ⎡⎛ ⎤ ⎞ RT ⎥ ⎪ ⎢⎜ ∂P ⎟ − − dV ln ⎬Z ∫V ⎢⎜⎝ ∂Ni ⎟⎠ V ⎥ ⎪⎭ T ,V ,N j ⎣ ⎦ ∞
C
V = v∑ Ni i =1
2.1.1. Ecuación de estado R-K Entalpía
La capacidad calorífica molar de los gases se expresa habitualmente como un polinomio de temperatura: c opV = a 1 + a 2 T + a 3 T 2 + a 4 T 3 + a 5 T 4
(29)
La integración de la ecuación (29) conduce a una ecuación de la entalpía molar del gas ideal a la temperatura T con respecto a la temperatura de referencia To, H oV
=
T
o ∫ c pV To
(
5
a k T k − T ok
k =1
k
dT = ∑
)
(30)
Cuando no es válida la suposición de la ley del gas ideal, se debe introducir una corrección para tener en cuenta el efecto de la presión sobre la entalpía. Para una especie pura o para mezclas a la temperatura T y presión P, la entalpía del vapor es:
(
) (
C o ⎤ H V = ⎡⎢ ∑ y i H iV + H V − H oV ⎥ ⎣i =1 ⎦
)
(31)
La ecuación (32) resulta adecuada para utilizar con ecuaciones de estado que son funciones explícitas de la presión como las de la Tabla 2. Por otra parte, la entalpía de la fase líquida resulta igual a: 57
Modelos de predicción de propiedades físico-químicas
(
) (
C o ⎤ H L = ⎡⎢ ∑ x i H iV + H L − H oV ⎥ ⎣i =1 ⎦
)
(32)
Para especies puras a temperaturas inferiores a la crítica, la ecuación (32) se puede escindir en las contribuciones separadas que se muestran en la Figura 1.
Figura 1. Contribuciones a la entalpía Utilizando la ecuación de estado R-K, se obtienen las siguientes expresiones para la entalpía molar de la mezcla: C ⎡ 3A 2 ⎛ BP ⎞⎤ o ⎟⎥ + RT ⎢ Z V − 1 − H V = ∑ y i H iV ln⎜⎜1 + 2B ⎝ Z V ⎟⎠⎥⎦ i =1 ⎢⎣
(33)
C ⎡ 3A 2 ⎛ BP ⎞⎤ o ⎟⎥ H L = ∑ x i H iV ln⎜⎜1 + + RT ⎢ Z L − 1 − 2B ⎝ Z L ⎟⎠⎦ i =1 ⎣
(34)
(
(
)
)
Coeficiente de fugacidad de una especie pura
Si P < PiS , νo es el coeficiente de fugacidad del vapor y si P > PiS , νo es el coeficiente de fugacidad del líquido. La presión de saturación corresponde a la condición ν oL = ν oV .
58
⎡ A 2 ⎛ BP ⎞⎤ ⎟⎥ ν oV = exp ⎢ Z V − 1 − ln (Z V − BP ) − ln ⎜1 + B ⎜⎝ Z V ⎟⎠⎥⎦ ⎢⎣
(35)
⎡ A 2 ⎛ BP ⎞⎤ ⎟⎥ ln ⎜1 + ν oL = exp ⎢ Z L − 1 − ln (Z L − BP ) − B ⎜⎝ Z L ⎟⎠⎦ ⎣
(36)
Modelos de predicción de propiedades físico-químicas
Presión de vapor
Para una temperatura T < Tc, la presión de saturación (presión de vapor), PiS, se puede estimar a partir de la ecuación de estado RK igualando las ecuaciones (35) y (36) y calculando P por un procedimiento iterativo. Los resultados, obtenidos por Edmister, se muestran en la Figura 2. La curva de presión de vapor R-K no representan satisfactoriamente los datos para un amplio intervalo de formas moleculares, como indican las curvas experimentales para metano, tolueno, ndecano y alcohol etílico. Este hecho, ya mencionado anteriormente, constituye uno de los principales fallos de la ecuación RK. Aparentemente, las constantes críticas Tc y Pc son por sí solas insuficientes para generalizar el comportamiento termodinámico. Sin embargo, la generalización mejora notablemente si se incorpora a la ecuación una tercera constante que represente las diferencias genéricas de las curvas de presión de vapor reducida. Esta modificación es la que condujo a la ecuación de estado S-R-K.
Figura 2 Presión de vapor reducida
Alternativamente, la presión de vapor se puede estimar a partir de muchas correlaciones empíricas, como la conocida ecuación de Antoine. Asimismo, y como ya se ha mencionado, cuando una ecuación de estado resulta adecuada para la presión de vapor de la fase vapor, pero inadecuada para la fase líquida, se puede utilizar la corrección de Poynting. Si el líquido es incompresible, se llega a: ⎛ PS ν oL = ⎜⎜ i ⎝ P
(
)
⎞ o ⎡ v P − PiS ⎤ ⎟ ν VS exp ⎢ L ⎥ ⎟ RT ⎠ ⎣ ⎦
(37)
Para presiones muy altas, la corrección de Poynting para gases ligeros es importante. A bajas presiones, ν oVS es igual a la unidad y el argumento del término exponencial tiende a cero. Por tanto, ν oL tiende a la relación entre la presión de vapor y la presión total. Coeficientes de fugacidad de mezclas
⎡ B B ⎞ ⎛ A 2 ⎛ 2A i BP ⎞⎤ ⎟⎥ φ iV = exp ⎢(Z V − 1) i − ln (Z V − BP ) − − i ⎟ ln ⎜⎜1 + ⎜ B B ⎝ A B⎠ ⎝ Z V ⎟⎠⎥⎦ ⎣⎢
(38)
⎡ Bi B ⎞ ⎛ A 2 ⎛ 2A i BP ⎞⎤ ⎟⎟⎥ φ iL = exp ⎢(Z L − 1) − ln (Z L − BP ) − − i ⎟ ln ⎜⎜1 + ⎜ B B A B Z ⎝ ⎠ L ⎠⎦ ⎝ ⎣
(39)
59
Modelos de predicción de propiedades físico-químicas
2.1.2. Ecuación de estado S-R-K Las expresiones que se obtienen utilizando esta ecuación de estado se indican a continuación y resultan aplicables, tanto a la fase líquida como a la fase vapor, siempre que se utilice la composición de la fase y el factor de compresibilidad adecuados.
(
)
Z 3 − Z 2 + Z A − B − B 2 − AB = 0 ⎡ A ⎛ Z + Bi ν io = exp ⎢ Z − 1 − ln (Z − B i ) − i ln ⎜ Bi ⎝ Z ⎣
H=
(40) ⎞⎤ ⎟⎥ ⎠⎦
(41)
⎡ Bi B ⎞ ⎛ Z + B ⎞⎤ A ⎛⎜ 2A i0.5 φ i = exp ⎢(Z − 1) − ln (Z − B) − ⎜ 0.5 − i ⎟⎟ ln ⎜ ⎟⎥ B B⎝ A B ⎠ ⎝ Z ⎠⎦⎥ ⎣⎢
(42)
⎧ ⎡ m i Tr0.5 m j Tr0.5 1 ⎛ Z+B⎞ C C ⎪ j i − + RT ⎨Z − 1 − ln ⎜ ⎟ ∑ ∑ y i y j A ij ⎢1 − 0.5 0.5 B ⎝ Z ⎠i =1 j=1 ⎢ 2a i 2a j ⎪⎩ ⎣
(43)
H oV
⎤⎫ ⎥ ⎪⎬ ⎥⎪ ⎦⎭
En la ecuación (41), Z es el factor de compresibilidad para la especie pura. Las constantes Ai, Bi, A y B para especies puras son: Pri
* A i = 0.42747 a i * B i = 0.08664
Tr2i
Pri Tr
(44) (45)
i
Las reglas de mezcla para especies no polares son las mismas de la ecuación original R-K. Por ejemplo, para mezclas en fase vapor, C ⎛ C ⎞ A = ∑ ⎜⎜ ∑ y i y j A ij ⎟⎟ i =1 ⎝ j=1 ⎠
(46)
A ij = A i A j
(47)
(
)1 / 2
C
B = ∑ y i Bi i =1
(48)
Excepto para el hidrógeno, las ecuaciones S-R-K pueden aplicarse a gases ligeros tales como nitrógeno, monóxido de carbono, dióxido de carbono y sulfuro de hidrógeno, si se incorporan los parámetros kij de interacción, obtenidos a partir de datos experimentales, en la forma siguiente: Aij = (1 - kij)(AiAj)1/2
(49)
En la Figura 3 se muestra la capacidad de la correlación S-R-K para predecir valores K para un sistema multicomponente de 10 especies, incluso cuando la presión se aproxima a la presión de convergencia. Los cálculos del equilibrio entre fases con las ecuaciones S-R-K requieren una estimación inicial de las composiciones de las fases.
60
Modelos de predicción de propiedades físico-químicas
Sin embargo, la correlación S-R-K, análogamente a lo que ocurre con la ecuación R-K, no es capaz de predecir la densidad del líquido con buena exactitud. Por esta razón, como ya se ha mencionado, han aparecido posteriores desarrollos, como el de Peng y Robinson, dirigidos a mejorar las predicciones de la densidad del líquido y del equilibrio entre fases en la región crítica. Sin embargo, el uso de tales ecuaciones está en general limitado a moléculas no polares relativamente pequeñas.
Figura 3. Ajuste de datos experimentales del valor K y los obtenidos con la ecuación S-R-K Cuando se tratan disoluciones más complejas en las que intervienen compuestos polares, se emplea para el cálculo de los valores K la siguiente ecuación: Ki =
γ iL f iLo γ νo = iL iL φ iV P φ iV
(50)
Los coeficientes de fugacidad de los componentes puros en fase líquida y de los componentes en fase gaseosa se obtienen, evidentemente, a partir de una ecuación de estado. Los coeficientes de actividad en fase líquida se obtienen a partir de los modelos de coeficientes de actividad que se tratan a continuación.
3. MODELOS DE COEFICIENTES DE ACTIVIDAD Los coeficientes de actividad pueden calcularse experimentalmente cuando se conoce el equilibrio vapor-líquido. Pero habitualmente lo que se pretende es predecir dicho equilibrio, sobre todo para sistemas multicomponentes, por medio de los coeficientes de actividad. Existen diferentes métodos o correlaciones basados en la energía libre de Gibbs en exceso con la cual se pueden obtener los coeficientes de actividad. Estas correlaciones expresan la influencia de la composición y de la temperatura en los coeficientes de actividad. La influencia de la presión sólo se hace efectiva cuando se opera a presiones elevadas, 61
Modelos de predicción de propiedades físico-químicas
circunstancia que impide el empleo de estos modelos termodinámicos para la determinación del equilibrio a presiones elevadas. Inicialmente se emplearon las ecuaciones de Van Laar y de Margules, descritas en trabajos y libros de Termodinámica, las cuales son correlaciones puramente empíricas que dan buenas descripciones del equilibrio vapor-líquido de mezclas binarias. En el caso de mezclas multicomponentes, se requiere un mayor número de parámetros, con lo que su complejidad aumenta sin conseguir mejoras apreciables con respecto a otras correlaciones. Las ecuaciones que mejores ajustes presentan para mezclas multicomponentes, sin aumentar el número de parámetros requerido, son cuatro: Scatchard-Hildebrand, que se basa en el concepto de disoluciones regulares y sólo requiere propiedades de los componentes puros; y Wilson, NRTL y UNIQUAC, que se basan en la existencia de interacciones entre las distintas moléculas de las que consta la mezcla. Estas, al igual que las ecuaciones de Van Laar y de Margules, derivan de las energías libres de Gibbs en exceso necesitando, al menos un dato experimental de equilibrio líquido-vapor, para determinar los parámetros binarios de interacción. Por otra parte, la ecuación de Scatchard-Hildebrand también puede resultar de utilidad para sistemas en los que no se dispone de datos experimentales. En este sentido, sin embargo, se emplean más las correlaciones basadas en contribuciones de grupos, como UNIFAC y ASOG.
3.1. Disoluciones regulares. Correlación de Chao-Seader (C-S)
Para las especies menos volátiles de una mezcla, la dependencia de los valores K con respecto a la composición se debe principalmente al comportamiento no ideal de la disolución líquida. Prausnitz, Edmister y Chao demostraron que la relativamente simple teoría de las disoluciones regulares de Scatchard y Hildebrand puede utilizarse para estimar las desviaciones del comportamiento ideal de mezclas líquidas de hidrocarburos. Ellos expresaron los valores K según la ecuación (50). Chao y Seader simplificaron y ampliaron la aplicación de esta ecuación a una correlación general de hidrocarburos y de algunos gases ligeros en la forma de un conjunto compacto de ecuaciones especialmente adecuadas para su utilización en ordenadores. Las correlaciones sencillas para los coeficientes de actividad en fase líquida, basadas exclusivamente en las propiedades de los componentes puros, no son generalmente exactas. Sin embargo, para mezclas de hidrocarburos, la teoría de las disoluciones regulares resulta adecuada y se utiliza mucho. La teoría se basa en la premisa de que la no idealidad se debe a diferencias de las fuerzas de van del Waals de atracción de las especies presentes. Las disoluciones regulares tienen un calor mezcla endotérmico y todos los coeficientes de actividad son superiores a la unidad. Estas disoluciones son regulares en el sentido de que las moléculas se dispersan al azar. Las desiguales fuerzas atractivas entre parejas de moléculas similares y diferentes inducen a provocar la segregación de las mismas. Sin embargo, puede suponerse que esta segregación tiende a ser contrarrestada por la energía térmica dando lugar a que las concentraciones moleculares locales sean idénticas a las concentraciones globales de la disolución. Por tanto, la entropía en exceso es cero, de forma que la entropía de las disoluciones regulares es igual a la de las disoluciones ideales, en las que las moléculas están dispersas al azar.
62
Modelos de predicción de propiedades físico-químicas
Para una disolución real, la energía libre molar, g, es la suma de las energías libres molares de la disolución ideal y la energía libre molar en exceso gE, debida a los efectos de la no idealidad. Para una disolución líquida, C
C
C
i =1
i =1
i =1
(
g = ∑ x i g i + RT ∑ x i ln x i + g E = ∑ x i g i + RT ln x i + g iE
)
(51)
en donde la energía libre molar en exceso es la suma de las energías parciales molares en exceso. La energía libre parcial molar en exceso está relacionada con el coeficiente de actividad de la fase líquida por: g iE 1 ⎛⎜ ∂ n T g E = ln γ i = RT RT ⎜⎝ ∂ n i
⎞ ⎟ ⎟ ⎠ P ,T , n j
(52)
Para una disolución líquida regular multicomponente, la energía libre molar en exceso es: 2⎤ C ⎡1 C C g E = ∑ (x i v iL ) ⎢ ∑ ∑ Φ i Φ j δ i − δ j ⎥ i =1 ⎣ 2 i =1 j=1 ⎦
(
)
(53)
Φ es la fracción en volumen y suponiendo volúmenes aditivos, Φj =
x j v jL C
=
x j v jL
∑ x i v iL
(54)
vL
i =1
δ es el parámetro de solubilidad, ⎛ λ j − RT ⎞ ⎟ δj = ⎜ ⎜ v jL ⎟ ⎝ ⎠
1/ 2
(55)
A partir de estas ecuaciones se obtiene una expresión para el coeficiente de actividad:
ln γ iL
C ⎛ ⎞ v iL ⎜⎜ δ i − ∑ Φ j δ j ⎟⎟ j=1 ⎝ ⎠ = RT
2
(56)
Cuando las diferencias de tamaños moleculares, reflejados por los volúmenes molares del líquido, son apreciables, pueden añadirse a la contribución de la energía libre de una disolución regular la siguiente corrección de tamaño de Flory-Huggins para disoluciones atérmicas (entalpía en exceso igual a cero): C ⎛Φ g E = RT ∑ x i ln ⎜⎜ i i =1 ⎝ xi
⎞ ⎟⎟ ⎠
⎛v ⎞ v ln γ iL = ln⎜⎜ iL ⎟⎟ + 1 − iL vL ⎝ vL ⎠
(57)
(58)
La expresión completa para el coeficiente de actividad de una especie en una disolución regular, incluyendo la corrección de Flory-Huggins, es: 63
Modelos de predicción de propiedades físico-químicas
γ iL
2 ⎧ ⎡ C ⎤ ⎪ v iL ⎢δ i − ∑ Φ j δ j ⎥ ⎛v j=1 ⎪ ⎣ ⎦ + ln ⎜⎜ iL = exp ⎨ RT ⎝ vL ⎪ ⎪ ⎩
⎞ v ⎟⎟ + 1 − iL vL ⎠
⎫ ⎪ ⎪ ⎬ ⎪ ⎪ ⎭
(59)
A partir de la correlación de Chao-Seader también se pueden calcular los coeficientes de o , mediante una expresión empírica en fugacidad de los componentes puros en fase líquida, ν iL función de Tr, Pr y ω. Para condiciones hipotéticas del líquido (P
Tci) la correlación o a partir de datos de equilibrio vapor-líquido. La ecuación C-S fue ampliada calculando ν iL o es: para ν iL (o) (1) o log ν iL = log ν iL + ω i log ν iL (o) log ν iL = A0 +
(60)
(
)
A1 + A 2 Tri + A 3 Tr2i + A 4 Tr3i + A 5 + A 6 Tri + A 7 Tr2i Pri Tri
(
)
(61)
+ A 8 + A 9 Tri P − log Pri (1) log ν iL = A 10 + A 11Tri +
(
A 12 + A 13 Tr3i + A 14 Pri − 0.6 Tri
2 ri
)
(62)
Las constantes para la ecuación (62) son: A10 = -4.23893
A11 = 8.65808
A13 = -3.15224
A14 = -0.025
A12 = -1.22060
Las constantes para la ecuación (61) son: A0 A1 A2 A3 A4 A5 A6 A7 A8 A9
Fluido simple, ω=0 2.05135 -2.10899 0 -0.19396 0.02282 0.08852 0 -0.00872 -0.00353 0.00203
Metano 1.36822 -1.54831 0 0.02889 -0.01076 0.10486 -0.02529 0 0 0
Hidrógeno 1.50709 2.74283 -0.02110 0.00011 0 0.008585 0 0 0 0
Las condiciones de aplicabilidad de la correlación C-S son: T < 500 ºF (260 ºC). No se aconseja para temperaturas inferiores a 0 ºF. P < 1000 psia (6.89 MPa) Para hidrocarburos (excepto metano), 0.5 < Tri < 1.3 y la presión crítica de la mezcla < 0.8. Para sistemas que contienen metano y/o hidrógeno, Tr < 0.93, y fracción molar de metano < 0.3. Fracción molar de otros gases disueltos <0.2. 64
Modelos de predicción de propiedades físico-químicas
En la predicción de los valores K de parafinas y olefinas, la fracción molar de aromáticos en la fase líquida habrá de ser < 0.5. Por el contrario, en la predicción de los valores K de aromáticos, la fracción de aromáticos en la fase líquida habrá de ser > 0.5. A partir de la correlación C-S para el valor K se pueden calcular otras propiedades termodinámicas. La ecuación de estado R-K (Tabla 2) se emplea para determinar la densidad y la ecuación (33) para obtener la entalpía de la mezcla en fase vapor. La entalpía del gas ideal o H iV se calcula con la ecuación (30). La entalpía de la mezcla en fase líquida se calcula a o partir de las ecuaciones de ν iL y γiL con la correlación C-S. La ecuación de partida es la siguiente: o ⎡ C ⎛ ∂ ln ν iL o H L = ∑ x i ⎢H iV − RT 2 ⎜⎜ i =1 ⎢⎣ ⎝ ∂T
⎞ ⎛ ∂ ln γ iL ⎟ − RT 2 ⎜⎜ ⎟ ⎝ ∂T ⎠P
⎞ ⎤ ⎟⎟ ⎥ ⎠ P , x i ⎥⎦
(63)
Derivando el coeficiente de fugacidad del componente líquido puro con respecto a la temperatura se obtiene la siguiente relación para los efectos combinados de la presión y el calor latente de cambio de fase vapor a líquido: o ⎛ ∂ ln ν iL RT 2 ⎜ ⎜ ∂T ⎝
⎞ 2.30258 RT 2 o ⎟ = H iV − H iL = ⎟ Tci ⎠P
(
)
(
+ Pri A 6 + 2A 7 Tri
)
⎡ A ⎢− 21 + A 2 + Tri 2A 3 + 3A 4 Tri ⎢⎣ Tri
(
)
⎛ ⎞⎤ A 2⎟ ⎥ + A 9 Pr2i + ωi ⎜ A 11 − 12 + 3 A T 13 ri 2 ⎜ ⎟⎥ T r i ⎝ ⎠⎦
(64)
Las constantes Ai son las de las ecuaciones (61) y (62). La derivada del coeficiente de actividad en la fase líquida conduce a la entalpía en exceso de la especie H iE (calor de mezcla). Para disoluciones regulares, H iE >0 (endotérmica). ⎛ ∂ ln γ iL RT ⎜⎜ ⎝ ∂T 2
C ⎞ ⎛ ⎞ E ⎟⎟ = (H iL − H iL ) = − H iL = − v iL ⎜⎜ δ i − ∑ Φ j δ j ⎟⎟ j=1 ⎝ ⎠ ⎠ P, x i
2
(65)
Una ecuación para el volumen molar de la fase líquida, consistente con la correlación C-S, se deduce sumando los volúmenes molares de las especies y efectuando la corrección del volumen en exceso (volumen de mezcla): ⎡ C C ⎛ ∂ ln γ iL v L = ∑ x i v iL + v iLE = ∑ x i ⎢ v iL + RT⎜⎜ i =1 i =1 ⎢⎣ ⎝ ∂P
(
)
⎞ ⎤ ⎟⎟ ⎥ ⎠ T , x i ⎥⎦
(66)
Para disoluciones regulares γiL se puede considerar independiente de la presión, y v iLE = 0 . Para el cálculo de los volúmenes molares de los componentes se puede utilizar la siguiente ecuación: v iL =
[
(
)
2.30258 RT A 5 + A 6 Tri + A 7 Tr2i + 2Pri A 8 + A 9 Tri + ω i A 14 PCi
]
(67)
La correlación de Chao y Seader se utiliza ampliamente en las industrias del petróleo y gas natural, habiéndose aplicado al diseño de una gran variedad de separaciones de hidrocarburos ligeros por destilación. 65
Modelos de predicción de propiedades físico-químicas
3.2. Mezclas no ideales que contienen compuestos polares
En los líquidos que contienen especies polares diferentes, especialmente cuando se forman o se rompen enlaces de hidrógeno, casi nunca es válida la suposición de disolución líquida ideal. Ewell, Harrison y Berg propusieron una clasificación muy útil de las moléculas basada en el potencial de asociación o de solvatación debidas a la formación de enlaces de hidrógeno. Si una molécula contiene un átomo de hidrógeno unido a un átomo dado (O, N, F y, en ciertos casos, C), el átomo activo de hidrógeno puede formar un enlace con otra molécula que contenga un átomo dador. La clasificación de la Tabla 6 permite una estimación cualitativa de las desviaciones de la ley de Raoult para parejas binarias, si se usa conjuntamente con la Tabla 7. Desviaciones positivas corresponden a valores de γiL>1. Tabla 6. Clasificación de las moléculas según su potencial de formación de enlaces de hidrógeno Clase I
Descripción Moléculas capaces de formar redes tridimensionales con enlaces de hidrógeno fuertes.
II
Otras moléculas que contienen tanto átomos de hidrógeno activos como otros átomos donadores (O, N, F).
III
Moléculas que contienen átomos donadores pero no hidrógenos activos.
IV
V
Moléculas que contienen átomos de hidrógeno activos pero no átomos donadores con dos o tres átomos de cloro sobre el mismo átomo de carbono y uno o más átomos de cloro sobre átomos de carbono adyacentes. Todas las demás moléculas que no tienen átomos de hidrógeno activos ni átomos donadores.
Ejemplos Agua, glicoles, glicerina, aminoalcoholes, hidroxilaminas, hidroxiácidos, polifenoles y amidas Alcoholes, ácidos, fenoles, aminas primerias y secundarias, oximas, compuestos nitro y nitrilos con átomos de H en α, amoniaco, hidracina, fluoruro de hidrógeno y cloruro de hidrógeno. Éteres, cetonas, aldehídos, ésteres, aminas terciarias (incluyendo las de tipo piridina), compuestos nitro y nitrilos sin átomos de H en α. CHCl3, CH2Cl2, CH3CHCl2, CH2ClCHClCH2Cl y CH2ClCHCl2.
CH3ClCH2Cl,
Hidrocarburos, sulfuro de carbono, sulfuros, mercaptanos, y derivados halogenados no incluidos en la clase IV.
Tabla 7. Interacciones moleculares que causan desviaciones de la ley de Raoult Tipo de desviación Siempre negativa. Cuasi-ideal; siempre positiva o ideal. Generalmente positiva, pero algunas veces negativa. Siempre positiva. Siempre positiva.
Clases III + IV III + III; III + V; IV + IV; IV + V; V + V. I + I; I + II; I + III; II + II; II + III. I + IV (frecuentemente solubilidad limitada); II + IV. I + V; II + V.
Efecto sobre el enlace de hidrógeno Solamente se forman enlaces-H. No intervienen enlaces-H. Se forman y se rompen enlaces-H. con
Se forman y se rompen enlaces-H, pero la disociación de las Clases I o II es el efecto más importante. Solamente se rompen enlaces-H.
Los efectos de la disolución no ideal pueden incorporarse en las formulaciones del valor K, tal y como se ha visto, en dos formas diferentes. La primera utiliza el coeficiente de fugacidad φi, juntamente con la ecuación de estado y adecuadas reglas de mezcla. Este método es el más 66
Modelos de predicción de propiedades físico-químicas
empleado para tratar no idealidades en fase vapor. Sin embargo, φiV refleja los efectos combinados de un gas no ideal y de una mezcla gaseosa no ideal. A bajas presiones ambos efectos son despreciables. A presiones moderadas una mezcla en fase vapor puede ser todavía ideal, aún cuando la misma no siga la ley de los gases ideales. Sin embargo, en fase líquida las no idealidades pueden ser muy importantes aún a bajas presiones. Como ya se ha visto, el coeficiente de fugacidad, φiL, puede utilizarse para expresar las no idealidades en fase líquida de especies no polares. Cuando están presentes especies polares, la técnica habitual para tratar no idealidades de o , donde el primero disoluciones es retener φiV pero sustituir φiL por el producto de γiL por ν iL tiene en cuenta las desviaciones del comportamiento ideal: γ νo K i = iL iL (68) φ iV o = PiS P y φiV = 1.0, de forma que la ecuación (68) se transforma en Para bajas presiones, ν iL una modificación de la ley de Raoult para el valor K: γ iL PiS Ki = (69) P C
P = ∑ x i γ iL PiS
(70)
i =1
Para presiones moderadas, se puede aplicar la siguiente ecuación: o ⎛ PiS ⎞⎛⎜ ν iVS ⎜ ⎟ K i = γ iL ⎜ ⎟ o ⎜ ⎝ P ⎠⎝ ν iV
(
)
S ⎞ ⎟ exp ⎡⎢ v iL P − Pi ⎤⎥ ⎟ RT ⎣⎢ ⎦⎥ ⎠
(71)
Para el caso general se aplica directamente la ecuación (68). Los modelos de coeficientes de actividad más conocidos (algunos de los cuales se presentan con más detalle en los apartados siguientes) se indican en la Tabla 8, con estas ecuaciones se pueden calcular volúmenes, entalpías y entropías en exceso. Tabla 8
Ecuaciones empíricas y semi-teóricas para la estimación de coeficientes de actividad de mezclas líquidas binarias
67
Modelos de predicción de propiedades físico-químicas
3.3. Ecuación de Wilson
La correlación semi-empírica de Wilson, publicada en 1964, es una extensión de la ecuación teórica de Flory-Huggins. Las moléculas no sólo difieren en tamaño, como ocurre en la ecuación de Flory-Huggins, sino también en las fuerzas intermoleculares, por lo que la ecuación de Wilson introduce una contribución debida a las energías de interacción entre las moléculas. Supone que la distribución de las moléculas no es al azar, sino que se distribuyen en términos probabilísticos, según la distribución de energías de Boltzmann, en función de las energías intermoleculares e introduce el concepto de composición local (xji), fracción molar del componente j de la mezcla que rodea a una molécula central i. En la Figura 4 se muestra esquemáticamente la composición local para una disolución binaria globalmente equimolar. Alrededor de una molécula central de tipo 1 la fracción Figura 4. Concepto de composiciones locales molar local de moléculas de tipo 2 es 5/8. La siguiente expresión representa la probabilidad de encontrar a una molécula de componente j alrededor de la molécula central i, con respecto a la probabilidad de encontrar a una molécula de componente i alrededor de la molécula central i. x ji x ii
=
(
x j exp − λ ji RT
)
(72)
x i exp(− λ ii RT )
siendo: xji y xii la composición local del componente i rodeado de moléculas del componente j o i; λji y λii las energías de interacción entre las moléculas j e i o i e i (λji = λij y λii ≠ 0); R la constante universal de los gases ideales y T la temperatura de la mezcla. La fracción volumétrica local, ξi, del componente i en una mezcla multicomponente se define como el cociente entre el volumen molar que ocupan las moléculas del componente i alrededor de la molécula i central, y el volumen total que ocupan todas las moléculas que rodean a la molécula i central: ξi =
x ii v i C
∑ x ji v j j=1
=
x i v i exp(− λ ii RT ) C
(
∑ x j v j exp − λ ji RT j=1
)
=
xi C
(73)
∑ x j Λ ji
j=1
vi y vj son los volúmenes molares de los componentes i y j; Λji ≠ Λij y Λii = 1, parámetro característico de dos componentes de la mezcla, cuya dependencia con la temperatura es igual a: Λ ji = 68
⎛ λ ji − λ jj ⎞ vi ⎟ exp⎜⎜ − vj RT ⎟⎠ ⎝
(74)
Modelos de predicción de propiedades físico-químicas
Sustituyendo la fracción volumétrica de la energía libre de Gibbs molar en exceso por la fracción volumétrica local se obtiene la ecuación de Wilson: C gE ⎛C ⎞ = − ∑ x i ln⎜⎜ ∑ x j Λ ij ⎟⎟ (75) RT i =1 ⎝ j=1 ⎠ Mediante la relación entre la energía libre de Gibbs molar en exceso y los coeficientes de actividad, se obtiene la siguiente expresión:
ln γ i =
1 ⎛⎜ ∂n i g E RT ⎜⎝ ∂n i
C x Λ ⎞ ⎛C ⎞ ⎟ = − ln⎜⎜ ∑ x j Λ ij ⎟⎟ + 1 − ∑ C k ki ⎟ k =1 ⎝ j=1 ⎠ ⎠ T ,P,n j ∑ x j Λ kj
(76)
j=1
Los parámetros binarios de interacción λij - λii y λij - λjj (o Λij y Λji) se deben determinar inicialmente a partir de datos experimentales de equilibrio vapor-líquido para mezclas binarias y posteriormente emplearse en el cálculo de los coeficientes de actividad de cada uno de 1os componentes de la mezcla multicomponente.
3.4. Ecuación NRTL (Non-Random Two-Liquid)
La ecuación NRTL, introducida por Renon y Prausnitz en 1968, se basa en la teoría quasiquímica de Guggenheim que establece que las moléculas no se distribuyen aleatoriamente en una disolución, por lo que incorpora un parámetro que indica el efecto de la no-aleatoriedad. Además, al igual que la correlación de Wilson, emplea el concepto de composición local con la inclusión del parámetro αji en la exponencial: x ji x ii
=
( x i exp(− α ji g ii
) RT )
x j exp − α ji g ji RT
(77)
En la ecuación (77), gji tiene el mismo significado que λji en la ecuación de Wilson, es decir, la energía de interacción entre las moléculas j e i. La obtención de la expresión para la energía libre de Gibbs en exceso molar se realiza mediante la teoría de dos líquidos de Scott, llegando a la siguiente ecuación: ⎛ τ 21G 21 τ12 G 12 gE = x 1 x 2 ⎜⎜ + RT ⎝ x 1 + x 2 G 21 x 2 + x 1G 12
⎞ ⎟⎟ ⎠
g ji − g ii
τ ji =
RT
(
G ji = exp − α ji τ ji
(78)
(79)
)
(80)
Para una mezcla binaria, hay tres parámetros ajustables: (g12-g22), (g21-g11), y α12. Para mezclas multicomponentes, la ecuación NRTL se expresa como: C
C
gE = ∑ xi i =1
∑ τ ji G ji x j j=1
C
(81)
∑ G ki x k
k =1
69
Modelos de predicción de propiedades físico-químicas
Los coeficientes de actividad se obtienen fácilmente a partir de la energía libre de Gibbs: C C ⎡ ∑ τ ji G ji x j C τ rj G rj x r ⎤⎥ ∑ x G ⎢ j=1 j ij r =1 +∑ C ln γ i = C (82) ⎢τ ij − C ⎥ j=1 ⎢ ⎥ ∑ G ki x k ∑ G kj x k ∑ G kj x k k =1 k =1 k =1 ⎣⎢ ⎦⎥ Los parámetros de interacción, que se deben determinar inicialmente a partir de datos experimentales de equilibrio de mezclas binarias, son las energías de interacción intermoleculares, (gij-gii) y (gij-gjj) (o τij y τji), y el parámetro de no-aleatoriedad, αij. El parámetro αij, tal y como se indica en la Tabla 9, oscila entre 0.2 y 0.47 y es adimensional. Suele expresar el doble del inverso del número de coordinación, es decir, el número de moléculas que están alrededor de la molécula central, por lo que dependerá de la naturaleza química de los componentes. La principal ventaja de este método estriba en la buena determinación del equilibrio líquidolíquido para mezclas binarias. Para el equilibrio V-L de ciertos sistemas, por ejemplo mezclas de agua y compuestos orgánicos, da mejores resultados que la ecuación de Wilson, aunque en general sus predicciones son peores. Al igual que la correlación de Wilson, incluye la influencia de la temperatura en los parámetros τij. Su dificultad radica en el ajuste de tres parámetros para mezclas binarias, en lugar de los dos que se emplean tanto en la ecuación de Wilson como en el método UNIQUAC. Tabla 9 Valores del parámetro de no aleatoriedad de la ecuación NRTL αij 0.20 0.30
0.40 0.47
Ámbito de aplicación Mezclas de hidrocarburos saturados y especies polares no asociadas (n-heptano-acetona). Mezclas de compuestos no polares (benceno-n-heptano), excepto fluorocarbonos y parafinas. Mezclas de especies no polares y polares no asociadas (benceno-acetona). Mezclas de especies polares que presentan desviaciones negativas con respecto a la ley de Raoult (acetona-cloroformo) y desviaciones positivas moderadas (etanol-agua). Mezclas de agua y especies polares no asociadas (agua-acetona). Mezclas de hidrocarburos saturados y perfluorocarbonos homólogos (n-hexano-perfluoro-nhexano). Mezclas de un alcohol u otra especie fuertemente autoasociada con especies no polares (etanolbenceno). Mezclas de tetracloruro de carbono con acetonitrilo o nitrometano. Mezclas de agua con butil-glicol o piridina.
3.5. Ecuación UNIQUAC (Universal Quasi-Chemical)
La correlación UNIQUAC fue introducida por Abrams y Prausnitz en 1975 y tiene una base mecánica-estadística. Este modelo generaliza un análisis previo de Guggenheim y lo amplía a mezclas de moléculas que difieren apreciablemente, tanto en la forma como en el tamaño. Al igual que en las ecuaciones de Wilson y NRTL, se emplean concentraciones locales. Sin embargo, en vez de fracciones en volumen locales y fracciones molares locales, UNIQUAC utiliza la fracción de área local, θij, como variable primaria de concentración, que se determina representando una molécula como un conjunto de segmentos unidos. Cada molécula está caracterizada por dos parámetros estructurales, que se determinan con relación a un segmento estándar, que se toma como una esfera equivalente de una unidad monomérica de una molécula lineal de polimetileno de longitud infinita. Los dos parámetros estructurales 70
Modelos de predicción de propiedades físico-químicas
son el número relativo de segmentos por molécula, r (parámetro de volumen) y la superficie relativa de la molécula, q (parámetro de superficie). En el modelo UNIQUAC, la energía libre de Gibbs en exceso consta de dos contribuciones: •
Una debida a las diferencias de tamaño y forma de las moléculas, llamada combinatorial o configuracional, que para un sistema binario se expresa como: E g combinator Φ Φ θ θ z⎛ ial = x 1 ln 1 + x 2 ln 2 + ⎜⎜ q 1 x 1 ln 1 + q 2 x 2 ln 2 RT x1 x2 2 ⎝ Φ1 Φ2
⎞ ⎟⎟ ⎠
(83)
Φi =
x i ri x 1 r1 + x 2 r2
(84)
θi =
xiqi x 1q 1 + x 2 q 2
(85)
Φ1 y Φ2 son las fracciones volumétricas de las moléculas 1 y 2; θ1 y θ2, las fracciones superficiales; r1 y r2, los volúmenes de van der Waals respecto a un estándar; q1 y q2, las áreas de van der Waals respecto a un estándar y z, el número de coordinación, que suele oscilar entre 6 y 12. •
Y otra debida a las interacciones energéticas entre las moléculas, llamada residual. g Eresidual = −q 1 x 1 ln (θ1 + θ 2 τ 21 ) − q 2 x 2 ln (θ 2 + θ1 τ12 ) RT
(86)
⎡ − (u 21 − u 11 ) ⎤ τ 21 = exp ⎢ ⎥ RT ⎣ ⎦
(87)
⎡ − (u 12 − u 22 ) ⎤ τ12 = exp ⎢ ⎥ RT ⎣ ⎦
(88)
u11, u22, u12 = u21 son las energías de interacción intermoleculares 1-1, 2-2 y 1-2, respectivamente. Mientras que la contribución combinatorial contiene dos variables (Φi, θi) que dependen de la composición, y se obtiene únicamente a partir de parámetros estructurales (ri, qi) de los componentes puros, la contribución residual tan sólo depende de una variable (θi), aunque posee dos parámetros binarios ajustables: u21-u11 y u21-u22 (o τ21 y τ12). La expresión del coeficiente de actividad para una mezcla multicomponente se obtiene directamente por diferenciación de la energía libre de Gibbs, resultando la siguiente expresión: Φ C Φ θ z ln γ i = ln γ iC + ln γ iR = ln i + q i ln i + l i − i ∑ x j l j Φi xi 2 x i j=1 (89) C θ j τ ij ⎛C ⎞ − q i ln⎜⎜ ∑ θ j τ ji ⎟⎟ + q i − q i ∑ C j=1 ⎝ j=1 ⎠ ∑ θ k τ kj k =1
li =
z (ri − q i ) − ri + 1 2
(90) 71
Modelos de predicción de propiedades físico-químicas
Los parámetros estructurales ri y qi se determinan a partir de medidas cristalográficas (ángulos de enlace y distancias de enlace). Las ventajas que presenta con respecto a los dos métodos anteriores son: • Predice el equilibrio líquido-líquido con sólo dos parámetros. • Sus parámetros poseen una menor dependencia con la temperatura debido a su mejor base teórica. • Resulta aplicable a disoluciones que posean moléculas de diferentes tamaños, ya que incluyen en su ecuación contribuciones estructurales. Este modelo termodinámico es la base de otro modelo de contribución de grupos, llamado UNIFAC (UNIQUAC Functional Activity Coefficients), que está ampliamente extendido y se emplea para la predicción de los coeficientes de actividad en fase líquida de mezclas binarias para las que no se posee información experimental o ésta es escasa.
3.6. Modelos de contribución de grupos: UNIFAC
Los modelos termodinámicos de contribuciones de grupos más establecidos en la actualidad son el método ASOG, introducido por Deal y Derr en 1968, y el método UNIFAC de Fredenslund y colaboradores, en 1975. Ambos modelos predicen los coeficientes de actividad de la fase líquida de mezclas de no-electrolitos considerando la mezcla líquida como una disolución de grupos en lugar de una disolución de moléculas. Los grupos son las unidades estructurales que constituyen una molécula, de tal forma que, si bien el número de moléculas es infinito, el número de grupos es limitado. El hecho de que estos métodos operen con grupos presenta la ventaja de que simplemente con una serie reducida de grupos se pueden predecir los coeficientes de actividad de infinidad de mezclas muy diferentes entre sí. Así, por ejemplo, en una disolución de tolueno y acetona, las contribuciones de grupo pueden deberse a 5 grupos CH aromáticos, 1 grupo C aromático y 1 grupo CH3 del tolueno; y 2 grupos CH3 más 1 grupo CO carbonilo de la acetona. Alternativamente, pueden emplearse grupos más grandes para formar 5 grupos CH aromáticos y un grupo CCH3 del tolueno; y un grupo CH3 y un grupo CH3CO de la acetona. Cuanto más grandes sean los grupos funcionales tomados, mayor es la exactitud de la representación molecular, aunque disminuye la ventaja del método de contribución de grupos, ya que se requiere un mayor número de grupos. En la práctica se pueden utilizar unos 50 grupos funcionales para representar miles de mezclas líquidas multicomponentes. Ambos métodos permiten calcular los coeficientes de actividad mediante dos términos o contribuciones al igual que el modelo UNIQUAC: una combinatorial, debida a las diferencias de forma y tamaño de las moléculas, y una residual, debida a las interacciones energéticas entre los grupos, aunque difieren en algunos aspectos. Sin embargo, la aplicabilidad del modelo ASOG es mucho menor que la del modelo UNIFAC, debido a la escasez de parámetros de interacción de grupos que se encuentran publicados. A continuación se describe de manera breve el modelo UNIFAC. UNIFAC se basa en el modelo termodinámico UNIQUAC, y en la bibliografía se encuentran numerosos trabajos en los que se han determinado las contribuciones de un elevado número 72
Modelos de predicción de propiedades físico-químicas
de grupos. El intervalo de aplicabilidad está comprendido entre 300 y 425 K y bajas presiones de operación. En este método, los parámetros moleculares de volumen y de área en los términos combinatoriales se sustituyen por: ri = ∑ ν (ki ) R k
(91)
q i = ∑ ν (ki ) Q k
(92)
k
k
ν (ki ) el número de grupos funcionales de tipo k en la molécula i, y Rk y Qk, los parámetros de volumen y de área, respectivamente, para el grupo funcional de tipo k. El término residual de la ecuación (89), que está representado por ln γ iR , se sustituye por la expresión:
(
ln γ iR = ∑ ν (ki ) ln Γk − ln Γk( i ) k
)
(93)
todos los grupos funcionales de la mezcla
Γk es el coeficiente de actividad residual del grupo funcional k en la mezcla real, y ln Γk(i ) es la misma magnitud pero en una mezcla de referencia que solamente contiene moléculas de tipo i. Se requiere esta última magnitud, ya que γ iR → 1.0, cuando x1 → 1.0. Tanto ln Γk(i ) como Γk tienen la misma forma que el término residual de la ecuación (89). Por tanto,
⎡ ⎤ ⎛ ⎞ θ m Tkm ⎥ ⎢ ln Γk = Q k ⎢1 − ln⎜⎜ ∑ θ m Tmk ⎟⎟ − ∑ ⎥ ⎝m ⎠ m ∑ θ n Tnm ⎥ ⎢⎣ n ⎦
(94)
θm es la fracción de área del grupo m, dada por una ecuación análoga a la (85): θm =
XmQm ∑ XnQn
(95)
n
Xm es la fracción molar del grupo m en la disolución: ( j) ∑ vm x j
Xm =
j
( j) ∑ ∑ vn x j
(96)
j n
y Tmk es un parámetro de interacción de grupo dado por una ecuación similar a la (89):
⎛ a ⎞ Tmk = exp⎜ − mk ⎟ ⎝ T ⎠
(97)
amk ≠ akm y cuando m = k, entonces amk = 0 y Tmk = 1.0. Para Γk(i ) , también es aplicable la ecuación (94), y los términos θ corresponden al componente i puro.
73
Modelos de predicción de propiedades físico-químicas
Se dispone de amplias tablas de valores para Rk, Qk, amk, y akm, algunos de los cuales se indican a modo de ejemplo en la Tabla 10, que van siendo puestas al día a medida que se obtienen nuevos datos experimentales. Aunque los valores de Rk y Qk son diferentes para cada grupo funcional, los valores de amk son iguales para todos los subgrupos de un grupo principal. Por tanto, la cantidad de datos experimentales que se requieren para obtener valores de amk y akm, y el tamaño del banco de datos para estos parámetros no son tan grandes como cabría esperar. Tabla 10. Valores de los parámetros volumétricos (Rk), de superficie (Qk) y de interacción (amk) para algunos grupos funcionales Grupos y subgrupos Grupo Subgrupo
k
CH3 1 2 CH2 CH 3 C 4 10 3 ACH ACH (AC = carbono aromático) 12 4 ACCH2 ACCH3 ACCH2 13 OH 15 5 OH 17 H2O 7 H 2O 19 9 CH2CO CH3CO 20 CH2CO 25 13 CH2O CH3O CH2O 26 CH-O 27 32 15 CNH CH3NH CH2NH 33 CHNH 34 1 CH2
Rk
Qk
0.9011 0.6744 0.4469 0.2195 0.5313
0.848 0.540 0.228 0.000 0.400
1.2663 1.0396 1.0000 0.9200 1.6724 1.4457 1.1450 0.9183 0.6908 1.4337 1.2070 0.9795
0.968 0.660 1.200 1.400 1.488 1.180 1.088 0.780 0.468 1.244 0.936 0.624
Parámetros de interacción amk 1 0.00 1 CH2 -11.12 3 ACH 4 ACCH2 -69.70 156.40 5 OH 300.00 7 H 2O 9 CH2CO 26.76 83.36 13 CH2O 65.33 15 CNH 24.82 19 CCN
74
3 61.13 0.00 -146.80 89.60 362.30 140.10 52.13 -22.31 -22.97
4 76.50 167.00 0.00 25.82 377.60 365.80 65.69 223.00 -138.40
5 986.50 636.10 803.20 0.00 -229.10 164.50 237.70 -150.00 185.40
7 1318.00 903.80 5695.00 353.50 0.00 472.50 -314.70 -448.20 242.80
9 476.40 25.77 -52.10 84.00 -195.40 0.00 191.10 394.60 -287.50
13 251.50 32.14 213.10 28.06 540.50 -103.60 0.00 -56.08 38.81
15 255.70 122.80 -49.29 42.70 168.00 -174.20 251.50 0.00 -108.50
19 597.00 212.50 6096.00 6.712 112.60 481.70 -18.51 147.10 0.00
Modelos de predicción de propiedades físico-químicas
3.7. Determinación de los parámetros de interacción molecular
El equilibrio entre fases se puede predecir conocidos los coeficientes de actividad de los componentes que integran el sistema y su dependencia con la composición y la temperatura. Esto último se determina mediante las correlaciones o modelos termodinámicos presentados en los apartados precedentes, los cuales incluyen unos parámetros ajustables que se deben conocer inicialmente. Estos parámetros corresponden a interacciones binarias intermoleculares, y se pueden determinar a partir de mezclas binarias de las formas siguientes: a. Datos de equilibrio líquido-vapor en el intervalo de composición. Mediante un proceso iterativo en el que se tienen en cuenta los errores experimentales, de forma que se minimiza la energía libre de Gibbs del sistema, y los resultados son termodinámicamente consistentes (verifican la ecuación de Gibbs-Duhem). b. Datos de azeótropos. La determinación de los parámetros de interacción se realiza fácilmente a partir de datos de equilibrio del azeótropo, debido a que las composiciones de ambas fases coinciden. c. Datos de solubilidad para mezclas parcialmente insolubles. Su cálculo es semejante al del equilibrio vapor-líquido. d. Datos de coeficientes de actividad a dilución infinita. El componente para el que se pretende determinar el coeficiente de actividad se encuentra en una cantidad muy pequeña con respecto al otro componente. Los modelos termodinámicos poseen expresiones del coeficiente de actividad a dilución infinita, de forma que, conocido su valor para cada uno de los componentes, se determina fácilmente el valor de los parámetros binarios de interacción. De todos ellos, el más empleado es el de los coeficientes de actividad a dilución infinita, por su sencillez, rapidez y facilidad de obtención. Además, como su valor normalmente es el más elevado, hay menor incertidumbre en la interpolación que en la extrapolación de datos. La determinación experimental de los coeficientes de actividad a dilución infinita se realiza mediante técnicas cromatográficas y ebullométricas. Tales técnicas son complementarias, ya que las primeras se emplean cuando los solutos tienen una volatilidad muy alta con respecto al disolvente (componente de la mezcla en concentración elevada), y las segundas cuando la volatilidad es similar.
4. BIBLIOGRAFÍA •
Biegler, L.T.; Grossmann; I.E.; Westerberg, A.W., Systematic Methods of Chemical Process Design, Prentice Hall, New Jersey (1997)
•
Gess, M.A.; Danner, R.P.; Nagvekar, M., Thermodynamic Analysis of Vapor-Liquid Equilibria: Recommended Models and Standard Data Base, DIPPR (1991)
•
Henley, E.J.; Seader, J.D., Operaciones de Separación por Etapas de Equilibrio en Ingeniería Química, Reverté, Barcelona (1988)
•
Walas, S.M., Phase Equilibria in Chemical Engineering, Butterworth, Boston (1985)
•
Seader, J.D; Henley, E.J., Separation Process Principles, John Wiley & Sons, New York (1998) 75
I.
Termodinámica y modelización rigurosa de procesos
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección Aurelio B. Vega Granda Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
ÍNDICE 1. INTRODUCCIÓN ......................................................................................................79 2. MÉTODOS DE PROPIEDADES IMPLEMENTADOS EN HYSYS....................86 2.1. Ecuaciones de estado .............................................................................................86 2.2. Modelos de actividad.............................................................................................88 2.3. Métodos semiempíricos .........................................................................................92 2.4. Métodos de presión de vapor.................................................................................93 3. SELECCIÓN DE MÉTODOS DE PROPIEDADES...............................................93
1. INTRODUCCIÓN A la hora de afrontar cualquier simulación de un proceso químico hay que considerar en primer lugar qué datos termodinámicos son necesarios para llegar a cabo esa simulación. Con carácter general, se puede decir que estos datos serán: •
Para resolver los balances de materia se necesitarán valores de la constante de equilibrio entre fases, K, para columnas, flash, …
•
Para los balances de energía se precisarán datos de entalpías, especialmente para el caso de cambiadores de calor.
•
Se necesitarán entropías para compresores y expansores (turbinas).
•
Energía libres para el equilibrio químico.
•
Volumen molar para el dimensionado de equipos.
•
Propiedades de transporte también para el dimensionado de equipos.
También habrá que estimar algunas propiedades, como: •
Propiedades de componentes puros: presión de vapor, calor de vaporización, ..
•
Propiedades de mezclas: densidad, viscosidad, …
•
Equilibrios entre fases (LV, LL, VLL) para los sistemas multicomponentes.
Para llevar a cabo todas estas tareas los simuladores comerciales disponen de una serie de información básica, a partir de la cual se calculan todas las propiedades anteriores. Esta información básica está compuesta por: •
Propiedades de componentes puros: almacenadas como parámetros dependientes de la temperatura y/o presión, o bien almacenados como valores (propiedades críticas, puntos de ebullición, etc.).
•
Datos de equilibrio entre fases (LV, LL, VLL), generalmente almacenados como parámetros de interacción. 79
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
En el caso del simulador HYSYS los datos disponibles se resumen en: •
Base de datos con 1500 componentes puros.
•
Base de datos con 16000 ajustes binarios para el equilibrio entre fases.
•
Posibilidad de añadir nuevos componentes (pseudocomponentes).
Evidentemente, el elemento vital del proceso de modelización y simulación es la especificación de las propiedades termofísicas.
Para la estimación de propiedades, existe una información mínima necesaria, que es: •
Si el punto de ebullición , PB < 370 ºC, se necesita como mínimo el PB.
•
Si PB > 370 ºC, se precisa el PB y la densidad del líquido.
•
Si el PB es desconocido se necesita como mínimo el peso molecular y la densidad
En cualquier caso, ¡cuanta mayor información se suministre mejor¡, siendo recomendable: •
Estructura molecular
•
Peso molecular
•
Punto de ebullición
Para comprender mejor la importancia decisiva del modelo de propiedades en cualquier simulación, a continuación se presentan algunos ejemplos clarificadores. En las figuras siguientes se muestran los diagramas ternarios para el sistema bencenoheptano-dimetilformamida, estimados empleando el modelo termodinámico de Margules y NRTL. Como se puede observar existen claras discrepancias entre ambos, así por ejemplo el máximo de la curva binodal se encuentra para la estimación de Margules alrededor de 0.5 % de benceno, mientras que la estimación NRTL lo sitúa alrededor del 0.36. A la vista de estos dos diagramas, necesarios por ejemplo para el diseño de una separación por extracción L-L, ¿cuál es la estimación correcta?.
80
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Otro ejemplo es el sistema de refrigeración siguiente:
En la tabla mostrada los valores en azul corresponden a valores fijados por el usuario, por tanto corresponden a las especificaciones del problema. Los valores en negro que se mostrarán en las siguientes tablas corresponden a valores calculados por el programa, en este caso HYSYS. Los resultados obtenidos con dos modelos termodinámicos: Peng-Robinson (PR), y NRTL presentan grandes diferencias. Así para la corriente “Alimento” se pueden observar las diferencias existentes en cuanto a la fracción de vapor, según las cuáles para el modelo PR se trata de una corriente en forma de vapor, mientras que para NRTL es una mezcla L-V.
TERMODINAMICA
PR
NRTL
81
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Para la corriente “Producto”, los resultados muestran también serias discrepancias en la fracción de vapor y en menor medida en la temperatura de la misma.
TERMODINAMICA
PR
NRTL
Lo mismo ocurre en las corrientes “Ref ent E-102” pero en este caso con grandes diferencias en las temperaturas.
TERMODINAMICA
PR
NRTL
Y en la corriente “Salida E-100”, donde las diferencias se centran en fracción de vapor y flujo molar.
82
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
TERMODINAMICA
PR
NRTL
A partir de estos ejemplos, y otros muchos que se podrían poner, se resume que el uso de la termodinámica, como el de otras muchas cosas, no es tan sencillo.
Para complicar aún más las cosas, a continuación se muestra una simulación para separar por destilación etilbenceno y estireno, usando tres simuladores distintos, pero empleando todos ellos el mismo modelo termodinámico (ecuación de estado de Soave-Redlich-Kwong). Como se puede observar existen serias discrepancias entre los resultados proporcionados por los tres simuladores. Modelo: SRK-EOS en los tres simuladores
Etilbenceno: 51,0 kmol/h Estireno: 47,8 kmol/h
Producto de colas (kmol/h) Simul1 Simul2 Simul3 Ref.: Sadeq et al. AIChE Annual Meeting, 1995
Etilbenceno Estireno
2,90
8,55
5,63
26,76 21,10 24,03
83
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Por otra parte, entre el 50 y el 80 % de los costes de los procesos químicos corresponden a los procesos de separación los procesos de separación, lo cual es un gran incentivo para estudiar el equilibrio entre fases, ya que los procesos de separación se encuentran controlados por el equilibrio entre fases, ver figura siguiente. Entre todos los procesos de separación la destilación es la tecnología dominante, representando el 95 % de todas las separaciones del mundo. De todo esto se deduce la gran atención que se ha prestado al equilibrio liquido-vapor (LV). Procesos de separación controlados por el equilibrio Por adición de energía o de otra sustancia, una mezcla homogénea se separa en (al menos) dos fases de diferente composición.
Destilado
Coste de los procesos químicos de producción Están fuertemente influenciados por los procesos de separación (50-80%). Esto es un gran incentivo para conocer el equilibrio entre fases del proceso.
F
Corriente lateral Producto de colas
Destilación Es la tecnología dominante, el 95% de todas las separaciones en el mundo (más de 40000 columnas en USA, con una inversión de 8000 M$ y una energía equivalente a 54 Mton/año de crudo, es decir el 15% del consumo industrial de energía en USA).
La constante de equilibrio LV se puede determinar, partir de dos formas genéricas:
Forma simétrica
φ K i = iL φiV
Forma asimétrica
γ iL f iLo γ iLν iLo = Ki = φiV P φiV
S ien d o , f la fu gacid ad d e la esp ecie en la m ez cla, f o la fu g acid ad d e la esp e cie p u ra, φ el coeficien te d e fu g acid ad e n la m ez cla, γ el co eficien te d e activ id ad en la m ezcla, y ν o el coeficien te d e fu g acid ad d e la esp ecie p u ra. L o s su b ín d ices i, V y L , in dican , resp ectiv am en te, co m p o n en te, fase v ap o r y fase líq uid a.
Estas dos formas implican el cálculo de los coeficientes de fugacidad del componente puro como de la mezcla, y/o coeficiente de actividad, lo que se puede hacer a través de una ecuación de estado, un modelo de actividad, modelos empíricos, o métodos de presiones de vapor. Los métodos más utilizados en la práctica son a partir de las ecuaciones o los modelos de actividad. En la siguiente tabla se comparan estos métodos.
84
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Ecuación de Estado (EOS)
Modelos de actividad
•
Capacidad limitada para representar líquidos no ideales
•
Pueden representar líquidos altamente no ideales
•
Se necesitan pocos parámetros
•
Se necesitan muchos parámetros binarios
•
Parámetros se extrapolan razonablemente bien con la temperatura
•
Parámetros son altamente dependientes de la temperatura
•
Consistente en la región crítica
•
Inconsistente en la región crítica
La otra posible comparación es entre comportamiento ideal y no-ideal, que se muestra a continuación:
¿Qué significa comportamiento ideal?
¿Qué sistemas se comportan idealmente?
Componentes no polares de tamaño y forma similar
¿Qué controla el grado de no idealidad?
Ley gases ideales y ley de Raoult
Interacción molecular (p.e. Polaridad, forma y tamaño de las moléculas)
¿Cómo se estudia el grado de no idealidad de un sistema?
Representación de propiedades (p.e. Diagramas TXY y XY)
Toda la información relativa al cálculo de las propiedades físicas y del flash se encuentran en HYSYS en lo que se denomina “Fluid Package”, e incluye: •
Los modelos de propiedades (Property Package) que proporcionan predicciones seguras de las propiedades físicas, termodinámicas y de transporte.
•
Componentes
•
Parámetros
•
Coeficientes binarios
•
Reacciones químicas
Además toda la información se organiza en entornos donde se permite acceder e introducir información en un área determinada, mientras las otras áreas están en espera. Existen dos tipos de entornos, que se indican a continuación:
85
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Entorno base
Entorno base de simulación. Permite crear, definir, y modificar los Fluid Package. La información mínima:
Al menos 1 Fluid Package
Al menos 1 componente
Un Fluid Package especificado como Fluid Package por defecto
Entorno de caracterización de aceites
Entorno de simulación
Entorno diagrama de flujo principal
Entorno de sub-diagrama de flujo de columna -
En esta sección vamos a presentar en primer lugar información más detallada sobre la implementación en HYSYS de cada uno de los modelos de propiedades físicas. Posteriormente, proporcionaremos la selección de los métodos de cálculo de propiedades, donde indicaremos para varios procesos típicos en la industria química los métodos recomendados para la estimación de las propiedades termodinámicas.
2. MÉTODOS DE PROPIEDADES IMPLEMENTADOS EN HYSYS 2.1. Ecuaciones de estado
HYSYS ofrece actualmente la ecuación de estado mejorada de Peng-Robinson (PR), y la de Soave-Redlich-Kwong (SRK). Además, ofrece varios métodos que son modificaciones de éstas, tales como Zudkevitch-Joffe (ZJ) y Kabadi-Danner (KD). Lee-Kesler-Plocker (LKP) es una adaptación de la ecuación para mezclas de Lee-Kesler, que a su vez es una modificación de la ecuación Benedit-Webb-Rubin (BWR). De éstas, la de Peng-Robinson es la que presenta un intervalo mayor de aplicación y una mayor variedad de sistemas a los que es aplicable. Las ecuaciones de estado de Peng-Robinson y Soave-Redlich-Kwong proporcionan directamente todas las propiedades termodinámicas y de equilibrio requeridas. Aunque las formas de estas ecuaciones son comunes a otros simuladores comerciales, han sido mejoradas significativamente por Hyprotech para extender su intervalo de aplicabilidad. PR y SRK
Los métodos PR y SRK contienen parámetros de interacción binaria mejorados para todos los pares hidrocarburo-hidrocarburo, así como para la mayoría de sistemas binarios hidrocarburono hidrocarburo. Para los componentes no presentes en la base de datos de HYSYS o para pseudocomponentes de la clase hidrocarburo, los parámetros de interacción HC-CH se generan automáticamente para mejorar las predicciones del equilibrio L-V.
86
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
La ecuación PR aplica un tratamiento especial en los parámetros de interacción de ciertos componentes como He, N2, H2, CO2, H2S, H2O,CH3OH, EG y TEG.
Kabadi-Danner (KD)
Este modelo es una modificación de la ecuación original SRK, modificada para mejorar el equilibrio L-V de los sistemas H2O-hidrocarburo, particularmente en la región diluida. La modificación está basada en una regla de mezcla asimétrica, donde la interacción en la fase acuosa (con fuerte presencia de puentes de hidrógeno) se calcula basada tanto en la interacción entre los hidrocarburos y el agua, como en la perturbación provocada por el hidrocarburo en la interacción H2O-H2O. Lee-Kesler-Plöcker (LKP)
Esta ecuación es un método general exacto para las sustancias no polares y para las mezclas. Plöcker aplicó la ecuación de Lee-Kesler a las mezclas, desarrollando reglas de mezclas para las propiedades pseudocríticas. Peng-Robinson Stryjek-Vera (PRSV)
Es una doble modificación de la ecuación de estado PR, que extiende su aplicabilidad a sistemas moderadamente no ideales. Se ha demostrado que reproduce las curvas de presión de vapor de componentes puros y mezclas de forma más exacta que el método de PR, especialmente a bajas presiones de vapor. Se ha extendido satisfactoriamente para manejar sistemas no ideales, dando resultados tan buenos como los obtenidos usando funciones de energía de Gibbs en exceso, tales como Wilson, NRTL o UNIQUAC. Una de las modificaciones de la ecuación de PR introducidas por Stryjek-Vera es la expansión del término α que se transforma en una función del factor acéntrico y de un parámetro empírico κ usado para ajustar las presiones de vapor de los componentes puros. Para los pseudocomponentes generados para representar las fracciones de petróleo, HYSYS regresiona automáticamente este término para cada pseudocomponente frente a las curvas de presión de vapor de Lee-Kesler. La segunda modificación consiste en un nuevo conjunto de reglas de mezcla. De las dos reglas de mezcla propuestas en el artículo original, HYSYS solamente ha incorporado la expresión de Margules para el término cruzado. Aunque solamente se han ajustado en HYSYS un número limitado de pares binarios, la experiencia aunque limitada sugiere que PRSV se puede emplear como modelo para sistemas moderadamente no ideales, tales como los sistemas agua-alcohol, y algunos sistemas hidrocarburo-alcohol. También se puede emplear para sistemas de hidrocarburos con buena exactitud.
87
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
Opciones de aguas ácidas
La opción de aguas ácidas está disponible para las ecuaciones de estado PR y SRK. La opción Sour PR combina la ecuación de estado PR con el modelo API Sour de Wilson para el manejo de sistemas de aguas ácidas, mientras que el Sour SRK utiliza la ecuación SRK con el modelo de Wilson. Las opciones Sour emplean la ecuación de estado correspondiente para calcular las fugacidades de las fases liquida y vapor de hidrocarburos, así como la entalpía para las tres fases. Los valores de la constante de equilibrio para la fase acuosa se calcula con el método API Sour de Wilson que toma en consideración la ionización en la fase acuosa del H2S, CO2 y NH3. El modelo original es aplicable para temperaturas entre 20 ºC y 140 ºC, y hasta presiones de 50 psi. El empleo de las ecuaciones de estado PR o SRK para corregir la no idealidad de la fase vapor extiende su intervalo de aplicación, pero debido a la falta de datos experimentales, no se puede fijar un intervalo exacto. El intervalo de presión aceptable para el modelo empleado en HYSYS depende de la concentración de gases ácidos y agua, pero funciona bien para presiones parciales de agua menores de 100 psi. Esta opción se puede emplear en desorbedores de aguas ácidas, procesos de hidrotratamiento, columnas de crudo, o cualquier proceso que contenga hidrocarburos, gases ácidos y agua. Cálculo de la entalpía con modelos de ecuaciones de estado
Con cualquiera de los modelos de ecuaciones de estado, excepto LKP se puede especificar si la entalpía se calcula mediante la ecuación de estado correspondiente o bien se hace a través del método de Lee-Kesler. La opción de cálculo de entalpía mediante la ecuación de Lee-Kesler, resulta en um modelo combinado en el que los valores del equilibrio L-V se hacen mediante la ecuación de estado correspondiente, mientras que los cálculos de entalpías y entropías se hacen mediante la ecuación de Lee-Kesler. Las entalpías calculadas mediante la ecuación de Lee-Kesler pueden ser ligeramente más exactas para los hidrocarburos pesados, pero requieren más recursos computacionales debido a que se tiene que emplear un método separado.
2.2. Modelos de actividad
Aunque las ecuaciones de estado han demostrado ser muy fiables en la predicción de las propiedades de los sistemas constituidos por hidrocarburos en un amplio intervalo de condiciones de operación, su aplicación ha quedado limitada a los componentes no polares o ligeramente polares. Los sistemas químicos polares o no ideales tradicionalmente se han tratado con modelos duales. En estos modelos se emplea una ecuación de estado para predecir los coeficientes de fugacidad de la fase vapor, y un modelo de coeficientes de actividad para la fase líquida. Aunque se ha hecho un esfuerzo considerable para extender las ecuaciones de estado a este tipo de sistemas (por ejemplo, PRSV), la predicción de las propiedades en sistemas químicos está dominada principalmente por los modelos de actividad. Los modelos de actividad son de naturaleza mucho más empírica que los modelos de ecuaciones de estado. Por ejemplo, no se pueden usar de una forma tan fiable como las 88
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
ecuaciones de estado para aplicaciones generalizadas o para extrapolar fuera de las condiciones ensayadas. En la siguiente Tabla se resume los modelos recomendados para diferentes aplicaciones.
La no idealidad de la fase vapor se puede tener en cuenta para cada modelo de actividad seleccionando las ecuaciones de estado de Redlich-Kwong, PR, o SRK como modelo para la fase vapor. Cuando se usa alguna de estas ecuaciones de estado para la fase vapor, siempre se corrige la fase líquida con el factor de Poynting. Si se produce dimerización en la fase vapor, se debería emplear la ecuación de Virial como ecuación de estado. Hay que tener en cuenta, que todos los parámetros binarios de interacción en la base de datos de HYSYS están obtenidos usando el modelo de gas ideal para la fase vapor, por lo que debería emplearse este modelo. Observaciones generales
Estos modelos duales no se pueden emplear con el mismo grado de flexibilidad y fiabilidad con que las ecuaciones de estado se pueden emplear en sistemas de hidrocarburos. Para asegurar un buen nivel de fiabilidad, se debe tener en cuenta algunas observaciones: •
Comprobar que el modelo seleccionado es aplicable al sistema considerado, y comprobar que tal ajusta las presiones de vapor de los componentes puros. Aunque las presiones de vapor de los componentes puros normalmente ajustan de manera aceptable, los parámetros se han ajustado en un intervalo amplio de temperaturas. Se puede mejorar la exactitud ajustando los parámetros en el intervalo de temperatura deseado.
•
La generación automática de parámetros de interacción mediante UNIFAC es una herramienta muy útil y disponible para todos los modelos de actividad. Sin embargo, se debe usar con precaución. Los valores estándar ajustados en HYSYS producen resultados mucho mejores en los sistemas binarios que los parámetros generados por UNIFAC.
•
Siempre que sea posible se deben usar parámetros de interacción obtenidos por regresión de datos experimentales. Los parámetros de interacción en HYSYS se han obtenido 89
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
ajustando datos experimentales, sin embargo, es posible mejorar los resultados ajustando los parámetros con datos experimentales en el intervalo de operación esperado. Dado que los datos de parámetros de interacción presentes en HYSYS se han obtenido a partir de datos a presión atmosférica, se debe tener precaución al extrapolar a presiones más altas o bajas. •
Hay que comprobar la exactitud de las predicciones (tanto en cuanto a temperatura como composición) en el caso de sistemas con azeótropos.
•
Si se sospecha la presencia de tres fases, se podrían requerir ajustes adicionales para reproducir de forma fiable las condiciones de equilibrio LLV.
2.2.1. Modelos de actividad disponibles en HYSYS Margules
Las ecuación de Margules fue la primera representación desarrollada para la energía en exceso de Gibbs, y no tiene ninguna base teórica, aunque es útil para estimaciones rápidas y para interpolación de datos. HYSYS dispone de la ecuación de Margules extendida a sistemas multicomponentes con hasta 4 parámetros ajustables por par binario (dos independientes de la temperatura, y otros dependientes). Van Laar
La ecuación de Van Laar fue la primera representación de la energía en exceso de Gibbs con significado físico. La ecuación implementada en HYSYS es una versión modificada por Null, que es bastante útil en muchos sistemas, particularmente para el equilibrio de distribución LL. Se puede usar para sistemas con desviaciones positivas y negativas de la ley de Raoult, sin embargo, no permite predecir máximos o mínimos en el coeficiente de actividad. Por tanto, no va bien en sistemas con hidrocarburos halogenados y alcoholes. Tiene tendencia predecir dos fases líquidas, cuando en realidad no existen. Wilson
La experiencia demuestra que la ecuación de Wilson se puede emplear para extrapolar con razonable fiabilidad a otras condiciones de operación empleando los mismos parámetros de interacción. También representa satisfactoriamente casi todos las disoluciones liquidas no ideales, excepto electrolitos y disoluciones con miscibilidad limitada. Por tanto, no se puede emplear en problemas que involucren equilibrio L-L. Predice bastante bien los equilibrios ternarios usando parámetros ajustados a partir de datos binarios. La ecuación implementada en HYSYS contiene de 2 a 4 parámetros por par binario. Hay que tener en cuenta que aún poniendo los 4 parámetros a cero no se reduce el par binario a una disolución ideal, ya que mantiene un pequeño efecto debido a la diferencias de tamaño de las moléculas.
90
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
NRTL
Esta ecuación es una extensión de la ecuación de Wilson, que es capaz de representar los equilibrios L-V, L-L y L-L-V. Como la ecuación de Wilson es termodinámicamente consistente y se puede aplicar a sistemas ternarios o de orden superior usando parámetros ajustados a partir de datos de equilibrio binarios. Contiene 5 parámetros por cada par binario (independientes y dependientes de la temperatura). Debido a su estructura matemática puede producir intervalos falsos de miscibilidad. Extended and General NRTL
Son variaciones del modelo NRTL, que emplean más parámetros binarios de interacción. Se aplican a sistemas: •
Con un amplio intervalo de puntos de ebullición entre sus componentes.
•
Cuando se necesite la solución simultánea de los equilibrios L-V y L-L, y exista entre los componentes un amplio intervalo de puntos de ebullición o de concentración.
UNIQUAC
Es capaz de representar los equilibrios L-V, L-L y L-L-V con exactitud comparable a la ecuación NRTL, pero sin necesidad del parámetro de aleatoriedad. Su principal ventaja es que se puede obtener una buena representación de los equilibrios L-V y L-L para una amplia variedad de mezclas de no electrolitos usando sólo dos parámetros por par binario. Parámetros que presentan muy poca dependencia con la temperatura, lo que la hace más válida para extrapolaciones. Chien-Null
En realidad no se trata de un nuevo modelo, sino de un marco para aplicar los modelos de actividad existentes de un forma binario por binario. De esta forma, el modelo de Chien-Null permite seleccionar para cada par binario el modelo de actividad que mejor se ajuste, independientemente de los empleados en el resto de pares binarios. Una precaución a tener con los modelos de Wilson, NRTL y UNIQUAC son las dimensiones de los parámetros de interacción (cal/mol-g para el independiente de la temperatura, y cal/mol-g K para el dependiente de la temperatura) ya que en la bibliografía pueden tener dimensiones diferentes al tener integrada la constante universal de los gases R (por ejemplo, DECHEMA, Chemistry Data Series). Ley de Henry
La ley de Henry no se puede seleccionar explícitamente como un método, aunque HYSYS la emplea cuando se selecciona un modelo de actividad y entre los componentes se encuentra un componente no condensable. HYSYS considera no condensables los siguientes componentes: metano, etano, etileno, acetileno, hidrógeno, helio, argón, nitrógeno, oxígeno, óxido nítrico, sulfuro de hidrógeno, dióxido de carbono, y monóxido de carbono. 91
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
La ecuación extendida de Henry en HYSYS se usa para modelizar las interacciones soluto/disolvente en la región diluida. La ecuación tiene la siguiente forma: ln H ij = A +
B + C ln T + D T T
donde: i = soluto o componente no condensable j = disolvente o componente condensable Hij = coeficiente de Henry entre i y j en kPa T = temperatura absoluta A = coeficiente introducido en la matriz de parámetros como aij B = coeficiente introducido en la matriz de parámetros como aji C = coeficiente introducido en la matriz de parámetros como bij D = coeficiente introducido en la matriz de parámetros como bji Un ejemplo del uso de los coeficientes de la ley de Henry se muestra a continuación:
Si HYSYS no contiene los coeficientes necesarios y no están disponibles, los estimará. Para ello marcamos el par binario presionado el ratón sobre él, y a continuación se presiona sobre el botón “Individual Pair”. Los parámetros de obtienen ajustando las fugacidades calculadas usando las correlaciones de Chao-Seader y Prausnitz-Shair para la fugacidad en el estado estándar y disolución regular.
2.3. Métodos semiempíricos
Los métodos de Chao-Seader (CS) y Grayson-Streed (GS) son métodos empíricos antiguos. La correlación GS es una extensión del método CS con énfasis especial en el hidrógeno. HYSYS solo obtienen los datos de equilibrio a partir de estos métodos, mientras que las entalpías y entropías se obtienen, tanto para la fase vapor como la fase líquida mediante el método de Lee-Kesler. 92
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
La correlación GS se recomienda para simular sistemas de hidrocarburos pesados con alto contenido en hidrógeno, tales como unidades de hidrotratamiento. La siguiente tabla muestra los intervalos aproximados de aplicabilidad: Método
Temperatura (ºC)
Presión (kPa)
CS
18 a 260
< 10 000
GS
18 a 425
< 20 000
Condiciones de aplicabilidad: Para todos los hidrocarburos excepto CH4
0.5 < Tri < 1.3 Prmezcla < 0.8
Si están presentes CH4 o H2
Tr < 0.93 Fracción molar CH4 < 0.3 Fracción molar de gases disueltos < 0.2
Cuando se predicen valores de K para: Mezclas de parafinas u olefinas Mezclas de aromáticos
Fracción molar de aromáticos en la fase líquida < 0.5 Fracción molar de aromáticos en la fase líquida > 0.5
2.4. Métodos de presión de vapor
Se pueden emplear para mezclas ideales a bajas presiones, tales como sistemas de hidrocarburos, cetonas o alcoholes donde las mezclas se comporten aproximadamente como ideales. Para el cálculo de entalpías y entropías se emplea el método de Lee-Kesler, excepto para el caso del agua que se trata separadamente mediante las tablas de vapor. En todos los cálculos en las tres fases se supone que la fase acuosa es agua pura, y que la solubilidad del agua en la fase hidrocarburo se puede describir usando la ecuación de solubilidad del queroseno del API Data Book. Los métodos disponibles son: Modificado de Antoine, Braun K10, y EssoK.
3. SELECCIÓN DE MÉTODOS DE PROPIEDADES En la siguiente tabla se muestran algunos sistemas típicos y las correlaciones recomendadas. Para aceites, gases, y aplicaciones petroquímicas se recomienda la ecuación de estado de Peng-Robinson (PR), ya que Hyprotech ha mejorado esta ecuación para ser exacta para una amplia variedad de sistemas y en un amplio intervalo de condiciones. Resuelve rigurosamente 93
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
sistemas de una, dos o tres fases con un alto grado de eficacia y fiabilidad, y es aplicable en un amplio intervalo de condiciones de presión (< 100 MPa) y temperatura (> -456 ºC). La misma ecuación predice satisfactoriamente la distribución de componentes tales como aceites pesados, disoluciones acuosas de glicoles y etanol, así como sistemas con gases ácidos o aguas ácidas, aunque existen modelos específicos para las aguas ácidas (Sour PR y Sour SRK). Aunque la ecuación de Soave-Redlich-Kwong (SRK) proporciona resultados comparables en muchos casos a la ecuación PR, se ha constatado que su intervalo de aplicación es significativamente más limitado, y nos es tan fiable para sistemas no ideales. Por ejemplo, (temperaturas > -225 ºC, y presiones < 35 MPa) y no se debe emplear para sistemas con etanol y glicoles.
Como una alternativa, la ecuación de estado de Peng-Robinson-Stryjek-Vera (PRSV) puede manejar los mismos sistemas que la ecuación PR con exactitud equivalente o mejor, y además es más adecuada para el tratamiento de sistemas moderadamente no ideales, donde rivaliza en exactitud con los métodos tradicionales de coeficientes de actividad. Las únicas desventajas son el aumento del tiempo de cálculo, y la necesidad de parámetros adicionales de interacción. Las ecuaciones de estado PR y PRSV realizan cálculos rigurosos de flash en tres fases para sistemas acuosos que contienen etanol, o glicoles, así como sistemas que contengan en la segunda fase otros hidrocarburos o no hidrocarburos. Para SRK el único componente que inicia una fase acuosa es el agua. Los modelos de Chao-Seader (CS) y Grayson-Streed (GS) 94
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
también se pueden emplear en cálculos de flash en tres fases pero están restringidos a usar agua pura en la segunda fase líquida. La ecuación PR también se puede emplear para sistema con crudo petrolífero, que tradicionalmente han sido tratados con modelos termodinámicos duales (coeficiente de actividad para la fase líquida, y ecuación de estado o comportamiento de gas ideal para la fase vapor). Las mejoras introducidas en las ecuaciones PR y SRK permite a estos métodos representar correctamente las condiciones de vacío y los componentes pesados (principal problema de los métodos de ecuaciones de estado tradicionales), así como manejar los ligeros y sistemas de alta presión. Los modelos de actividad, que manejan sistemas altamente no ideales, son de naturaleza mucho más empírica. Los sistemas polares o no ideales se han tratado tradicionalmente con modelos duales, en los que una ecuación de estado se usa para predecir los coeficientes de fugacidad en la fase vapor, y el modelo de coeficientes de actividad se usa en la fase líquida. Dado que los parámetros del modelo de coeficientes de actividad se determinan a partir de datos experimentales en un intervalo determinado, estos métodos no se pueden usar de una manera fiable para una aplicación generalizada. Aunque el campo de aplicación de los métodos CS y GS es restringido, es recomendable su utilización en algunos problemas que contengan principalmente agua en fase líquida o vapor, debido a que incluyen correlaciones especiales para representar de forma fidedigna las tablas de vapor. La correlación de Chao-Seader (CS) se puede emplear para mezclas de hidrocarburos ligeros, mientras que la de Grayson-Streed (GS) se recomienda para sistemas con alta concentración de hidrógeno, debido al tratamiento especial dado al hidrógeno en el desarrollo de este modelo. Esta correlación puede ser ligeramente más exacta en la simulación de torres de vacío. Los modelos K de presión de vapor, Antoine, Braun K10 y EssoK se han diseñado para manejar los sistemas de los hidrocarburos más pesados a bajas presiones. Estas ecuaciones se han aplicado tradicionalmente al fraccionamiento de los hidrocarburos más pesados, por lo que proporcionan un buen medio para la comparación con los métodos más rigurosos. Sin embargo, no se deben emplear para la predicción del equilibrio L-V en sistemas que operen a altas presiones o que contengan cantidades significativas de hidrocarburos ligeros. En la Tabla siguiente se presentan los métodos de propiedades empleados en HYSYS junto con los métodos disponibles para el cálculo del equilibrio L-V, y de entalpía/entropía.
95
Implementación de modelos de propiedades físicas en simuladores comerciales y criterios de selección
96
I.
Termodinámica y modelización rigurosa de procesos
Modelos rigurosos de separaciones de equilibrio Fernando V. Díez Sanz Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Modelos rigurosos de separaciones de equilibrio
ÍNDICE 1. INTRODUCCIÓN ............................................................................................................99 2. CÁLCULOS FLASH........................................................................................................99 2.1. Estrategias para cálculos flash..................................................................................101 2.2. Secuencia TP para cálculos flash..............................................................................102 2.3. Método inside-out para cálculos flash......................................................................102 3. PROCESOS POR ETAPAS ...........................................................................................103 4. BIBLIOGRAFÍA ............................................................................................................106
1. INTRODUCCIÓN En este tema se estudiarán los modelos rigurosos de etapas de equilibrio, adecuados para su implementación en programas de ordenados dedicados a la simulación y diseño de procesos. Los modelos que se estudiarán están basados exclusivamente en las relaciones de equilibrio entre fases y en los balances de materia y energía. Esta aproximación simplifica mucho los cálculos, ya que sólo es necesario tener en cuenta las propiedades termodinámicas, sin que sea necesario considerar las propiedades de transporte. Además, los balances de materia y energía se pueden realizar sin conocer la capacidad y geometría de los equipos. Por otra parte, los modelos que se estudiarán están limitados a estado estacionario, sin que se consideren operaciones discontinuas, ni comportamiento dinámico de operaciones estacionarias. Se estudiarán dos tipos de cálculos: cálculos flash, y cálculos para procesos por etapas en contracorriente. Aunque estos cálculos se desarrollarán referidos a operaciones de destilación, pueden aplicarse también a otras operaciones unitarias muy frecuentes en la industria química, como absorción y extracción con disolventes.
2. CÁLCULOS FLASH Estos cálculos son al mismo tiempo los cálculos más básicos y los que se realizan más frecuentemente en los programas de simulación. La destilación flash, evaporación rápida o destilación en equilibrio, es una operación en una etapa, en la que una mezcla líquida se evapora parcialmente, de modo que resultan una fase líquida y una fase vapor en equilibrio, que se separan y extraen del equipo. De forma más general, un cálculo flash consiste en determinar el estado de un sistema después de una transformación física o química, por ejemplo la adición o retirada de calor, o cambios en la presión o composición del sistema. Consideremos el sistema representado en la Fig. 1. Asumiremos que la alimentación está completamente definida, de modo que se conoce su caudal, composición y entalpía. Si la alimentación contiene NC componentes, podremos escribir las siguientes ecuaciones: 99
Modelos rigurosos de separaciones de equilibrio
Fig. 1. Esquema de una unidad flash (Biegler y cols., 1977) Balances de materia: fi = vi + Li
i = 1,……., NC
[1]
Donde fi, vi y Li son los caudales molares del componente i en la alimentación, corriente vapor y corriente líquida, respectivamente. Relaciones de equilibrio: γi fi0 xi = Φi P yi
i = 1,……., NC
[2]
Donde xi e yi son las fracciones molares en el líquido y vapor, respectivamente, fi0 es la fugacidad del componente puro, γi es el coeficiente de actividad, Φi el coeficiente de fugacidad, todas estas variables referidas al componente i, y P la presión total del sistema. Balance de entalpía: F Hf + Q = V Hv + L HL
[3]
Donde F, V y L son los flujos molares de alimentación, vapor y líquido, respectivamente, Hf, Hv y HL las respectivas entalpías molares, y Q el calor añadido o retirado del sistema.
100
Modelos rigurosos de separaciones de equilibrio
Disponemos, entonces, de un total de (2*NC + 1) ecuaciones. Las variables del sistema son las composiciones del líquido y del vapor, la P y T de las corrientes de salida y Q, en total (2 * NC + 3). Hay, por tanto, dos grados de libertad para especificar en este problema. Este modelo puede modificarse, de modo que sea más fácil de utilizar para los cálculos: Balances de materia: z i F = V y i + L xi
i = 1,……., NC
[4]
Donde zi, yi y xi son las fracciones molares del componente i en la alimentación, vapor y líquido, respectivamente. Balance de entalpía: F Hf + Q = V Hv + L HL
[5]
Expresiones de equilibrio: yi = Ki xi
i = 1,……., NC
[6]
Donde Ki = γi fi0 / Φi P
i = 1,……., NC
[7]
De esta forma tenemos (3* NC + 5) variables (P, T, L, V, Q, y las fracciones molares en líquido y vapor, y Ki para cada componente), y (3 * NC + 1) ecuaciones. Las dos ecuaciones adicionales más útiles para describir el sistema son: F = L + V (balance total de materia)
[8]
Σ yi – Σ xi = 0
[9]
2.1. Estrategias para cálculos flash El modelo flash puede considerarse entonces formado por las ecuaciones 4 a 9, conservando el sistema 2 grados de libertad. Ciertamente, pueden darse muchas posibilidades respecto de las variables fijadas y las que se obtienen resolviendo el sistema. Para hacer frente a la gran variedad de problemas que pueden plantearse, se han desarrollado muchos sistemas de cálculo. De estas alternativas posibles, es muy común que los grados de libertad se escojan entre las variables V/F, Q, P y T. 101
Modelos rigurosos de separaciones de equilibrio
2.2. Secuencia TP para cálculos flash El caso más sencillo se presenta cuando los grados de libertad escogidos son P y T, ya que no requiere iteración para el balance de energía. La secuencia de cálculo sería la siguiente: 1. Fijados zi, especificar T y P. 2. Suponer un valor de V/F 3. Calcular los valores de Ki 4. Calcular xi e yi 5. Calcular (Σ yi – Σ xi); si es igual a 0, o a un valor dentro de la tolerancia aceptada, el problema está resuelto. En otro caso, continuar. 6. Proponer otro valor de V/F y continuar en 3. Si dada la naturaleza del sistema las relaciones de equilibrio dependen de la concentración de las fases, es necesaria una estimación previa de xi e yi en el punto 1, que ha de ser comprobada después. Las especificaciones T y P son comunes para mezclas en la que todos los componentes tienen puntos de ebullición próximos, como las que se encuentran en destilación, para las que V/F varía entre 0 y 1 en un intervalo estrecho de temperatura. Cuando los componentes de la mezcla tienen puntos de ebullición muy distintos, como en los sistemas de absorción, pequeños cambios en V/F pueden provocar grandes cambios en T, y se suelen utilizar la especificaciones V/F, T o V/F, P. Cuando se especifica el calor intercambiado Q, es necesario resolver el balance de energía en el algoritmo de solución. Esto se puede hacer, por ejemplo, suponiendo una temperatura y resolviendo para esta temperatura el problema T, P. Una vez resuelto este problema, se resuelve el balance de energía y se comprueba si la temperatura supuesta es correcta, reiterando el proceso las veces necesarias.
2.3. Método inside-out para cálculos flash Los métodos indicados anteriormente presentan dos inconvenientes principales. En primer lugar, son adecuados bien para mezclas con intervalos de ebullición pequeños, o bien para mezclas con intervalos de puntos de ebullición amplios, pero no tienen aplicabilidad general. Por otra parte, necesitan evaluar frecuentemente funciones termodinámicas no ideales, especialmente cuando es necesario incorporar el balance de energía. Para hacer frente a estos problemas, Boston y Britt desarrollaron el método “inside-out” o dentro-fuera. En este método se utilizan dos bucles de cálculo. En el bucle externo se utilizan ecuaciones aproximadas para calcular valores de las constantes de equilibrio y las entalpías. Estos valores se utilizan para resolver las ecuaciones del proceso flash en un bucle interno. La solución del bucle interno se utiliza para revisar los valores de las propiedades termodinámicas del bucle externo, terminando el proceso cuando las propiedades termodinámicas aproximadas coinciden con el grado de exactitud requerido con las obtenidas por los métodos rigurosos. 102
Modelos rigurosos de separaciones de equilibrio
Por ejemplo, para resolver un problema con especificaciones P, Q, se pueden utilizar las siguientes ecuaciones para las propiedades termodinámicas: Ki = αi Kb
[10]
Ln (Kb) = A + B (1/T – 1/T*)
[11]
H’v = C + D (T - T*)
[12]
H’L = E + F (T - T*)
[13]
donde H’v y H’L son las entalpías en base másica referidas a las temperatura T*, Kb es un valor medio para la mezcla, y αi es la volatilidad relativa. Los valores de A, B, C, D, E, F y αi se ajustan con los resultados obtenidos suponiendo sistemas no ideales. Para la iteración en el bucle interno se puede utilizar la variable: R = Kb / (Kb + L/V)
[14]
que es adecuada tanto para sistemas con puntos de ebullición próximos como dispares. La secuencia de cálculo sería la siguiente: 1. Iniciar valores de A, B, C, D, E, F y αi 2. Suponer R 3. Resolver el sistema de los bances de materia y suma 4. Resolver el balance de entalpía 5. Si el error en el balance de entalpía es mayor que el admitido, volver a 2. En caso contrario, ir a 6. 6. Con los resultados obtenidos, recalcular los valores de A, B, C, D, E, F y αi que ajusten a las propiedades termodinámicas del sistema, y volver a 2, hasta que el sistema converja.
3. PROCESOS POR ETAPAS Una columna de destilación, ejemplo típico de un proceso de separación de etapas de equilibrio, se puede modelizar como una cascada de etapas de equilibrio flash interconectadas. Los modelos se basan en la consideración de que se alcanza el equilibrio en 103
Modelos rigurosos de separaciones de equilibrio
cada plato, y en los balances de materia y energía entre platos. La Fig. 2 muestra un esquema de una columna de destilación típica, formada por NT platos, numerados desde la parte superior a la inferior y denotados por el subíndice j. En el sistema hay presentes NC componentes, denotados por el subíndice i. Cada plato contiene unas determinadas cantidades de líquido y vapor, en equilibrio, con composiciones xij e yij, respectivamente. De cada plato sale una corriente de vapor Vj hacia el plato superior, y una corriente líquida Lj hacia el plato inferior. Cada plato puede recibir una alimentación (líquido, vapor, o ambos) Fj, de composición zij, y de él pueden retirarse corrientes de producto líquido PLj o vapor, PVj, así como retirar o añadir una cantidad de energía Qj. Dada la composición, presión y temperatura de cada corriente, se puede determinar su entalpía con los modelos termodinámicos adecuados.
Fig. 2. Esquema de una columna de destilación (Biegler y cols., 1977) Las ecuaciones resultantes del modelo son las siguientes: Balances de materia: Fj zij + Lj-1 xi,j-1 + Vj+1 yi,j+1 –(PLj + Lj) xij – (Vj + PVj) yij = 0 i = 1, …….. NC
104
j = 1, …….. NT
[15]
Modelos rigurosos de separaciones de equilibrio
Relaciones de equilibrio: yij = Kij xij i = 1, …….. NC
[16] j = 1, …….. NT
Ecuaciones de suma: Σi xij = 1
Σi yij = 1
[17]
j = 1, …….. NT Balances de energía: Fj HFj + Lj-1 HL,j-1 + Vj+1 Hv,j+1 – (PLj + Lj) Hij – (Vj + PVj) Hvj + Qj = 0 j = 1, …….. NT
[18]
Este conjunto de ecuaciones se denomina ecuaciones de materia, equilibrio, suma y calor, en inglés Mass, Equilibrium, Summation and Heat (MESH). Para el condensador y el calderín estas ecuaciones se simplifican, al ser menor el número de corrientes que intervienen. El sistema combinado consiste en [(NT + 2)(2 * NC + 3) + 2] ecuaciones, y [(NT + 2)(2 * NC + 5) + 3] variables. Si se especifican el número de platos, y las localizaciones, caudal, composición y entalpía de las alimentaciones, quedan (NT + 1) grados de libertad. Una especificación típica para este problema sería la presión en cada plato, y la relación de reflujo. La resolución del problema requiere la resolución del sistema de ecuaciones MESH, para lo que se han propuesto decenas de sistemas. Uno de los sistemas más utilizados consiste en la aplicación del método de Newton-Raphson al conjunto de las ecuaciones MESH. También se aplican métodos inside-out, similares a los aplicados a separaciones flash, en los que en un primer paso se consideran valores de K y entalpías independientes de las concentraciones, a continuación se resuelven las ecuaciones MESH simplificadas resultantes, se comprueba la exactitud de la predicción de las variables termodinámicas, y se reitera el proceso hasta que se obtiene una solución satisfactoria.
105
Modelos rigurosos de separaciones de equilibrio
4. BIBLIOGRAFÍA
106
•
L. B. Biegler, I. E. Grossmann y A. W. Westerberg, “Systematic Methods of Chemical Process Design”, Prentice Hall, Upper Saddle River (N. J., EE.UU.), 1977.
•
R. H. Perry y D. W. Green, “Manual del Ingeniero Químico”, 7ª Ed., McGraw Hill, Madrid, 2001.
•
W.L McCabe, J.C. Smith, “Operaciones básicas de Ingeniería Química”, Ed. Reverté, Barcelona (1975).
I.
Termodinámica y modelización rigurosa de procesos
Modelos rigurosos de operaciones unitarias Aurelio B. Vega Granda Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Modelos rigurosos de operaciones unitarias
ÍNDICE 1. INTRODUCCIÓN ....................................................................................................109 2. INTERCAMBIADOR DE CALOR (HEAT EXCHANGER) .............................. 110 3. SEPARADOR/SEPARADOR DE 3 FASES/TANQUE ......................................... 111 4. REACTORES QUÍMICOS ..................................................................................... 112 4.1. Reacciones en HYSYS ........................................................................................ 113 4.2. Reactor de conversión ......................................................................................... 115 4.3. CSTR. Reactor continuo de tanque agitado......................................................... 116 4.4. Reactor de equilibrio ........................................................................................... 117 4.5. Reactor de Gibbs ................................................................................................. 118 4.6. Reactor de flujo de pistón (PFR) ......................................................................... 118
1. INTRODUCCIÓN En este capítulo presentaremos un sumario de los modelos rigurosos de operaciones unitarias más complejas disponibles en HYSYS, que permiten resolver los balances de materia y energía sin necesidad de suponer un comportamiento ideal. El desarrollo de los balances de materia y energía es un componente básico en función del cual se tomarán decisiones durante las etapas de evaluación y diseño del proceso. El posible diagrama de flujo se considera como un conjunto muy elevado de ecuaciones no lineales que describen: •
La interconexiones entre las distintas unidades del diagrama de flujo a través de las corrientes de proceso.
•
Las ecuaciones específicas de cada unidad, descritas mediante las leyes de conservación, así como las ecuaciones constitutivas de la unidad.
•
Los datos subyacentes y las expresiones que los relacionan con las propiedades físicas.
En este capítulo nos centraremos en los dos primeros apartados para presentar una representación detallada de las unidades de operación. El principal objetivo de este capítulo es alcanzar un mejor conocimiento del nivel de detalle de los modelos empleados en los simuladores comerciales, en concreto en HYSYS. En el capítulo anterior se han desarrollado los modelos rigurosos de las operaciones de separación de equilibrio, así como su resolución. Ahora trataremos con modelos de unidades menos detalladas, que incluyen operaciones de transferencia y intercambio llevadas cabo por bombas, compresores, cambiadores de calor, así como modelos para reactores químicos.
109
Modelos rigurosos de operaciones unitarias
2. INTERCAMBIADOR DE CALOR (HEAT EXCHANGER) Esta operación realiza un balance de materia y energía a ambos lados de la unidad. Es muy flexible, de manera que puede calcular temperaturas, presiones, flujos de calor flujos de materia o UA. Esta operación permite dividir la curva de calor a ambos lados del intercambiador en intervalos, de manera que en lugar de calcular la transferencia de energía en las condiciones terminales del cambiador, se calcula en cada uno de los intervalos, que posteriormente se suman para obtener la transferencia global. Los cálculos llevados a cabo en esta operación están basados en los balances de energía a los fluidos caliente y frío: (Mfrío (Hout-Hin)frío – Qfugas) – (Mcaliente (Hout-Hin)caliente – Qpérdidas) = Error balance donde:
M = flujo másico de fluido H = entalpía Qfugas = Pérdidas de calor por fugas en el fluido frío Qpérdidas = Pérdidas de calor en el fluido caliente
El error del balance, en la mayoría de las aplicaciones es cero. La corriente de energía del cambiador también se puede definir en términos del coeficiente global de transmisión de calor, el área disponible, y la diferencia media logarítmica: Q = UA ∆Tln Ft
∆Tln =
∆T1 − ∆T2 ln (∆T1 / ∆T2
)
∆Τ1 = Τcaliente,out – Tfrío,in ∆Τ2 = Τcaliente,in – Tfrío,out donde:
U = coeficiente global de transmisión de calor A = superficie disponible para la transmisión de calor ∆Tln = diferencia media logarítmica
110
Modelos rigurosos de operaciones unitarias
Ft = factor de corrección El coeficiente global de transmisión de calor se calcula a partir de la expresión: U=
donde:
1 ⎡1 Do ⎛ 1 ⎞⎤ ⎜⎜ ri + ⎟⎟⎥ ⎢ + ro + rw + Di ⎝ hi ⎠⎦ ⎣ ho
ho, hi = coeficientes individuales de transmisión de calor el fluido en los tubos externo e interno, respectivamente. ro, ri = factor de ensuciamiento en los tubos exterior e interior, respectivamente. rw = resistencia de la pared del tubo. Do, Di = diámetros de los tubos externo e interno, respectivamente.
Para fluidos sin cambio de fase, los coeficientes individuales de transmisión de calor se calculan de acuerdo con la ecuación empírica de Sieder-Tate: k hi = 0.023 m Di donde:
⎛ Di Gi ⎜⎜ ⎝ µi
⎞ ⎟⎟ ⎠
0.8
⎛ C p ,i µ i ⎜⎜ ⎝ km
⎞ ⎟⎟ ⎠
1/ 3
⎛ µi ⎞ ⎜ ⎟ ⎜µ ⎟ ⎝ i ,w ⎠
0.14
Gi = densidad de flujo másico del fluido en los tubos internos = velocidad densidad
×
µi = viscosidad del fluido en los tubos internos µi,w = viscosidad del fluido en los tubos internos, en la pared del tubo Cp,i = calor específico del fluido en los tubos internos km = conductividad térmica del fluido referida a las condiciones medias en la masa global
3. SEPARADOR/SEPARADOR DE 3 FASES/TANQUE •
Separador: dispone múltiples entradas, y una corriente de producto de salida vapor y otra líquida. El separador divide el contenido en la unidad en sus fases líquida y vapor en equilibrio.
•
Separador de 3 fases: dispone de múltiples entradas y tres salidas, una vapor y dos líquidas. La operación divide el contenido de la operación es sus fases constituyentes vapor, líquida ligera y líquida pesada.
•
Tanque: dispone de múltiples entradas y una sola fase líquida de salida. Se utiliza para simular tanques de almacenamiento.
111
Modelos rigurosos de operaciones unitarias
Para determinar las condiciones y fases producto se realiza un flash P-H. La presión es la menor presión de alimentación menos la caída de presión a través del tanque. La entalpía es la entalpía combinada de las alimentaciones más o menos el intercambio de energía (duty): Hfeed ± Duty = Hvapor + Hpesada + Hligera El separador y el separador de 3 fases proporcionan un alto grado de flexibilidad en cuanto a la forma de resolver la operación. Además, de la aplicación estándar (alimentación a separar completamente definida, a la presión y entalpía del tanque), el separador puede también usar una composición conocida de producto para determinar la composición de la otra corriente producto, y por un balance la composición de la alimentación. Para usar el separador para calcular hacia atrás se debe conocer: •
La composición de un producto
•
La temperatura o presión de una corriente producto
•
Dos (para el separador) o 3 (para el separador de 3 fases) flujos
4. REACTORES QUÍMICOS Todos los reactores, excepto el PFR, comparten el mismo formulario, siendo las principales diferencias función del tipo de reacción (conversión, cinética, equilibrio).
Cada tipo específico de reactor solo admite un tipo particular de reacción, por ejemplo un reactor de conversión sólo admite reacciones de conversión (reacciones en las que la conversión está fijada). Existe una gran flexibilidad cuando se definen y agrupan reacciones, se puede: • 112
Definir las reacciones dentro del Administrador Base (Basis Manager), agruparlas en un conjunto y después asociarlo al reactor.
Modelos rigurosos de operaciones unitarias
•
Crear reacciones en el Reaction Package en el diagrama de flujo principal, agruparlas en un conjunto y asociarlas al reactor.
•
Crear reacciones y conjuntos de reacciones en el Entorno Base (Basis Environment) y hacer cambios en Reaction Package del Entorno Principal (Main Environment).
No obstante, hay que tener cuidado con algunas sutilezas. Cuando se hacen cambios en las reacciones en el formulario del propio reactor, esos cambios solamente serán válidos en ese determinado reactor. Modificaciones en las reacciones en el Entorno Base o en Reaction Package se reflejan automáticamente en todos los reactores que usen ese conjunto de reacciones, siempre que no se hubieran hecho cambios locales.
4.1. Reacciones en HYSYS
La siguiente figura muestra las relaciones que existen entre los distintos tipos de reacción en HYSYS y los diferentes reactores.
Reacciones y reactores en HYSYS
Reacciones en HYSYS
Conversión Equilibrio
Reactores en HYSYS
Conversión Gibbs
Equilibrio
CSTR
PFR
Cinéticas
Gibbs van’t Hoff K vs. T K fixed
Directa e inversa Directa y K equilibrio
Catalíticas heterogéneas
24
4.1.1. Reacciones de conversión
Se requiere: •
Coeficientes estequiométricos
•
Conversión del componente base
•
NA = Nao (1 - X) 113
Modelos rigurosos de operaciones unitarias
•
Los moles de reactivos disponibles para conversión incluyen cualquier cantidad producida en otras reacciones y se calculan simultáneamente, excepto en las marcadas como secuenciales
•
Cuando hay reacciones competitivas
•
A+ B→C B+D →E se puede usar el Rango para especificar qué valor de conversión se debe alcanzar antes (p.e. Si la reacción 1 tiene Rango 1, la conversión especificada para la reacción 2 solo se aplicará a la cantidad de B que quede después de haberse alcanzado la conversión 1).
4.1.2. Reacciones de equilibrio
La constante de equilibrio se expresa:
[
K = ∏ ([base] j ) N
νj
j =1
]
•
Reacciones de Gibbs: La constante de equilibrio se calcula a partir de la energía libre de Gibbs ideal
•
Van´t Hoff: Se supone que el ln K es solo una función de la temperatura:
•
ln K = A + B/T + C * T + D ln T
•
K vs. T: Se especifican datos de K a distintas temperaturas, que HYSYS ajustará a la expresión anterior.
•
K fijo, e independiente de la temperatura.
4.1.3. Reacciones cinéticas
• Directa e inversa Se definen en función de los parámetros de la ecuación de Arrhenius para la reacción directa (y opcionalmente la inversa), los coeficientes estequiométricos, y los órdenes de reacción directos (e inversos): R
P
rA = k ∗ ∏ (base ) j j − k '∗ ∏(base )i i n
j =1
n'
i =1
k = A ∗ exp(− E / RT ) k ' = A'∗ exp(− E ' / RT ) V
FA0 = FA + ∫ rA dV = 0
• Velocidad simple Similar a la anterior, excepto que la constante de velocidad de la reacción inversa se obtiene a partir de datos de equilibrio:
k ' = k / K eq 114
Modelos rigurosos de operaciones unitarias
4.1.4. Reacciones catalíticas heterogéneas
•
Involucran catalizadores sólidos
•
Adsorción y desorción de reactivos y productos
•
Reoxidación superficial Para una reacción del tipo: aA + bB → cC dependiendo del mecanismo de reacción, la velocidad de reacción puede ser: k + K A K B C AC B
Modelo de Langmuir-Hinshelwood:
r=
Modelo de Eley-Rideal:
r=
k + K B C AC B (1 + K B C B + K P C P )
Modelo de Mars-van Krevelen:
r=
kK A 1 + (a / b )(k / k *)C A C B− n
(1 + K AC A + K B C B + K P C P )2
La forma general para introducir estos modelos en HYSYS es: r=
R
P
i =1
j =1
β
k f ∏ C iα i − k r ∏ C j j M M γk ⎡ ⎛ 1 + K ∏ Cg g ⎜ ∑ k ⎢ g =1 ⎣ k =1 ⎝
⎞⎤ ⎟⎥ ⎠⎦
2
donde Kf, kr y Kk se expresan en forma de ecuación de Arrhenius. Existen 4 tipos de reactores que comparten el mismo formulario: CSTR, reactor de conversión, reactor de equilibrio, reactor de Gibbs. La página de Parámetros permite especificar la caída de presión, el volumen de reactor, y flujo de energía (duty). La presión se emplea en el cálculo de las reacciones, y el volumen del reactor es necesario para calcular el tiempo de residencia.
4.2. Reactor de conversión
El reactor de conversión es un reactor en el que tienen lugar reacciones de conversión fija. Cada reacción prosigue hasta que se alcanza la conversión especificada o hasta que se agote un reactivo limitante.
115
Modelos rigurosos de operaciones unitarias
En la página de reacciones se tiene que asociar un conjunto de reacciones (Reaction Set) al reactor y especificar la conversión para cada reacción del conjunto. El conjunto de reacciones solo puede contener reacciones de conversión.
4.3. CSTR. Reactor continuo de tanque agitado
El CSTR es un reactor en el que tiene lugar una reacción cinética, de manera que la conversión depende de las velocidades de reacción.
116
Modelos rigurosos de operaciones unitarias
Las corrientes de entrada se suponen instantánea y perfectamente mezcladas con el contenido del reactor, de manera que la composición de la corriente de salida es idéntica a la del contenido del reactor. Dado un volumen de reactor, una constante de velocidad de reacción y la estequiometría de cada reacción, se calcula la conversión de cada componente que entra al reactor.
4.4. Reactor de equilibrio
En este reactor solo pueden tener lugar reacciones de equilibrio, de manera que las corrientes de salida se encuentran en equilibrio físico y químico. Dado que HYSYS calcula la actividad de cada componente en la mezcla a partir de las fugacidades de los componentes puros, ni el proceso de mezcla ni los componentes tienen que ser ideales. La constante de equilibrio se calcula a la temperatura del reactor mediante la expresión: ln K = A +
B + C T + D ln T T
donde T es la temperatura absoluta, y A, B, C, D son constantes.
[
K = ∏ ([Base] j ) N
j =1
donde:
νj
]
K = constante de equilibrio [Base]j = base para el componente j (concentración, presión parcial, etc.) νj = coeficiente estequiométrico para el componente j N = número de componentes
117
Modelos rigurosos de operaciones unitarias
4.5. Reactor de Gibbs
Calcula las composiciones de salida de tal forma que a la salida del reactor se alcanza el equilibrio químico y entre fases. Sin embargo, no necesita utilizar una estequiometría específica para la reacción, ya que la composición de la mezcla de salida se calcula minimizando la energía libre de Gibbs (condición de equilibrio). Al igual que el reactor de equilibrio no necesita suponer comportamiento ideal ni los componentes puros ni la mezcla. En la página de composición se pueden ver los flujos de las corrientes de alimentación y productos en base molar. En este formulario se puede fijar algunos componentes como inerte de manera que se excluyen de los cálculos de minimización de la energía libre de Gibbs. Se puede especificar la velocidad de producción de cualquier componente como una restricción a la composición de equilibrio.
El flujo de producto se calcula basado en los valores fijados en la Frac. Spec. y Fixed Spec. como: Total Prod = FracSpec × Total Feed + FixedSpec
4.6. Reactor de flujo de pistón (PFR)
Generalmente consiste en una bancada de tubos cilíndricos. El flujo de modeliza como flujo de pistón, por lo que no existen gradientes radiales de materia ni energía, lo que implica que la mezcla radial es despreciable. Conforme los reactivos avanzan a lo largo del reactor son continuamente consumidos, por lo que existe una variación axial de concentración y temperatura. Para obtener la solución del PFR (perfiles axiales de composición, temperatura, etc.) se divide el reactor en varios subvolúmenes. En cada uno de estos subvolúmenes se considera velocidad de reacción espacialmente uniforme. En balance molar a cada subvolumen j es: F jo − F j + ∫ r j dV = V
dN j dt
Dado que se considera velocidad de reacción uniforme en cada subvolumen, el tercer término se reduce a rj V. En estado estacionario, el lado derecho de la ecuación es cero, de manera que la ecuación se reduce a: 118
Modelos rigurosos de operaciones unitarias
F jo = F j + r jV La página de Parámetros está divida en tres partes, relacionadas con los cálculos de la caída de presión, la transmisión de calor, y también para decidir si la operación se incluye en los cálculos. La caída de presión en el reactor se puede especificar directamente, o se puede calcular mediante la ecuación de Ergum: ∆P g c ϕ s D p ε 3 150(1 − ε ) = + 1.75 2 L ρ V 1− ε Vρ / µ donde:
∆P = caída de presión a través del reactor gc = factor de proporcionalidad de la ley de Newton para las unidades de la fuerza gravitacional L = longitud del reactor ϕs = esfericidad de la partícula Dp = diámetro de la partícula ρ = densidad del fluido V = velocidad superficial o velocidad del fluido con la torre vacía ε = porosidad µ = viscosidad del fluido
En la sección de transmisión de calor hay que indicar si se especifica directamente el intercambio de energía, o lo calcula HYSYS a partir de datos que se deben especificar en la página de transmisión de calor. La página de Transmisión de Calor (Heat Transfer) cambia dependiendo de la selección indicada anteriormente. Cuando se ha seleccionado anteriormente “Direct Q Value” aparece un cuadro de dialogo en el que hay que indicar el nombre de la corriente de energía, el valor del flujo de calor, y si es preciso calentar o enfriar.
Cuando se ha seleccionado la opción fórmula, HYSYS calculará rigurosamente el flujo de calor en cada subvolumen usando coeficientes locales de transmisión de calor para el interior y exterior de los tubos usando las siguientes fórmulas: 119
Modelos rigurosos de operaciones unitarias
Q j = U j A(Tbulkj − Toutj ) 1 1 1 = + U hout hw donde:
Qj = flujo de calor en el subvolumen j Uj = coeficiente global de transmisión de calor en el subvolumen j A = área superficial del tubo PFR Tbulkj = temperatura global del fluido Toutj = temperatura en el exterior del tubo PFR (fluido de utilidad) hout = coeficiente local para la transmisión de calor en el exterior (fluido de utilidad) hw = coeficiente local para la transmisión de calor en el interior del tubo
En los cálculos se desprecia la resistencia de la pared del tubo a la transmisión de calor. En cada subvolumen, el calor se transmite radialmente del fluido del PFR al fluido de utilidad. Los dos grupos de cuadros de dialogo que aparecen nos permiten especificar los valores necesarios para evaluar la transmisión de calor.
La ecuación usada para determinar la temperatura del fluido de utilidad en cada subvolumen es: Q j = mρC p (Tout , j − Tout , j +1 )
y los parámetros que aparecen en el cuadro de dialogo “Heat Medium Side Heat Transfer Infos Group” son: Wall Heat Transfer Coefficient = hout Mole flow = m Heat capacity = Cp 120
Modelos rigurosos de operaciones unitarias
Inlet temperatura = temperatura del fluido de utilidad a la entrada del PFR Calculated duty = Qj En el cuadro de dialogo “Tube Side Heat Transfer Info Group” se puede especificar directamente el valor del coeficiente local de transmisión de calor, hw, que se puede calcular a través de una ecuación empírica: hw = A flujo B debiéndose asignar valores a las constantes A y B, o bien escogiendo la opción estándar se calcula a partir de ecuación: N u = A Re B Pr C hw =
Nu k g Dp
En la página de Reacciones, hay que asociar un conjunto de reacciones al PFR. Los tipos de reacciones permitidas son cinéticas, catalíticas heterogéneas, o simples. También deberemos especificar el número de segmentos en que se desea dividir el reactor. La fracción mínima en que se dividirá un segmento (Minimum Step Fraction), y la longitud de paso mínima (Minimum Step Length) que es el producto de la longitud del reactor por la fracción de paso mínima.
Durante el cálculo de cada segmento, HYSYS intentará obtener una solución a lo largo de toda la longitud del segmento. Si la solución no converge, el segmento se divide en dos partes, y HYSYS intentará de nuevo obtener una solución en la primera mitad del segmento dividido. El segmento se seguirá subdividiendo en mitades hasta que se alcanza una solución, en cuyo caso se calculará la porción restante del segmento. Si el segmento se divide hasta un punto en que su longitud es menor que la longitud de paso mínima, entonces se interrumpen los cálculos. 121
Modelos rigurosos de operaciones unitarias
Si se ha especificado una porosidad menor que 1 aparece el cuadro del grupo de datos de catalizador, en el que hay que proporcionar la siguiente información: •
Diámetro de la partícula de catalizador, Dp
•
Esfericidad de la partícula, ϕs, definida como el área superficial de la esfera con el mismo volumen que la partícula dividido por el área de la partícula.
•
Densidad del sólido, ρs, incluyendo el espacio poroso de la partícula (microporosidad).
•
Densidad, ρb, definida como: ρb = ρs(1-εm), siendo εm la microporosidad.
•
Capacidad calorífica del sólido
En la pestañas “Worksheet” y “Performance” se nos presentan los resultados de la simulación en diferentes formas.
122
Modelos rigurosos de operaciones unitarias
123
II.
Simulación de procesos en la industria química y de procesos: HYSYS
Modos de simulación de procesos Aurelio B. Vega Granda Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Modos de simulación de procesos
ÍNDICE 1. INTRODUCCIÓN ....................................................................................................127 2. MODOS DE SIMULACIÓN ...................................................................................130 2.1. Modo modular .....................................................................................................133 2.2. Modo orientado a ecuaciones ..............................................................................135
1. INTRODUCCIÓN Los simuladores de procesos actuales se pueden clasificar en los siguientes tipos según la estructura bajo la cual se plantea el modelo matemático que representa el proceso a simular: -simuladores globales u orientados a ecuaciones -simuladores modulares secuenciales -simuladores híbridos o modular secuencial-simultáneo Bajo el enfoque de la simulación global u orientada a ecuaciones, se plantea el modelo matemático que representa al proceso (unidad, corrientes de interconexión, y algunas veces modelos termodinámicos) construyendo un gran sistema de ecuaciones algebraicas que representa a todo el conjunto o planta a simular y que se resuelve simultáneamente. De esta forma el problema se traduce en resolver un gran sistema de ecuaciones algebraicas, por lo general altamente no lineales. Como ejemplo puede citarse que en problemas típicos de simulación de columnas de destilación por métodos rigurosos el sistema de ecuaciones puede llegar a contener más de mil variables. De ello se desprende la magnitud del sistema que represente el modelo de una planta completa típica. En la década del 70, cuando se generan los primeros simuladores, no existían los medios apropiados (principalmente hardware) para la resolución numérica de sistemas de ecuaciones de gran dimensión. Es por ello que los primeros simuladores comerciales adoptaron principalmente la arquitectura modular secuencial, en detrimento de la global. El principal problema asociado a la filosofía de resolución global u orientada a ecuaciones es la convergencia del sistema y la consistencia de las soluciones que se encuentran. En efecto, los sistemas altamente no lineales como los que corresponden a modelos de plantas químicas pueden, por ejemplo, producir múltiples soluciones (un ejemplo es el caso de los reactores adiabáticos con reacciones exotérmicas). Además, la solución numérica para grandes sistemas exige inicializaciones apropiadas, es decir próximas a un entorno de la solución, de lo contrario pueden presentarse serios problemas de convergencia. Históricamente, estas dificultades han sido la causa que ha limitado el desarrollo de este tipo de simuladores en forma masiva. Una de las críticas fundamentales para la operabilidad de los mismos que se realizaba a menudo por parte de usuarios no entrenados, era la imposibilidad de identificar los sectores de la planta en correspondencia con el sistema de ecuaciones que lo representa, dado que una vez que el sistema total se ha ensamblado, éste esta integrado y se pierde la correspondencia biunívoca entre el equipo y el subsistema de ecuaciones que lo representa. De esta manera, si existieran inconvenientes durante la simulación, resulta difícil 127
Modos de simulación de procesos
asignar el problema a un sector específico de la planta, o bien inicializar convenientemente. Las principales características (virtudes y defectos históricamente remarcados) se resumen a continuación: •
Cada equipo se representa por las ecuaciones que lo modelizan. El modelo es la integración de todos los subsistemas.
•
Desaparece la distinción entre variables de proceso y parámetros operativos, por lo tanto se simplifican los problemas de diseño.
•
Resolución simultánea del sistema de ecuaciones algebraicas (no lineales) resultante.
•
Mayor velocidad de convergencia.
•
Necesita una mejor inicialización (mejor cuanto mayor sea el problema a resolver).
•
A mayor complejidad, menor fiabilidad en los resultados y más problemas de convergencia (soluciones sin sentido físico).
•
Más difícil de usar por "no especialistas".
Una ventaja importante es que puede lograrse una velocidad de convergencia mayor que en los simuladores modulares secuenciales. Además, dado que el sistema se plantea orientado a ecuaciones, es posible incorporar fácilmente las expresiones de restricción para definir problemas de optimización en forma directa, ya que basta solo con plantear las restricciones y la función de optimización. Esta flexibilidad es imposible en los simuladores modulares secuenciales, debido a que los módulos están orientados y definidos en forma rígida; esto es, resulta imposible agregar restricciones y/o variables, además de la expresión analítica de la función de optimización. Los simuladores modulares secuencia/es se basan, en módulos de simulación independientes que siguen aproximadamente la misma filosofía que las operaciones unitarias, es decir, cada equipo: bomba, válvula, intercambiadores, etc.; se modeliza a través de modelos específicos para los mismos y además, el sentido de la información coincide con el "flujo físico" en la planta. Esta estructura tiene como ventaja el hecho de que cada sistema de ecuaciones se resuelve con una metodología que resulta adecuada para el mismo, ya que es posible analizar bajo todas las circunstancias posibles, el comportamiento del método de resolución propuesto, esto es sistemas ideales, no ideales, topologías diversas del equipo, distintas variantes, etc. Dado que se puede analizar específicamente la rendimiento de los distintos métodos de resolución es factible lograr un modelo robusto y eficiente para cada módulo específico. El enfoque en la teoría modular secuencial, por definición, supone que se conocen (especifican} las variables de las corrientes de entrada, o sea las alimentaciones a los equipos, mientras que deben calcularse las corrientes de salida y los correspondientes parámetros de operación si correspondiera. Esto impone cierta rigidez que sacrifica, según sea el caso, la posibilidad de encontrar asignaciones tales que minimicen el tiempo de cálculo (secuencias acíclicas de resolución del sistema de ecuaciones asociado). Sin embargo esto resulta conveniente desde otro punto de vista, ya que de esta manera se impone una dirección al flujo de información entre módulos. Por otra parte, las combinaciones posibles de especificación de variables son enormes, incrementándose de forma drástica la cantidad de módulos a disponer si se quisiera cubrir todas las posibilidades. Por ejemplo, en los intercambiadores de calor en contracorriente si se suponen conocidas las corrientes de entrada, (esto es, la presión, la temperatura, la composición y el estado de fase, 128
Modos de simulación de procesos
vapor, líquido o mezcla- ); dado que para calcular las corrientes de salida el sistema de ecuaciones correspondientes queda determinado sólo cuando se asignan ciertos parámetros de equipo, será necesario que el usuario los asigne como datos. Una opción simplificada de cálculo implica la necesidad de fijar como parámetros de equipo el factor UA, (producto del coeficiente global de transferencia y el área de intercambio). En general, fijada la orientación en el cálculo (esto es, dadas las entradas calcular las salidas del equipo), lograr que el sistema de ecuaciones sea compatible y tenga tantas incógnitas como ecuaciones no implica necesariamente una única opción, ya que debemos analizar las variables o parámetros de operación del equipo. En efecto, en la mayoría de los casos existirán varias combinaciones de valores posibles, es decir, existirán varias posibilidades de asignación de parámetros de equipos. Además, existen variantes para cada módulo que tienen en cuenta varios factores, como puede ser la topología, -por ejemplo, el número de entradas y salidas a una torre de destilación, o si hay condensadores parciales o totales-, o bien el nivel de las hipótesis realizadas (si se considera hidráulica de platos o no, pérdidas de calor al ambiente, etc.). Resumiendo, en un simulador modular se define cada módulo por un sistema de ecuaciones independiente que se resuelve de la manera óptima, subordinados sin embargo a las limitaciones que ha impuesto la especificación de variables seleccionada. Esto implica una ventaja en el sentido que se podrían utilizar progresivamente distintos niveles de cálculo dependiendo de la etapa del proyecto en la que se realiza la simulación, o bien en función de los datos disponibles hasta el momento, aprovechando el conocimiento que proviene de la experiencia y análisis del método de convergencia para cada caso en particular. No obstante, uno de los problemas que se originan es la conexión de los módulos según el proceso a simular y las rigideces que ello impone. En la década de los 70 se desarrollaron métodos avanzados para la descomposición y resolución de diagramas de flujo modulares, conduciendo al desarrollo de simuladores modulares simultáneos. En este tipo de simuladores aunque los modelos de las unidades permanecen intactos, la resolución de las corrientes del diagrama de flujo se llevan a cabo de una forma global o simultánea, en lugar de secuencial. Además, se incorporaron algoritmos y modelos más generales (tales como tratamiento de sólidos) junto con métodos numéricos más sofisticados. Este desarrollo fue motivado por el proyecto ASPEN en el Instituto de Tecnología de Massachussets (MIT). En las décadas de los 80 y 90, se desarrolló de forma considerable el modo de simulación orientado a ecuaciones, especialmente para modelización y optimización en línea. Además, los nuevos conceptos de ingeniería informática condujeron a interfases amigables e incluso a algoritmos más potentes. Finalmente, el espectacular desarrollo de los ordenadores personales contribuyó a la rápida extensión de la simulación. Actualmente, los simuladores modulares más importantes incluyen ASPEN PLUS de Aspen Technology Inc., HYSYS de Hyprotech Ltd. (actualmente Aspen Technology), PRO/II de Simulations Sciences Inc., y CHEMCAD de Chemstations. Simuladores orientados a ecuaciones incluyen SPEEDUP de Aspen Technology Inc., así como una serie de programas para la modelización y optimización en tiempo real.
129
Modos de simulación de procesos
2. MODOS DE SIMULACIÓN Para facilitar una descripción más clara de las estrategias de simulación de proceso, vamos a presentar un ejemplo sencillo de un diagrama de flujo.
Decantador
Reactor
Cambiador de c alor
Recir culación
Columna de destilac ión
Consideremos el diagrama de flujo de la figura, que corresponde a un diagrama de flujo propuesto por Williams y Otto como un proceso químico típico.
Azeótr opo (P=10% E)
(Combustible)
Las corrientes de alimentación de los componentes puros A y B se mezclan con una corriente de reciclo y entran a un reactor continuo de tanque agitado, donde tienen lugar las siguientes reacciones: A+ B→C C+B→P+E P+C→G Aquí C es un producto intermedio, P es el producto principal, E es un subproducto, y G es un residuo tipo aceite. Tanto C como E se pueden vender debido a su valor como combustibles, mientras que G se debe tratar como un residuo y por tanto con un coste. La planta consta de un reactor, un cambiador de calor para enfriar el efluente de salida del reactor, un decantador para separar el residuo G de los reactivos y productos, y una columna de destilación para separar el producto deseado P. Debido a la formación de un azeótropo, parte del producto (equivalente al 10 % en peso del flujo de componente E) queda retenido en la corriente de colas de la columna. La mayoría del producto de colas se recicla al reactor, y el resto se usa como combustible. El modelo de la planta se puede definir sin el balance de energía, de manera que se va a simplificar el problema considerando reacciones isotérmicas. El resto de unidades también se simplificarán para no complicar en exceso el ejemplo y emplearlo solo con fines ilustrativos. La información topológica para el diagrama de flujo se muestra en la siguiente tabla.
130
Modos de simulación de procesos
Unidad
Tipo
Entrada F1, F2, FR
Salida
1
Reactor
Feff
2
Intercambiador Feff
Fex
3
Decantador
Fex
Fd, Fwaste
4
Columna
Fd
Fprod, Fbottom
5
Divisor
Fbottom
Fpurge, FR
Vamos a considerar ahora los modelos de las unidades en el orden en que se ejecutan en el diagrama de flujo. Todos los flujos se expresan en forma de flujos másicos. Modelo para el reactor Las composiciones de los distintos componentes en le reactor se obtienen a partir de las cinéticas. Por simplicidad supondremos reactor isotérmico (con temperatura prefijada en 674 ºR). Las ecuaciones para este reactor vienen dadas por: A Feff = (F1A + FRA ) − (k 1 X A X B )Vρ
FeffB = (F2B + FRB ) − (k 1 X A + k 2 X c )X B Vρ
c Feff = FRC + (2 k 1 X A X B − 2k 2 X B X C − k 3 X p X C )Vρ
FeffE = FRE + (2k 2 X B X C )Vρ
FeffP = FRP + (k 2 X B X C − 0.5k 3 X p X C )Vρ
Feffj (FeffA + FeffB + FeffC + FeffE + FeffP + FeffG ) j = A, B, C, E, G, P
XJ =
Con constantes de velocidad de reacción dadas por: k1 = 5.9755 ⋅ 10 9 exp(− 12000 / T )h −1 ( fracción en peso) −1 k 2 = 2.5962 ⋅ 1012 exp(− 15000 / T )h −1 ( fracción en peso) −1 k 3 = 9.6283 ⋅ 1015 exp(− 20000 / T )h −1 ( fracción en peso) −1
Siendo Xj la fracción en peso del componente j, V el volumen del reactor, T su temperatura, y ρ la densidad de la mezcla. Modelo para el intercambiador de calor
Dado que no es necesario el balance de energía, las ecuaciones para esta unidad son simplemente que las salidas son iguales a las entradas: Fexj = Feffj j = A, B, C, E, G, P 131
Modos de simulación de procesos
Decantador
Esta unidad supone separación perfecta entre el componente G y el resto de componentes, de manera que las ecuaciones son: Fdj = Fexj
j = A, B, C, E, P
FdG = 0 G Fwaste = FexG j Fwaste =0
j = A, B, C, E, P
Columna de destilación
Esta unidad supone una separación de componente P puro por cabezas, pero supone que una parte del producto P se pierde por colas junto el resto de componentes debido a la formación de un azeótropo con el componente E, conduciendo a las ecuaciones: j Fbottom = Fdj
j = A, B, C, E
j Fprod =0
j = A, B, C, E
P Fbottom = 0.1FdE P Fprod = FdP − 0.1FdE
Divisor de flujo
Las ecuaciones para esta unidad son: j j Fpurgue = ηFbottom
j = A, B, C, E, P
j FRj = (1 − η) Fbottom
j = A, B, C, E, P
A pesar de las simplificaciones del modelo del proceso, tenemos 58 variables y 54 ecuaciones. También, obsérvese que el sistema no se puede resolver secuencialmente debido a la corriente de reciclo, y a la necesidad de resolver las ecuaciones del reactor simultáneamente. En concreto, el sistema tiene 4 grados de libertad, y las especificaciones para estas variables conducen a diferentes problemas de simulación. Por ejemplo, si especificamos los flujos F1 y F2, el volumen del reactor V, y la fracción de división η, entonces tenemos un problema de evaluación de funcionamiento que trata con un proceso o diseño ya existente. Esto se considera la entrada normal al proceso dado que la secuencia de cálculo sigue el flujo de materia en el mismo. Por otra parte, si especificamos 4 flujos de salida P A B E , F purge , F purge , F purge ) estamos ante un problema de diseño y se necesita calcular las ( F prod entradas a partir de estas especificaciones. Intuitivamente, se puede ver que la resolución del problema de evaluación es más simple que el de diseño. En efecto, para algunos valores de las especificaciones de diseño podría no haber solución. Sin embargo, los dos tipos de problemas 132
Modos de simulación de procesos
necesitan ser considerados en las herramientas de simulación. Con esta descripción del proceso Williams-Otto, vamos a considerar las estrategias de resolución de los modos modular y orientado a ecuaciones.
2.1. Modo modular
En este tipo de modo, las unidades de proceso están encapsuladas como procedimientos, donde las corrientes de salida (y otra información calculada) se evalúa a partir de las corrientes de entradas y los parámetros de diseño. Estos procedimientos se resuelven de una manera secuencial, que a grandes rasgos sigue de forma paralela al flujo de materia en el proceso. Los simuladores están construidos de una manera jerárquica con tres niveles, como se muestra en la figura. Topología del diagrama de flujo
Modelos de operaciones unitarias
Modelos de propiedades físicas
El nivel superior se encarga de la topología del diagrama de flujo, siendo su tarea principal ordenar la secuencia de los módulos de las unidades, inicializar el diagrama de flujo, identificar los bucles de reciclo (particionado), seccionarlas corrientes, y asegurar la convergencia de estas corrientes en los balances globales de materia y energía. El nivel intermedio se encarga de los procedimientos de las operaciones unitarias, y representa la biblioteca de modelos de unidades, cada una resuelta con un procedimiento especializado. Las entradas desde el nivel superior incluyen las corrientes de entrada y parámetros de cada unidad, y las salidas de unidad (corrientes y parámetros) se retroalimentan al nivel superior una vez calculada la unidad. La biblioteca de unidades incluye separadores, reactores y unidades de transferencia. Finalmente, el nivel más bajo trata con los modelos de propiedades físicas. Esto incluye los modelos termodinámicos para el equilibrio entre fases, entalpías, entropías, densidades, etc. Este nivel es llamado frecuentemente por los procedimientos de las operaciones unitarias, y también por el nivel superior para la inicialización del diagrama de flujo y el cálculo de corrientes. En cada nivel, una tarea clave es la resolución de un sistema de ecuaciones no lineales que puede representar los cálculos del equilibrio entre fases, que involucran modelos termodinámicos no ideales; también los balances de materia y energía que representan los modelos de las operaciones unitarias acoplados a estas relaciones termodinámicas. La 133
Modos de simulación de procesos
resolución de estos sistemas requiere un proceso iterativo que no está al alcance de la resolución manual o de herramientas de hojas de cálculo. Además, la topología del diagrama de flujo o los reciclos tratan con la descomposición estructural del diagrama de flujo y la secuenciación de las unidades, donde es preciso identificar los bucles de reciclo y las corrientes de seccionado. Una vez identificados, los valores de las corrientes se determinan mediante un proceso iterativo. 2.1.1. Resolución del proceso Williams-Otto en modo modular
En el modo modular agrupamos las ecuaciones del proceso dentro de cada unidad y ejecutamos estas unidades en secuencia. La primera tarea consiste en identificar las corrientes que rompen todos los bucles de reciclo (particionado). Dado que el diagrama de flujo tiene solo un reciclo, cualquiera de las corrientes en el reciclo se puede usar como corriente de seccionado. Escogemos como corriente de seccionado la corriente de entrada al reactor y consideramos el proceso como se muestra en la figura.
Ahora resolveremos las unidades de acuerdo con la tabla de topología que hemos mostrado anteriormente (reactor, cambiador, decantador, columna de destilación, divisor) donde las corrientes de salida de cada unidad se calculan a partir de las entradas. Para cada módulo, necesitamos estar seguros que están especificadas todas las entradas. Especificamos los flujos de alimentación F1 y F2, el volumen del reactor, y la fracción de purga del divisor de flujo. Entonces, inicializamos el problema suponiendo un valor para el flujo de la corriente de reciclo FR y evaluamos un valor calculado para esta corriente. La ejecución secuencial de las unidades, comenzando por el reactor, nos permite obtener la corriente de entrada en cada unidad. El problema de convergencia viene dado por la ecuación de punto fijo: FR = g(FR) Donde g(FR) se encuentra implícitamente después de la ejecución de la secuencia de unidades. El valor de FR se determina después de varios pasos por el diagrama de flujo mediante un proceso iterativo. Estos pasos iterativos son los procesos dominantes en la simulación, de manera que el algoritmo de convergencia del reciclo determina la eficacia de la simulación. La resolución este diagrama de flujo en el nivel superior es sencillo si se supone que todas las corrientes de salida se pueden determinar rápidamente dentro de cada unidad. Para este 134
Modos de simulación de procesos
proceso se requiere un esquema de resolución iterativa robusto para las ecuaciones del reactor. La estructura de este diagrama de flujo es un simple y único bucle de reciclo, pero frecuentemente nos encontramos con topologías mucho más complejas, donde la determinación de buenas corrientes de seccionado está lejos de ser trivial.
2.2. Modo orientado a ecuaciones
En el modo orientado a ecuaciones se combinan las ecuaciones de la topología del diagrama de flujo (por ejemplo, las corrientes de conexión) con las ecuaciones de las unidades (y si es posible, con las ecuaciones de las propiedades físicas) en un gran sistema de ecuaciones. Esta estructura permite mucha más flexibilidad al especificar las variables independientes como parámetros y resolver para las restantes. Además, la solución de este sistema de ecuaciones se lleva a cabo por un algoritmo general de resolución de ecuaciones no lineales. En casi todos los casos se emplea el método de Newton-Raphson. En la figura se muestra la estructura de la simulación orientada a ecuaciones, donde se puede ver que los modelos de propiedades físicas, dado su número y naturaleza no lineal, se mantiene como un procedimiento independiente, y se mantiene separado de las ecuaciones de las operaciones unitarias y de conexión. Topología del diagrama de flujo Operaciones unitarias
Modelos de propiedades físicas
En el modo modular, estábamos interesados en sacar provecho de la topología del diagrama de flujo mediante el seccionado de corrientes y de los procedimientos especializados para la resolución de las operaciones unitarias. Por el contrario, con la simulación orientada a ecuaciones aplicamos directamente estrategias de resolución simultánea en gran escala a las ecuaciones para todo el diagrama de flujo. Estos grandes sistemas de ecuaciones tienen una estructura dispersa, en el sentido de que solamente una pequeña fracción del número total de variables participan en una ecuación dada. Debido a su estructura, los simuladores orientados a ecuaciones tienden a converger mucho más rápido que los modulares. Sin embargo, los simuladores modulares son mucho más fáciles de inicializar debido a que ejecutan las unidades de proceso en secuencia de acuerdo con la estructura del diagrama de flujo. Los simuladores orientados a ecuaciones no tienen esquemas de inicialización análogos, de manera que se requiere un considerable esfuerzo para inicializar estos problemas (esencialmente, se necesitan agrupar las ecuaciones en una estructura modular).
135
Modos de simulación de procesos
Aplicando al proceso Williams-Otto el modo orientado a ecuaciones, combinamos todas las ecuaciones del proceso y las resolvemos simultáneamente. Como ya hemos visto, las ecuaciones del diagrama de flujo son: A Feff = (F1A + FRA ) − (k 1 X A X B )Vρ
FeffB = (F2B + FRB ) − (k 1 X A + k 2 X c )X B Vρ
c Feff = FRC + (2 k 1 X A X B − 2k 2 X B X C − k 3 X p X C )Vρ
FeffE = FRE + (2k 2 X B X C )Vρ
FeffP = FRP + (k 2 X B X C − 0.5k 3 X p X C )Vρ
XJ =
(F
A eff
Feffj C E P G ) + Feff + Feff + Feff + Feff
B + Feff
j = A, B, C, E, G, P
Fexj = Feffj
j = A, B, C, E, G, P
F =F
j = A, B, C, E, P
j d
j ex
FdG = 0 G Fwaste = FexG j Fwaste =0 j bottom
F
j = A, B, C, E, P
=F
j = A, B, C, E
j d
j = A, B, C, E
j Fprod =0 P Fbottom = 0.1FdE P Fprod = FdP − 0.1FdE j j Fpurgue = ηFbottom
j = A, B, C, E, P
F = (1 − η) F
j = A, B, C, E, P
j R
j bottom
La estructura de estas ecuaciones tiene un fuerte impacto en la eficacia del proceso de resolución. En particular, obsérvese que muy pocas variables aparecen en una ecuación dada (normalmente, dos o tres), de manera que esta dispersión debe ser aprovechada. Dado que la estructura del problema se explota al nivel de ecuaciones, hay un gran campo de acción para especificar los cuatro grados de libertad. También, las ecuaciones de este ejemplo se pueden simplificar considerablemente. Por ejemplo, como se ve en el modelo, las ecuaciones y variables correspondientes al intercambiador de calor y decantador se pueden eliminar de forma trivial.
136
II.
Simulación de procesos en la industria química y de procesos: HYSYS
Métodos de resolución de ecuaciones no lineales I: métodos tipo Newton José Ramón Álvarez Saiz Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
ÍNDICE 1. INTRODUCCIÓN ....................................................................................................139 2. MÉTODOS TIPO NEWTON ..................................................................................140 3. FUNCIONES ACOTADAS Y DERIVADAS ..........................................................141 3.1. Funciones acotadas y derivadas...........................................................................141 3.2. Proximidad a la solución .....................................................................................142 3.3. Singularidad del Jacobiano. Modificación del paso del método de Newton.......145 3.4. Métodos de continuación: tratamiento de la singularidad del Jacobiano ............148 4. BIBLIOGRAFÍA ......................................................................................................148
1. INTRODUCCIÓN La resolución de ecuaciones algebraicas no lineales es la tarea principal en la simulación de procesos en estado estacionario. Para ambos modos, modular y orientado a ecuaciones, hay que resolver las ecuaciones obtenidas a partir de las operaciones unitarias, las propiedades físicas y la topología derivada de los diagramas de flujo. Los problemas se pueden plantear en un formato estándar: resolver f(x) = 0, o bien en el formato denominado de punto fijo, es decir: x = g(x). Ambas formas son equivalentes, y los métodos que se describen a continuación se pueden aplicar a ambos formatos, ya que f(x) = x – g(x)= 0 o bien: x = x + h(f(x)) = g(x). donde h es cualquier función siempre que h(y) = 0 si y solo si y = 0. De hecho el formato de punto fijo es más sencillo de operar cuando se requiere la convergencia de corrientes de recirculación trabajando en modo modular. Este tema corresponde a la descripción de los métodos tipo Newton utilizando el formato estándar. El método de Newton-Raphson es el más utilizado en la resolución de ecuaciones no lineales. En la simulación de procesos es el algoritmo esencial para el modo orientado a ecuaciones y se utiliza a menudo para la resolución de las ecuaciones de las operaciones unitarias, en particular para los modelos de separación detallados. También se verán métodos quasi-Newton o Broyden. En el tema siguiente se abordarán los métodos de punto fijo de primer orden. A diferencia de los de Newton, no requieren información de las derivadas de las ecuaciones, pero convergen más lentamente. Se utilizan en convergencia de recirculaciones y en otros procedimientos de cálculo cuando las derivadas son difíciles de obtener. 139
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
2. MÉTODOS TIPO NEWTON Considérese el problema en su forma estándar f(x) = 0, donde x es un vector de n variables reales y f() es un vector de n funciones reales. Si se establece una estimación de las variables en un punto dado, x´, se puede realizar una expansión en serie de Taylor para extrapolar alrededor del punto de resolución (x*): f i ( x*) ≡ 0 = f i ( x ' ) + ∂f i ( x ' ) / ∂x T ( x * − x ' ) + 1 / 2( x * − x ' )T ∂ 2 f i ( x ' ) / ∂x 2 ( x * − x ' ) + .... i = 1,...n o bien: f i ( x*) ≡ 0 = f i ( x ' ) + ∇f i ( x ' )T ( x * − x ' ) + 1 / 2( x * − x ' )T ∇ 2 f i ( x ' )( x * − x ' ) + .... i = 1,...n donde ∇f i ( x ) y ∇ 2 f i ( x ) son el vector gradiente y la matriz Hessiana de la función f(x), respectivamente.
Si se trunca la serie (sólo dos primeros términos), se tiene: f ( x '+ p ) ≡ 0 = f ( x ') + J ( x ') p
Donde se ha definido el vector p = (x* - x’) como dirección de búsqueda y la matriz J con elementos {J }ij = ∂f i ∂x j para la fila i y la columna j de la matriz J. Esta matriz se denomina Jacobiano. Si J no es singular, se puede resolver directamente para obtener p, con una aproximación lineal a la solución de las ecuaciones no lineales: p = −(J ( x ' ) ) f ( x ') −1
Esto permite una estrategia recursiva para encontrar el vector solución x*
( ) f (x )
pk = − J k
−1
k
x k +1 = x k + p k
Siendo x0 la primera estimación, k el contador de iteraciones y J k ≡ J ( x k ) . La estrategia recursiva se puede formalizar en el siguiente algoritmo básico para el método de Newton: Algoritmo
0. Suponer x0, k = 0 1. Calcular f(xk), Jk 2. Calcular pk = -(Jk)-1 f(xk) 3. Establecer xk+1 = xk + pk 4. Comprobar convergencia: Si f(xk)T f(xk) ≤ ε1 y pk ≤ ε2, terminar (ε1 y ε2 son valores próximos a cero) 5. En caso de no convergencia, k = k+1, volver al paso 1 140
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
El método de Newton tiene algunas propiedades de convergencia muy adecuadas. En particular, tiene una rápida velocidad de convergencia cerca de la solución. De manera más precisa, el método de Newton converge a una velocidad cuadrática dada por la expresión: xk − x * x k −1 − x *
2
≤K
donde ||x|| ≡ (xTx)1/2 es la norma Euclídea que define la longitud de un vector x determinado. Una forma de interpretar esta relación es considerar que si K = 1 y se tiene un decimal de precisión para xk-1, es decir ||xk-1 – x*|| = 0.1, entonces, en la siguiente iteración se tendrán dos dígitos de precisión, cuatro, ocho, y así sucesivamente. Por otro lado, esta convergencia tan rápida solamente tiene lugar si el método funciona adecuadamente. El método puede fallar en problemas de simulación complicados. Las condiciones suficientes de manera cualitativa para la convergencia del algoritmo de Newton son: •
Las funciones f(x) y J(x) existen y están acotadas para cualquier valor de x
•
La suposición inicial x0, debe de estar cerca de la solución real.
•
La matriz J(x) no debe de ser singular para ningún valor de x.
3. FUNCIONES ACOTADAS Y DERIVADAS 3.1. Funciones acotadas y derivadas
Mediante un análisis detallado, se pueden evitar los casos en los que las funciones resultan divididas por cero, o bien no tienen valores posibles, como es el caso del logaritmo de un número negativo. Además se pueden especificar nuevas variables añadiendo también nuevas ecuaciones. En los dos ejemplos siguientes se detallan estas consideraciones: Ejemplo 1: Para resolver f(t) = 10 – e3/t = 0, se observa que para valores de t próximos a cero, el término exponencial aumenta de valor muy rápidamente, así como la derivada de la función, -3e3/t. Si se define una nueva variable x = 3/t, y se añade la ecuación xt –3 = 0, se tienen mayor número de ecuaciones a resolver, pero en este caso las funciones están perfectamente acotadas, de modo que se debería de resolver el sistema: f1(x) = 10 – ex = 0 f2(x) = xt – 3 = 0 siendo la matriz jacobiana:
⎡− e x
J(x) = ⎢
⎣ t
0⎤ ⎥ x⎦ 141
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton Hay que destacar que tanto ambas funciones f1 y f2 como J tienen valores acotados y definidos para valores finitos de x, sin embargo J puede llegar a ser singular para determinados valores de x y t. Ejemplo 2: Para la función f(x) = ln x – 5 = 0, la función no tiene soluciones válidas para valores negativos de x. Este problema se puede reformular introduciendo una nueva variable y una nueva ecuación. Se define x2 = ln x1 o bien f1 = x1 – exp(x2) = 0. El sistema de ecuaciones que resulta es: f1 = x1 – exp(x2) = 0 f2 = x2 – 5 = 0 siendo la matriz jacobiana:
⎡1 − e x 2 ⎤ ⎥ 1 ⎦ ⎣0
J(x) = ⎢
De nuevo en este caso ambas funciones y las derivadas tienen valores acotados.
3.2. Proximidad a la solución
En general, asegurar un punto de partida próximo a la solución no es práctico, de tal modo que normalmente se comienza por una estimación lejana, o arbitraria, y lo que importa es el control de acercamiento, esto es, el paso de aproximación del método de Newton para asegurar que se progresa hacia la solución. Con este objetivo, el paso de acercamiento se modifica, de tal modo que el nuevo punto es solamente una fracción del paso máximo que predice el método de Newton para cada iteración. x k +1 = x k + αp k siendo α un número entre 0 y 1, y pk el paso en la dirección predicha por la iteración del método de Newton. Si α = 1 el paso a dar es el predicho por el método de Newton. Para evaluar α automáticamente se ha de llevar a cabo un método que proporcione una convergencia adecuada. Para ello se define una función objetivo a minimizar: φ( x ) = 1 / 2 f ( x ) T f ( x ) Utilizando α para calcular el nuevo punto se tiene: x k +1 = x k + αp k realizando una expansión de Taylor de la función objetivo φ(x) se tiene: φ( x k +1 ) = φ( x k ) + αdφ / dα + α 2 / 2d 2 φ / dα 2 + ... o bien: φ( x k +1 ) = φ( x k ) + ∇φ( x k )T (αp k ) + α 2 / 2 p kT ∇ 2 φ( x k ) p k + ... Definimos nuevamente Jk J k ≡ J(xk ) a partir de donde se obtiene la derivada de φ(x): 142
{J ( x )} k
ij
=
∂f i ∂x j
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
∇φ( x k ) T = f ( x k ) T J k y el paso del método de Newton: p k = −(J ( x k ) ) f (x k ) −1
Multiplicando la derivada de φ(x) por pk y sustituyendo el valor del intervalo se llega a : ∇φ( x k ) T p k = −( f ( x k ) T J k ( J k ) −1 f ( x k )) = − f ( x k ) T f ( x k ) = −2φ( x k ) < 0 Y si α→ 0, en la expansión de Taylor tenemos: φ( x k +1 ) − φ( x k ) ≈ −2αφ( x k ) < 0 Para un α suficientemente pequeño, el paso de la iteración del método de Newton hace que φ(x) disminuya. Esta propiedad permite crear un algoritmo y mejorar la estimación de φ(x). Se podría minimizar entonces la función φ(xk + αpk) y encontrar un valor de α óptimo. Este proceso, no obstante, resulta excesivo debido a la gran cantidad de cálculos a realizar y la posible dirección cambiante, sobre todo en las últimas iteraciones. En lugar de esta opción, se elegirá un paso de iteración αk que proporciona suficiente disminución de la función φ(x). Esta aproximación se conoce como la búsqueda de la línea de Armijo, y se ilustra en la fig. 1. Comenzando en el origen, se observa la pendiente negativa incluso cuando α = 0, y también se observa que hay un valor del paso de iteración para el cual φ(xk + αpk) es mínimo. En vez de una minimización directa de α, se define como condición suficiente para reducir el valor de la función, cuando φ(xk + αpk) está por debajo de la cuerda de Armijo, esto es: φ( x k + αp k ) − φ( x k ) ≤ −2δαφ( x k ) siendo δ la fracción de la pendiente (normalmente comprendida entre 0 y ½) que define esta cuerda. De esta manera se asegura que hay una disminución satisfactoria de φ(x) que es al menos una fracción, δ, de la velocidad de disminución en el punto presente, xk.
Fig. 1. Esquema para la búsqueda de la línea de Armijo (Biegler et al., 1997) 143
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
Si esta relación se satisface para un valor suficientemente alto de α, se toma este paso como válido. En caso contrario, se considera el caso de la figura 1 donde α = 1. En este caso el valor de φ(xk + αpk) se encuentra por encima de la cuerda de Armijo, en consecuencia, no hay reducción de la función φ(xk), por lo que hay que elegir un paso de iteración más pequeño. Hay que procurar también que este paso no sea demasiado pequeño (en el intervalo, por ejemplo, comprendido entre αj y αu), de otro modo, los movimientos en la dirección x tenderán a cero antes de que la función converja. Para lograr este propósito se hace una interpolación cuadrática para α, definiendo una función de interpolación φq(α) basada en tres parámetros: el valor de φ(x) en un punto base, xk, en el nuevo punto de iteración, xk + αpk, y la pendiente en el punto base, ∂φq(0)/ ∂α =-2 φ( xk). La minimización de φq(α) se puede hacer analíticamente, de modo que se llega a un valor de α ( denominado αq) que normalmente se encuentra dentro del intervalo antes mencionado. Basándose en estas propiedades, se describe a continuación el algoritmo de búsqueda de la línea de Armijo, ello requiere sustituir el paso 3 del algoritmo de Newton detallado en el apartado 2. MÉTODO DE BÚSQUEDA DE LA LÍNEA DE ARMIJO
a.
Hacer α = 1
b.
Evaluar φ( x k + αp k )
c.
Si φ( x k + αp k ) − φ( x k ) ≤ −2δαφ( x k ) , el intervalo es el correcto. Hacer x k +1 = x k + αp k e ir al paso 4 en el algoritmo de Newton. En caso contrario continuar con el paso d.
d.
Hacer λ=max{η, αq}, donde α q = αφ( x k ) α q =
αφ( x k ) (2α − 1)φ( x k ) + φ( x k + αp k )
hacer α=λα y volver al paso b. Típicamente, δ = η = 0.1. Este procedimiento proporciona robustez y confianza al método de Newton, especialmente si el valor inicial está lejos de la solución real. Sin embargo, si no se encuentra la longitud del paso después de 5 iteraciones por este algoritmo, la dirección del método de Newton, pk puede ser no adecuada debido al mal planteamiento del problema (por ejemplo, porque J(xk) sea casi singular). Ello llevaría al fracaso del método de búsqueda, recomendándose en este caso la inspección de las ecuaciones del problema. En el caso extremo de que J(xk) sea singular, entonces no existiría el paso del método de Newton y el algoritmo de Newton no se podría aplicar. En este caso se pueden adoptar las estrategias para resolver el problema que se detallan a continuación. Ejemplo: Sea la función : f ( x ) = 0.05 x 4 − 3 La derivada de la función será
df ( x )
dx
= 0 .2 x 3
Y de acuerdo con el método de Newton, el siguiente punto se obtendrá mediante la expresión:
144
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
x k +1 =
f (xk ) df ( x ) dx k
De este modo se pueden calcular los nuevos valores de x mediante un número de iteraciones que se muestran en la siguiente tabla, que implican el valor de la función, la derivada, y el nuevo valor calculado. k 0 1 2 3 4 5 6 7
x 10 7.515 5.672 4.336 3.436 2.947 2.796 2.783
f(x) 497 156.473 48.736 14.672 3.969 0.770 0.057 0.000
df(x) 200 84.882 36.488 16.303 8.113 5.118 4.373 4.312
xk+1 7.515 5.672 4.336 3.436 2.947 2.796 2.783 2.783
Este mismo proceso de iteración que se describe numéricamente en la tabla, se muestra gráficamente en la siguiente figura:
3.3. Singularidad del Jacobiano. Modificación del paso del método de Newton
Si el Jacobiano es singular o casi singular, en cuyo caso el problema está mal planteado, el paso del método de Newton es casi ortogonal a la dirección del gradiente máximo para la función φ(x). La dirección del gradiente máximo está definida como -∇φ(x) y, para un paso pequeño, el gradiente da la máxima reducción para la función φ(x). Como resultado, se podría considerar el gradiente máximo en vez de la dirección de Newton, cuando la dirección de Newton no es la adecuada. El gradiente máximo viene dado por la siguiente expresión: p sd = −∇φ( x k ) = J ( x k ) T f ( x k ) Este paso tiene la propiedad de ser el gradiente máximo, pero solamente una velocidad lineal de convergencia que viene definida por: 145
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
x k − x * < x k −1 − x * Una ventaja de los métodos del gradiente máximo es que siempre que p sd = − J ( x k ) T f ( x k ) ≠ 0 se tendrá un nuevo punto más cerca de la solución, incluso si la matriz J es singular. Sin embargo, este método puede ser muy lento. Un método de compromiso para llegar a la solución es combinar métodos de gradiente máximo y de Newton. Dos de estas estrategias son el método de Levenberg-Marquardt y el método de la “pata de perro” de Powell. En el primero se combinan ambos pasos y se resuelve el siguiente sistema lineal de ecuaciones para encontrar la dirección de avance.
(J ( x
)
) J ( x k ) + λI p k = − J ( x k ) T f ( x k )
k T
siendo λ un escalar positivo que ajusta la dirección y la longitud del paso. Para λ = 0 se obtiene directamente el método de Newton.
(
p k = − J ( x k )T J ( x k )
)
−1
J ( x k ) T f ( x k ) = − J ( x k ) −1 f ( x k )
En el otro extremo, si λ se hace grande, y domina sobre J(xk)T J(xk), el sistema de ecuaciones se aproxima a : p k = −(λI ) J ( x k ) T f ( x k ) = − J ( x k ) −1 f ( x k ) / λ −1
que es el paso del método del gradiente máximo, con un tamaño de paso muy pequeño. Valores intermedios de λ dan direcciones de avance que están comprendidas entre el arco definido por el gradiente máximo y el paso de Newton, tal y como se muestra en la figura 2a. Una desventaja del método de Levenberg-Marquardt es la necesidad de resolver un sistema de ecuaciones lineales cada vez que se cambia λ. Esto puede resultar costoso, ya que el algoritmo puede necesitar varios cálculos de λ antes de tener el paso de iteración apropiado. En vez de esto se considera un algoritmo que combina el método de Newton y el del gradiente máximo y elige una dirección de avance entre los das métodos automáticamente. Este método denominado “pata de perro” se ilustra en la figura 2b y fue desarrollado por Powell. Este método utiliza un paso que es combinación lineal del paso del método de Newton y el del gradiente máximo. Si el paso calculado es menor que el del gradiente máximo, se tomará este último como paso de la iteración. Para desarrollar este método se necesita primero encontrar la longitud adecuada (dado por un escalar β) en la dirección del gradiente máximo. p sd = J T f ( x k ) Se considera entonces la minimización de una función cuadrática que se construye de la linealización de las ecuaciones en la dirección del gradiente máximo.
(
Minβ 1 / 2 f ( x k ) + βJp sd
) ( f (x T
k
) + β Jp sd
)
Sustituyendo la definición dada para el método del gradiente máximo:
[
][
]
β = f ( x k ) T JJ T f ( x k ) / f ( x k ) T J ( J T J ) J T f ( x k ) = p sd
146
2
/ Jp sd
2
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
Fig. 2a. Método Levenberg-Marquardt (Biegler et al., 1997)
Fig. 2b. Método “pata de perro” de Powell (Biegler et al., 1997)
El paso psd se conoce como paso de Cauchy. Se puede demostrar que la longitud de este paso nunca es superior a la longitud del paso de Newton: pN = -J-1 f(xk). Para una fracción de longitud de paso deseada γ, se puede calcular la dirección de avance para el método “pata de perro” de Powell. Si se desea ajustar la fracción de la longitud γ automáticamente, la dirección de avance, p, se puede determinar de la siguiente manera: Para γ ≤ β p sd , p = γp sd / p sd Para γ ≥ p N , p = p N Para p N > γ > β p sd , p = ηp N + (1 − η)β p sd
(
)(
siendo η = γ − β p sd / p N − β p sd
)
Si la fracción de la longitud de paso γ es pequeña, se elige la dirección del gradiente máximo; si es grande, se elige el paso de Newton. Para valores de γ entre los pasos de Newton y Cauchy, se elige una combinación lineal de estos pasos, como se ha mostrado en la figura 2. Como esta aproximación se necesitan solamente dos direcciones predeterminadas y cálculos sencillos para la determinación del tamaño del paso, y es más rápido que el método de Levenberg-Marquardt. Incluso en los casos en los que el jacobiano está mal condicionado, y consiguientemente el paso de Newton se hace demasiado largo, este método sencillamente se autorregula considerando pasos de Cauchy con fracciones de longitud γ. Finalmente, debe mencionarse que las aproximaciones de ambos métodos se agrupan en una clase general de algoritmos denominada métodos de la región de confianza. Para estos problemas, la fracción de la longitud del paso γ corresponde al tamaño de la región alrededor del punto xk en la que la aproximación cuadrática de p (basado en una linealización de f(x), esto es ½(f(xk + J p)T (f(xk) + J p)) es una representación apropiada de φ(x). Una minimización aproximada de este modelo cuadrático necesita el ajuste bien de λ, bien de η para cada iteración en los métodos de Levenberg-Marquardt o de Powell, respectivamente.
147
Métodos de resolución de ecuaciones no lineales I: Métodos tipo Newton
Mientras que los métodos de la región de confianza pueden ser más costosos que la estrategia de la búsqueda de la línea de Armijo, poseen una mayor capacidad de convergencia, particularmente para aquellos problemas con problemas de condicionamiento inicial. 3.4. Métodos de continuación: tratamiento de la singularidad del Jacobiano
Para jacobianos singulares o mal condicionados de partida, se pueden tener en cuenta los métodos de continuación. Estos métodos, a diferencia de los métodos de la región de confianza, no se resuelven forzando la función f(x) a cero. En su lugar, se evalúa la función para un valor inicial f(x0) y se resuelve un problema incluso más simple, por ejemplo f(x) –0.9 f(x0) = 0. Se espera que este planteamiento no precise un cambio excesivo para x, de tal modo que el método de resolución (por ejemplo, Newton) no tenga dificultades a la hora de resolverlo. Si se llega a solucionar el problema modificado con 0.9, se reduce este parámetro de continuación a 0.8 y se repite la resolución del problema. Finalmente, reduciendo el parámetro a 0, se logra resolver el problema original. Con esta aproximación hay que tener en cuenta dos aspectos: •
La rapidez en la reducción del parámetro de continuación
•
El coste de este método en comparación con los vistos previamente.
El uso de un parámetro fijo es una forma algebraica del método de continuación. Existen diferentes modificaciones al método que incluyen por ejemplo, alternar el parámetro de continuación con una variable, en el momento en el que se detecta un jacobiano singular. La sustitución de este parámetro puede dar lugar a un jacobiano no singular, de tal modo que se incrementa la posibilidad de éxito en problemas más difíciles, aunque no sin un aumento del coste computacional.
4. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
148
II.
Simulación de procesos en la industria química y de procesos: HYSYS
Métodos de resolución de ecuaciones no lineales II: métodos que no requieren derivadas José Ramón Álvarez Saiz Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
ÍNDICE 1. INTRODUCCIÓN ....................................................................................................151 2. MÉTODO DE LA SECANTE .................................................................................151 3. MÉTODO DE BROYDEN. CASO MULTIVARIABLE.......................................152 4. MÉTODOS DE PRIMER ORDEN.........................................................................155 5. MÉTODOS DE SUSTITUCIÓN DIRECTA..........................................................156 6. MÉTODOS DE RELAJACIÓN..............................................................................157 6.1. Método del valor propio dominante (DEM)........................................................157 6.2. Método de Wegstein ............................................................................................158 7. BIBLIOGRAFÍA ......................................................................................................161
1. INTRODUCCIÓN Los métodos considerados hasta ahora requieren el cálculo del jacobiano en cada iteración. Este proceso es probablemente el que más tiempo de cálculo consume para algunos problemas, especialmente si hay procedimientos no lineales anidados. Una alternativa sencilla al cálculo exacto de las derivadas es la aproximación por el uso de diferencias finitas, dado de manera genérica por: ⎛ ∂f ⎜ ⎜ ∂x ⎝ j
(
) ( )
⎞ f x k + he j − f x k ⎟ = ⎟ h ⎠ xk
en donde cada elemento i del vector ej viene dado por (ej)i = 0 si i ≠ j o (ej)i = 1 si i = j, y h es un escalar cuyo valor normalmente se encuentra entre 10-6 y 10-3. Esta aproximación requiere una evaluación/iteración de n funciones adicionales. Por otro lado, se pueden considerar los métodos Quasi-Newton donde el jacobiano se aproxima mediante diferencias de x y de f(x) obtenidas de iteraciones previas.
2. MÉTODO DE LA SECANTE En el caso de los métodos Quasi-Newton, hay una fuerte motivación para evitar la evaluación (y descomposición) del jacobiano. El fundamento de estos métodos se puede comprender considerando una única ecuación con una única variable, tal y como se muestra en la Fig. 1:
151
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
f(x)
xc xd
xb
xa
x
Fig. 1. Comparación del método de Newton y el de la secante para una única ecuación (adaptado de Biegler et al., 1997) Si se aplica el método de Newton al sistema comenzando desde xa, se obtiene un nuevo punto xc a partir de la tangente a la curva en el punto xa, como se muestra en la Fig. 1, que responde a la relación: Paso de Newton: x c = x a − f ( x a ) / f ' ( x a ) Donde f’(x) es la pendiente. Si no se dispone de esta derivada, se puede realizar una aproximación mediante diferencias entre dos puntos, por ejemplo, xa y xb. En la Fig. 1, el nuevo punto calculado sería xd resultado de prolongar la secante entre los puntos xa y xb. La expresión para obtener xd sería: ⎡ ⎤ xb − xa Paso de secante: x d = x a − f ( x a ) ⎢ b a ⎥ ⎣ f (x ) − f (x )⎦
Incluso se puede definir una relación general para la secante, de tal modo que para un escalar B, se tiene: B( x b − x a ) = f ( x b ) − f ( x a ) x d = x a − B −1 f ( x a ) ya que f(xd) = 0 El método de la secante se recomienda en simulación de procesos para especificaciones generadas por el usuario dentro del diagrama de flujo y resuelve una especificación de cada vez. Este método es adecuado si la función a resolver es discontinua y no monotónica, o bien plana, en un determinado intervalo.
3. MÉTODO DE BROYDEN. CASO MULTIVARIABLE En el caso multivariable, se necesitan considerar condiciones adicionales para obtener el paso mediante la secante. En este caso se define una matriz B que sustituye al jacobiano y que satisface la relación de la secante, de tal modo que: B k +1 ( x k +1 − x k ) = f ( x k +1 ) − f ( x k ) 152
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
y suponiendo que f(xk+1) ≈ 0, Bk se puede emplear para calcular el cambio en x:
( ) f (x )
x k +1 = x k − B k
−1
k
Sin embargo, para el caso multivariable, la secante no es suficiente para definir B. En este caso, dada una matriz Bk, se calcula el menor cambio para Bk+1 respecto de Bk que satisface la ecuación de la secante. Este es un problema de minimización con restricciones que se puede formular del siguiente modo: Min B k +1 − B k
F
sujeto a la restricción: B k +1 s = y siendo:
(
) ( )
y = f x k +1 − f x k
s = x k +1 − x k y ||B||F es la norma de Frobenius dada por la expresión:
[∑ ∑ B ] i
j
1/ 2
ij
Este problema se puede plantear y resolver más fácilmente con variables escalares. Sean bij tales que:
( )
(
bij = B k ij , bij = B k +1
)
ij
e yi, y si los elementos de los vectores y y s, respectivamente. Entonces se tiene: Min
∑∑ (b
ij
i
j
− bij )
2
sujeto a:
∑b s ij
j
= y i i = 1,...n
j
Se pretende encontrar los mejores valores de bij que componen los elementos de la nueva matriz Bk+1. Este es un problema de optimización estrictamente convexo que tiene un mínimo único. Construyendo la función de Lagrange correspondiente: ⎛ ⎞ 2 L = ∑ ∑ (bij − bij ) + ∑ i λ i ⎜⎜ ∑ bij s j − y i ⎟⎟ i j i ⎝ j ⎠
Las condiciones estacionarias de dicha función son: ∂L
∂bij
= 2(bij − bij ) + λ i s j = 0
⇒
bij = bij − λ i s j / 2
para encontrar λi se aplica la relación de la secante de nuevo: y i = ∑ bij s j = ∑ bij s j − j
j
λi 2
∑s
2 j
153
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
λi = 2
∑b s − y ∑s ij
j
i
2 j
Sustituyendo ahora λi/2 en la condición estacionaria para bij y escribiendo en notación matricial se llega a la fórmula de Broyden: B k +1 = B k +
( y − B s )s k
T
sT s
Mediante esta relación se puede calcular la nueva dirección de avance mediante la resolución del sistema lineal de ecuaciones:
(
B k +1 p k +1 = − f x k +1
)
Sin embargo, también se puede calcular pk+1 de manera explicita mediante la actualización de la inversa de Bk+1 mediante una modificación de la fórmula de Broyden. Para este caso, se aplica la fórmula de Sheman-Morrison-Woodbury para una matriz cuadrada A con un conjunto actualizado de vectores x y v:
(A + xv )
T −1
= A −1 −
A −1 xv T A −1 1 + v T A −1 x
como la matriz xvT tiene solo un valor propio (eigenvalor) positivo, tiene un rango igual a uno, denominándose la relación (A + xvT) una actualización de A de rango uno. Si se tiene en cuenta que: A = Bk
(
)
A + xv T = B k +1
x = y − B k s / sT s
v=s
simplificando se tendrá que si Hk = (Bk)-1 H k +1 = H k +
(s − H y )s k
T
Hk
sT H k y
El algoritmo completo de Broyden se puede establecer de la siguiente manera: 1. Suponer x0 y B0 (por ejemplo = J0 o I) y calcular H0 ( por ejemplo (J0)-1) 2. Si k = 0, ir al paso 3, si no, calcular f(x k), y = f(x k) – f(x k-1), s = x k – x k-1 y Hk o Bk 3. Calcular la dirección de avance como pk = Hk f(x k) o resolviendo Bkpk = -f(x k) 4. si ||pk||≤ ε1 y ||f(xk)||≤ ε2 detener el proceso, si no, encontrar un paso α y actualizar las variables de modo que xk+1 = xk +α pk 5. Establecer k = k+1. Ir al paso 2 El método de Broyden se ha utilizado ampliamente en la simulación de procesos, especialmente cuando el número de ecuaciones es relativamente pequeño. Por ejemplo, este método se usa para cálculos flash por el método “inside-out” y para convergencia de recirculaciones en diagramas de flujo. Las fórmulas actualizadas de rango uno para el método 154
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
de Broyden que aproximan el jacobiano aseguran convergencia rápida. De hecho, el método converge de manera superlineal de acuerdo con la expresión: lim
k →∞
x k +1 − x * xk − x *
→0
que es más lento que el método de Newton, pero significativamente más rápido que el del gradiente máximo. Por otro lado, tanto Hk como Bk son generalmente matrices densas, aunque recientes estudios han considerado la utilización de fórmulas de actualización que se benefician de estructuras menos densas. Además, también es posible que ambas matrices puedan estar mal condicionadas inicialmente (independientemente) a través de las actualizaciones de rango uno. Para evita esto, se puede emplear un proceso de actualización más estable mediante factores de descomposición de la matriz Bk. En particular, las fórmulas de actualización de Broyden se han desarrollado para los factores LU o los factores QR de Bk. Finalmente, no hay garantía de que el método de Broyden produzca una dirección de descenso de la función. Como resultado, la inecuación de Armijo puede no satisfacerse incluso aunque se apliquen métodos de búsqueda de línea. Sin embargo, muchas implementaciones en ingeniería de procesos utilizan simplemente los pasos completos de Broyden, a no ser que los residuos aumenten mucho su valor. El método de Broyden es muy útil en la convergencia de bucles de recirculación, cuando se especifican una o más especificaciones de diseño o cuando se tienen ambos requerimientos simultáneamente. La aplicación del método de Broyden puede romper el comportamiento oscilatorio que a veces se observa en la convergencia, tal y como se muestra en la Fig. 2.
Fig. 2. Oscilación en la convergencia
4. MÉTODOS DE PRIMER ORDEN Estos métodos no calculan o aproximan la matriz jacobiana y tienen una estructura mucho más simple. Sin embargo, convergen a velocidad lineal, lo que puede resultar demasiado lento en algunos casos. 155
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
Estos métodos se desarrollaron con el formato de punto fijo, x = g(x), donde x y g(x) son vectores de variables de n corrientes. Estos métodos se utilizan a menudo en la convergencia de las corrientes de recirculación, siendo normalmente x una estimación inicial de la corriente, y g(x) el valor calculado después de realizar los cálculos de las unidades conectadas por el diagrama de flujo hasta volver a la corriente de recirculación (después de un paso completo por el diagrama de flujo).
5. MÉTODOS DE SUSTITUCIÓN DIRECTA El método más sencillo para el modo del punto fijo es el de sustitución directa. En este caso se define xk+1 = g(xk), con un valor inicial estimado de x0. Se considera una expansión en serie de Taylor de la función g (x): T
⎛ ∂g ⎞ g x k = g x k −1 + ⎜ ⎟ x k − x k −1 + ... ⎝ ∂x ⎠ x k −1
( ) (
)
(
)
Si se supone que ∂ g /∂x ≠0, por lo que éste es el término dominante cerca de la solución x*. Si se supone también que es prácticamente constante cerca de la solución, entonces: x
k +1
( ) (
−x =g x −g x k
k
k −1
)
T
⎛ ∂g ⎞ =⎜ ⎟ x k − x k −1 k − 1 x ∂ ⎝ ⎠x
(
)
y en consecuencia para: x
k +1
− x = ∆x k
k +1
= Γ∆x
k
⎛ ∂g ⎞ Γ=⎜ ⎟ ⎝ ∂x ⎠
T
se pueden escribir las expresiones de la norma:
∆x k +1 ≤ Γ ∆x k A partir de esta expresión se puede demostrar que la convergencia es lineal, pero la velocidad de las iteraciones depende de ||Γ||. Si se utiliza la norma euclídea, entonces ||Γ|| = |λ|max, que es el mayor valor propio de Γ, de tal modo que para las iteraciones se tendría:
(
∆x k +1 ≤ λ
) ∆x
max k
0
Una condición necesaria y suficiente para que el método converja es que |λ|max <1. Esta relación se conoce como una contracción “mapping” si |λ|max <1. Es más, la velocidad de convergencia depende de la proximidad de |λ|max a cero. El número de iteraciones (niter) para llegar a ||∆x|| < δ (una tolerancia cercana a 0) se puede estimar mediante la expresión:
[
]
niter ≥ ln δ / ∆x 0 / ln λ
max
Por ejemplo, si δ = 10-4 y ||∆ x 0|| = 1, se tienen el siguiente número de iteraciones:
|λ|max = 0.1, n = 4 156
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
|λ|max = 0.5, n = 14 |λ|max = 0.99, n = 916 Este método asegura una convergencia lenta pero segura. Es un método útil en el caso de que otros métodos aplicados sean inestables. Se utiliza sobre todo en la convergencia de recirculaciones. En las Figs. 3a y 3b se muestra la diferencia entre una convergencia rápida y otra más lenta
Fig. 3a. Convergencia rápida
Fig. 3b. Convergencia lenta
6. MÉTODOS DE RELAJACIÓN Para problemas donde |λ|max es próximo a 1, la sustitución directa como se ha visto, tiene una convergencia muy lenta. Para evitar este fenómeno se modifica el punto o valor de la función g(x) de modo que se reduce |λ|max. El objetivo de este método es modificar la función de manera que:
( )
( )
x k +1 = h x k ≡ ϖg x k + (1 − ϖ )x k donde ω se adapta dependiendo de los cambios en x y g(x). Los dos métodos más utilizados para la convergencia de las recirculaciones son el método del valor propio dominante (DEM) y el método iterativo de Wegstein. 6.1. Método del valor propio dominante (DEM)
Para este método se estima el valor de |λ|max mediante la relación:
λ
max
≈
∆x k ∆x k −1
después de, por ejemplo, 5 iteraciones. A partir de la transformación de la ecuación del punto fijo se tiene:
( ) (
)
∆x k +1 = x k +1 − x k = h x k − h x k −1 ≈
∂h k x − x k −1 = Φ x k − x k −1 ∂x
(
)
(
) 157
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
siendo Φ = ∂h/∂x = ωΓ+(1-ω)I. Se estima el factor de relajación ω de tal modo que se minimiza |λ|max para Φ. Si ω = 1 se tiene el método de sustitución directa, para valores de comprendidos entre 0 y1 se tiene una interpolación, y para ω>1 se tiene una extrapolación. Para elegir un valor óptimo de ω se considera el mayor valor propio para Φ, dado por:
(Φ − θI ) = 0 sustituyendo el valor de Φ, se llega a:
[ϖ(Γ − (ϖ − 1 + θ) / ϖI )] = 0 A partir de esta expresión se deduce que (ω-1+θ)/ω corresponde al valor propio de Γ y entonces θ = 1 +ω(λ-1). Para encontrar |θ|max es preciso calcular el mayor y el menor de los valores propios de Γ, así como el factor de relajación. De hecho, representando |θ|max frente a ω se puede demostrar que el óptimo ω* tiene lugar cuando:
(1 + ϖ(λ
min
)) = (1 + ϖ(λ
−1
2
max
))
−1
2
(
→ ϖ* = 2 / 2 − λmax − λmin
)
λmax se puede calcular a partir de los cambios en x, aunque λmin no es tan fácil de determinar, y para el método del valor propio dominante(DEM) se ha de hacer una suposición muy importante que implica que λmax, λmin >0 y que λmax ≈ λmin. En definitiva, se llega a que ω*=1/(1-λmax). Es importante destacar que si se modifica esta suposición, y que los valores propios máximo y mínimo de Φ son muy diferentes, el método no converge. Esta aproximación se ha hecho extensiva al método generalizado del valor propio dominante (GDEM) en el que se estiman varios valores propios para la determinación del siguiente paso de iteración.
6.2. Método de Wegstein
Por otro lado, el método de Wegstein calcula el factor de relajación aplicando un método de la secante independientemente para cada componente de x: k −1 i
( ) f (xx ) −− xf (x ) k i k
x ik +1 = x ik − f i x k
k −1
i
i
Si se definen k
k
k
fi(x ) = x – gi(x )
( )
y
se tiene: k −1 i
( ) f (xx ) −− xf (x ) k i k
x ik +1 = x ik − f i x k
k −1
i
[ [
k i
i
( )]
= x − x − gi x k i
k
( )] x
= x ik − x ik − g i x k 158
x ik − x ik −1 x ik − g i x k − x ik −1 + g i x k −1
( )
k i
(
x ik − x ik −1 − x ik −1 + g i x k −1 − g i x k
(
)
(
g i x k − g i x k −1 si = x ik − x ik −1
)
( )
)
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
[
( )]1 −1 s
= x ik − x ik − g i x k
i
( )
= ϖ i g x k i + (1 − ϖ i )x ik donde ωi = 1/[1 – si]. Esta aproximación funciona adecuadamente en diagramas de flujo en los que los componentes no interaccionan excesivamente (por ejemplo, reactores sin recirculación). Las interacciones debidas a bucles de recirculación pueden generar dificultades a este método. Para garantizar un funcionamiento estable, los factores de relajación de ambos métodos, DEM y Wegstein, se acotan y se evitan extrapolaciones excesivamente grandes. Los algoritmos mencionados en este apartado 6 se pueden resumir en los siguientes pasos: 1. Comenzar con una estimación de x0 y g(x) 2. Realizar un número finito de iteraciones (normalmente entre 2 y 5) y comprobar la convergencia en cada iteración 3. Método del valor propio dominante: Aplicar la aceleración ω*=1/(1-λmax) con un valor acotado de ω para encontrar el siguiente punto y volver al paso 2. Método de Wegstein: Aplicar la aceleración: ωi = 1/[1 – si]. Para un valor acotado de ωi para encontrar el siguiente punto. Iterar hasta convergencia.
Se muestra a continuación un ejemplo para ilustrar la aplicación de los métodos de primer orden, en el que se destaca el funcionamiento del método y la velocidad de convergencia.
Ejemplo: Resolver el sistema:
(
x 1 = 1 − 0.5 exp 0.7(1 − x 2 )
−1
)
x 2 = 2 − 0.3 exp (0.5(x 1 − x 2 ))
Utilizando el método de sustitución directa, comenzando por x1 = 0.8 y x 2 = 0.8, se estima el valor propio máximo mediante una secuencia de iteraciones La sustitución directa implica: xk+1 = g(xk), obteniéndose las siguientes iteraciones: k 0 1 2 3 4 5 6
x1k 0.8 0.9248 1.10378 1.02478 1.0368 1.04284 1.038503
x2k 0.8 1.3323 1.0726 1.10933 1.12796 1.11447 1.11778
Este método converge hacia x1 = 1.03957 y x2 = 1.11756 en 7 iteraciones con ||∆xk|| < 10-3. A partir de estas iteraciones se puede estimar el máximo valor propio mediante: 159
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
|λ|max = ||x5 – x4||/|| x4 – x3|| = 0.6666 También a partir de ||∆x5|| = 0.01478 y δ = 10-3 se puede estimar el número de iteraciones necesarias para del método de sustitución directa: niter = ln(δ/||∆x 5||) / ln |λ|max = 7
El método de Wegstein es el más rápido y fiable para la convergencia de recirculaciones. Es aplicable a cualquier número de corrientes y presenta la posibilidad de ajuste de parámetros tales como cota superior e inferior y la aceleración del paso de iteración. En la Fig. 4. se muestra gráficamente la aproximación del método de Wegstein, en la Fig. 5 se muestra una ventana de HYSYS donde se pueden introducir los parámetros de este método
Fig. 4. Convergencia del método de Wegstein
Fig. 5. Ventana de dialogo de HYSYS para el ajuste de parámetros del método de Wegstein
160
Métodos de resolución de ecuaciones no lineales II: Métodos que no requieren derivadas y de primer orden
7. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
161
II.
Simulación de procesos en la industria química y de procesos: HYSYS
Recirculaciones: partición y seccionado de corrientes Susana Luque Rodríguez Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Recirculaciones: partición y seccionado de corrientes
ÍNDICE 1. INTRODUCCIÓN ....................................................................................................165 2. PARTICIONADO (PARTITIONING).....................................................................166 3. SECCIONADO (TEARING)....................................................................................168 4. EFECTO DE LAS ESTRATEGIAS DE SECCIONADO SOBRE LOS MÉTODOS TIPO NEWTON ..................................................................................175 5. DESCOMPOSICIÓN PARA SIMULACIÓN ORIENTADA A ECUACIONES 177 6. BIBLIOGRAFÍA ......................................................................................................178
1. INTRODUCCIÓN En este tema se van a abordar tres aspectos relacionados con la topología de los diagramas de flujo y las recirculaciones: particionado (partitioning), establecimiento de orden para resolución (precedence ordering) y seccionado de corrientes (tearing). Para definir estos conceptos usaremos un diagrama de flujo ejemplo de la bibliografía (Biegler et al., 1997, p. 272), mostrado en la figura 1, el cual queremos resolver de la forma más eficaz posible.
Figura 1. Diagrama de flujo ejemplo para el particionado y establecimiento de orden (Biegler et al., 1997). 165
Recirculaciones: partición y seccionado de corrientes
2. PARTICIONADO (PARTITIONING) En el diagrama de flujo de la figura 1, las unidades A, B, C, D y E se encuentran en un bucle (con recirculación) y, por lo tanto, tendrán que ser calculadas conjuntamente. Observando con detalle, se puede concluir que las unidades F y G también se tienen que añadir al grupo anterior, que se puede resolver en primer lugar, dado que no hay recirculaciones de otras unidades del diagrama de flujo hacia ninguna de estas unidades. Las unidades que se resuelven como un grupo se llaman particiones, y encontrarlas se denomina particionado o “partitioning” mientras que el orden en que se deben resolver se conoce como “precedence ordering”. El agrupamiento es único, mientras que el orden puede no serlo y depende del diagrama de flujo particular. El ejemplo es sencillo y no va a haber muchos problemas en buscar las particiones y evaluarlas. Sin embargo, algunos diagramas de flujo tienen cientos de unidades y estas tareas son más difíciles. Para ello, existe un algoritmo que se va a aplicar en este ejemplo. Se puede empezar por cualquier unidad, por ejemplo, la unidad I, y ésta se pone en una lista, llamada lista 1: Lista 1: I La lista se extiende siguiendo las corrientes de salida a partir de la última unidad de la lista y continuando hasta que se encuentra una unidad repetida o bien no hay más corrientes. En el ejemplo, I tiene una corriente de salida que entra en J, la cual a su vez tiene una corriente de salida que va a L y así sucesivamente, obteniéndose la siguiente lista: Lista 1: IJKLMNL Sin embargo, la unidad L se repite en la secuencia, lo cual indica la existencia de un bucle que va de L a M, de M a N y de N de nuevo a L. Por lo tanto estas unidades deben estar en un grupo, por lo que se unen y consideran como una entrada única en la lista 1. Lista 1: IJK {LMN} Se continúa trazando el camino con corrientes de salida: Lista 1: IJK {LMN} OPK Y de nuevo se observa una unidad (K) que se repite, existiendo un bucle desde K al grupo {LMN} a través de O, P y K, agrupando todas estas unidades en un bucle, la lista 1 tiene el aspecto siguiente: Lista 1: IJ{KLMNOP} y continuamos, para obtener: Lista 1: IJ{KLMNOP}SQRJ Donde nuevamente se repite la unidad J: Lista 1: I{JKLMNOPSQR} En este punto no hay unidades del último grupo de las que salgan corrientes hacia otras unidades del diagrama de flujo. Se elimina este grupo de la lista 1 y se pasa a una segunda lista. (lista 2) Lista 2: {JKLNOPSQR} 166
Recirculaciones: partición y seccionado de corrientes
y esas unidades se eliminan del diagrama de flujo, puesto que su análisis ha concluido. Volviendo a la lista 1, ésta está constituida por la unidad I, que no ha sido enviada a la lista 2: Lista 1: I Y se buscan más corrientes de salida que no vayan a unidades ya eliminadas, observándose que no existe ninguna, por lo que la unidad I se elimina de la lista 1 y pasa a estar a la cabeza de la lista 2, eliminándola también del diagrama de flujo: Lista 2: I{JKLMNOPSQR} Lista 1: La lista 1 está vacía y para continuar se toma otra unidad cualquiera del diagrama de flujo restante y se coloca en la lista, por ejemplo, la unidad F: Lista 1: F Y nuevamente se continúa el trazado de corrientes de salida: Lista 1: FH y nuevamente se para, puesto que H no tiene más salidas (excepto a unidades que ya han sido eliminadas y puestas en la lista 2), por lo que se elimina de la lista 1 y se coloca a la cabeza de la lista 2: Lista 2: HI{JKLMOPSQR} Lista 1: F Comenzando meramente en la unidad F seguimos la lista 1: Lista 1: FGCDEABC Observándose que la unidad C se repite, por lo que se agrupa junto con las unidades que hay entre las dos apariciones de c: Lista 1: FG{CDEAB} Continuamos el trazado obteniendo: Lista 1: FG{CDEAB}F y agrupando F y G con las otras unidades se tiene: Lista 1: {FGCDDEAB} En este punto se observa que no hay más corrientes de salida, por que este grupo se elimina de la lista 1 y se coloca a la cabeza de la lista 2, eliminando también las unidades correspondientes del diagrama de flujo: Lista 2: {FGCDEAB}HI{JKLMNOPSQR} Lista 1: La lista 1 está vacía y ya no quedan más unidades en el proceso, con lo cual se ha acabado el análisis. La lista 2 es l lista de particiones con un orden de cálculo. Se puede resolver primero la partición {FGCDEAB}, luego la unidad H, a continuación la unidad I y finalmente la partición restante {JKLMNOPSQR}. El algoritmo funciona independientemente de la unidad con la que se empiece en la lista 1. Proporciona un conjunto de particiones (es decir, de unidades agrupadas) único. Sin embargo, 167
Recirculaciones: partición y seccionado de corrientes
el orden entre particiones puede variar, aunque ello no sucede en este ejemplo sencillo que se acaba de emplear.
3. SECCIONADO (TEARING) El siguiente paso es cómo se van a resolver las particiones que contienen más de una unidad. En el ejemplo hay dos. La primera es sencilla, por lo que se va a ilustrar la metodología de seccionado aplicada a la segunda (más grande), cuyo diagrama de flujo se muestra en la figura 2. En esta parte del diagrama de flujo se ven que en algunas unidades hay una sola corriente que entra y una sola que sale, por lo que éstas unidades se pueden eliminar, ya que no añaden nada a la topología del diagrama base, quedando el diagrama como se muestra en la figura 3.
Figura 2. La segunda partición del diagrama Figura 3. Reducción de la segunda partición de flujo de la figura 1. Todas las del diagrama de flujo mostrada en la corrientes y unidades que no figura 2. La reducción se consigue pertenecen a esta partición se han eliminando las unidades que tiene eliminado (Biegler et al., 1997). una sola entrada y una sola salida (Biegler et al., 1997). El diagrama se puede rescribir de forma esquemática y numerando las corrientes como se muestra en la figura 4. Comparando las figuras 2 y 3, se observa que si se decide seccionar la corriente 8 (la unión entre S y K) sería posible seleccionar para seccionar cualquier otra de las corrientes que hay en el camino ente ambas unidades. Para problemas pequeños como éste, es posible encontrar un buen sistema de seccionado mediante inspección directa, pero en diagramas más complejos se necesita un procedimiento sistemático. La selección de la(s) corriente(s) a seccionar es muy 168
Recirculaciones: partición y seccionado de corrientes
importante, porque el funcionamiento de los algoritmos de punto fijo depende en gran medida de dicha elección.
Figura 4. Topología de la partición de la figura 3 (Biegler et al., 1997). Con este objetivo se va a considerar inicialmente un método genérico sencillo, que posteriormente se utilizará para introducir otras metodologías habitualmente empleadas. El método trata el problema de elección de corrientes a seccionar como una optimización con variables binarias (0-1) o como una programación entera. Introducido en 1973, se conoce como “set covering problem” y permite una flexibilidad considerable en la selección del sistema deseado de corrientes seccionadas. Además, la formulación con variables enteras permite interpretar una gran variedad de métodos basados en la teoría gráfica de un modo compacto. La selección se trata como un problema de minimización (del número de corrientes o variables seccionadas) sujeto a la restricción de que se deben romper todos los bucles al menos una vez. El primer paso es la identificación de bucles, lo cual se ilustrará con el siguiente ejemplo.
Ejemplo: Búsqueda de bucles en la figura 4 Comenzamos con cualquier unidad en la partición; por ejemplo, la unidad K K − (1) → L − (2) → M − (3) → L Y observamos que L se repite, por lo que las dos corrientes 2 y 3 que conectan las dos apariciones de L se sitúan en una lista de bucles, denominada lista 3: Lista 3: {2, 3} Comenzamos de nuevo en la unidad justo antes del bucle y buscamos otros caminos alternativos: K − (1) → L − (2) → M − (3) → L │ (7) → S − (8) → K Ahora K se repite, por lo que se colocan las corrientes {1, 2, 7, 8} en la lista de bucles: Lista 3: {2, 3}, {1, 2, 7, 8}
169
Recirculaciones: partición y seccionado de corrientes Volvemos a S y buscamos un camino alternativo que salga de esta unidad, encontrando que no hay. En M sucede lo mismo. Si volvemos a L encontramos otro camino alternativo: K − (1) → L − (2) → M − (3) → L │ │ │ (7) → S − (8) → K │ (4) → O − (5) → K repitiéndose nuevamente K, por lo que se añade {1, 4, 5} a la lista de bucles: Lista 3: {2,3}, {1, 2, 7, 8}, {1, 4, 5} Volviendo a la unidad O en la última rama, es posible identificar otro camino alternativo: K − (1) → L − (2) → M − (3) → L │ │ │ (7) → S − (8) → K │ (4) → O − (5) → K │ (6) → S − (8) → K en la nuevamente se repite K, por lo que se coloca {1, 4, 6, 8} en la lista de bucles: Lista 3: {2,3}, {1, 2, 7, 8}, {1, 4, 5}, {1, 4, 6, 8} Volviendo a S, O, L y finalmente a K, se encuentra que ninguna de estas unidades tienen caminos alternativos saliendo de ellas. Dado que se ha regresado a la primera unidad de la lista, el análisis está completo y hay únicamente cuatro bucles en esta partición. Un listado de los mismos en una tabla de incidencias se muestra a continuación: Tabla 1.Tabla de incidencias de bucles para la partición Bucle 1 2 3 4
1 X X X
2 X X
3 X
Corriente 4 5 X X
6
7
8
X
X
X X
X
La tabla de incidencias es la base para una matriz, A, con elementos: aij = 1 si la corriente j está en el bucle i 0 en caso contrario De este modo, la estructura de la matriz es idéntica a la tabla de incidencias. Se define a continuación la selección de las corrientes a seccionar a través de una variable entera yj para cada corriente j. Los valores óptimos de estas variables determinan: yj = 1 si la corriente j se secciona 0 en caso contrario Para asegurar que cada bucle se rompe al menos una vez por seccionado de corriente, se escriben las siguientes restricciones para cada bucle i: 170
Recirculaciones: partición y seccionado de corrientes n
∑ a ij y j ≥ 1
i= 1, L
j =1
donde n es el número de corrientes y L el número de bucles. Una vez se dispone de las ecuaciones de los bucles, se formula una función objetivo coste para la sección de corrientes a seccionar: ∑wj yj j
y asignamos un valor wj al coste de seccionar la corriente j. Este coste frecuentemente lo dicta el tipo de problema de convergencia de recirculación. Los métodos más populares para ello son: •
wj = 1 (todas las corrientes iguales) lo cual permite minimizar el número de corrientes seccionadas. Esta opción origina que se obtengan muchos sistemas de corrientes seccionadas posibles. Es el caso más común.
•
wj = nj, donde nj es el número de variables en la corriente j.
•
wj = Σ aij (suma de las restricciones del bucle) el coeficiente que se obtiene indica el número de bucles que se rompen si se secciona la corriente j. Romper un bucle más de una vez origina un retraso en la iteración de variables en el algoritmo de punto fijo y un peor funcionamiento del mismo. Minimizando el número de bucles que se rompen simultáneamente se busca un sistema de ecuaciones de seccionado no redundante para mejorar el funcionamiento del algoritmo.
El “set covering problem” viene entonces dado por: n
Min ∑ w j y j yj
j =1
n
donde
∑ a ij y j ≥ 1
i=1–L
j =1
yj = {0, 1} La solución a este problema es combinatorial y una cota superior del número de alternativas es 2n. Sin embargo, con sencillas reglas de reducción se puede hacer este problema y el subsiguiente esfuerzo para su resolución mucho menor. Las reglas permiten aplicar el “set covering problem” sólo a las variables enteras que permanecen después de su reducción. Para facilitar la solución, la metodología más extendida es la de rama y acotamiento (Branch & Bound), aunque hay algoritmos más eficaces especializados para este tipo de problemas. Se define ri como el vector fila i de la matriz A y cj como el vector columna de la matriz A. Las siguientes propiedades permiten reducir el tamaño del problema: •
Si ri tiene solo un elemento distinto de 0, (ri)k, hacer yk = 1 y elegir la corriente k para seccionar. Se eliminan esta fila y columna, dado que es un bucle de una corriente consigo misma.
•
Si la fila k domina la fila l (todas las corrientes de l están también en k), entonces se borra rk (una corriente seccionada en rl automáticamente satisface rk). Es un bucle cubierto con otro bucle. 171
Recirculaciones: partición y seccionado de corrientes
•
Si ck domina cj y wk ≤ wj, o para algún grupo de columnas, S, ΣkεS ck domina cj y ΣkεS wk ≤ wj, entonces se puede eliminar la columna j, dado que yk siempre contendrá la solución óptima.
Estas reglas se aplican sistemáticamente para reducir la matriz de bucles. Si no proporcionan mejora es preciso iniciar una búsqueda combinatorial en las corrientes a seccionar restantes. No obstante, las soluciones óptimas generadas por este procedimiento de reducción y búsqueda no son únicas si las desigualdades en wj no son estrictas. En estos casos, este procedimiento encontrará un sistema óptimo de seccionadas, pero pueden existir otras soluciones que funcionen con una eficacia análoga. Para ilustrar la aplicación de estas reglas, se continuará con el ejemplo anteriormente visto
Ejemplo: Seccionado de corrientes Consideramos ahora la partición del diagrama de flujo del ejemplo anterior. De la tabla 1 se puede obtener la matriz de bucles directamente, como se muestra en la tabla 2: Tabla 2.Matriz de incidencia de bucles, A, para la partición de la figura 4 Bucle 1 2 3 4
1 1 1 1
2 1 1
3 1
Corriente 4 5 1 1
6
7
8
1
1
1 1
1
Para resolver este problema, se van a considerar dos casos posibles: 1.Minimización del número de corrientes a seccionar 2.Minimización del número de veces que se rompen los bucles y se van a emplear las propiedades de reducción en la matriz A. Caso 1. Minimización del número de corrientes a seccionar En este caso, se especifican todos los valores wj de las corrientes como la unidad. Tras inspeccionar la matriz A, se observa que no hay ninguna fila que domine, por lo que no es posible eliminar ninguna por ahora. Por otro lado, la columna 2 domina a la 3, la columna 4 domina a las columnas 5 y 6 y la columna 1 domina a las columnas 4, 7 y 8.Por lo tanto, eliminando las corrientes 3, 4, 5, 6, 7 y 8 se llega a la siguiente tabla reducida: Bucle 1 2 3 4
172
Corriente 1 2 1 1 1 1 1
Recirculaciones: partición y seccionado de corrientes A continuación, puesto que las filas 2 y 4 dominan a la fila 3, es posible eliminar dichas filas 2 y 4, y obtener una representación mínima del problema: Bucle 1 3
Corriente 1 2 1 1
Ambas filas tienen sólo un elemento y es preciso seleccionar las corrientes 1 y 2 para romper los bucles. Este es el mínimo número de corrientes a seccionar. Sin embargo, el bucle 2, con corrientes {1, 2, 7, 8} se rompe dos veces. Siguiendo la información de la figura 4, el primer paso sería suponer inicialmente los datos de la corriente 2 y luego calcular la unidad M, lo cual permite obtener la corriente 3, que junto con una estimación inicial de la corriente 1 permite calcular la unidad L. Continuando con el diagrama de flujo, se tiene que el orden de cálculo de las unidades es MLOSK, como se muestra a continuación:
Las consecuencias que esta selección tiene sobre la doble ruptura del bucle 2 (marcado con líneas gruesas) son evidentes. Para la resolución de esta partición, se han de estimar las corrientes 1 y 2 y se calculan el resto en el orden mostrado. El nuevo valor que la unidad L calcula para la corriente 2 influye en el siguiente cálculo de M, pero dicho cálculo se basa en el valor anterior de 1. El nuevo valor de 1 impactará en el siguiente cálculo de L pero no de la unidad M. En realidad, impacta L y todas las unidades siguientes cuando el cálculo se realiza la segunda vez. Su nuevo valor no afectará M hasta que calculemos esa unidad una tercera vez.. Esto retrasa la transmisión de información en este bucle un poco y reduce la velocidad de convergencia para la sustitución sucesiva. Caso 2. Minimización del número de veces que se rompen los bucles En este caso los valores de wj para la función objetivo vienen dados por wj = ∑i aij , que es la suma para cada corriente de los valores de su columna correspondiente. Dado que los wj son distintos, las reducciones de filas y columnas del caso anterior no son aplicables. En su lugar calculamos wj y adicionamos el valor a la información de la matriz A. Tabla 3.Matriz de incidencias, A, para la minimización del número de veces que se rompen los bucles Bucle 1 2 3 4
1 w1 = 3 1 1 1
2 w2 = 2 1 1
3 w3 = 1 1
Corriente 4 5 w4 = 2 w5 = 1 1 1
6 w6 = 1
7 w7 = 1
8 w8 = 2
1
1
1 1
1
No hay líneas dominantes de nuevo, pero hay combinaciones de columnas que dominan otras: •
Las columnas 3 y 7 dominan a la columna 2 [(w3 + w7) ≤ w2] 173
Recirculaciones: partición y seccionado de corrientes •
Las columnas 5 y 6 dominan a la columna 4
•
Las columnas 5, 6 y 7 dominan a la columna 1
•
Las columnas 6 y 7 dominan a la columna 8
Lo cual lleva a la siguiente matriz reducida:
Bucle 1 2 3 4
3 w3 = 1 1
Corriente 5 6 w5 = 1 w6 = 1
7 w7 = 1 1
1 1
Como hay solo un elemento en cada fila, se ha alcanzado una solución óptima (
∑ w j y j = 4 ) con las j
corrientes 3, 5, 6 y 7 que rompen cada bucle una sola vez. Sin embargo, hay varias soluciones óptimas en este caso. Por ejemplo, se pueden seccionar las corrientes 1 y 3, que por inspección también se ve que es una solución óptima. En realidad, tenemos una familia de soluciones óptimas: {1, 3}, {3, 5, 8}, {3, 5, 6, 7}, {2, 5, 6}, {2, 4}, {3, 4, 7}, siendo todas ellas no redundantes. Si elegimos la solución {1, 3}, se puede entonces calcular la unidad L, que proporciona las corrientes 2 y 4. A continuación, se pueden calcular las unidades O y M en cualquier orden, dando las corrientes 5, 6 y 7, lo cual permite calcular la unidad S y finalmente la unidad K.
El orden no es necesariamente único, puede ser LOMSK o bien LMOSK. Si decidimos resolver el diagrama de flujo por sustituciones sucesivas, se elige un grupo de corrientes a seccionar y se estiman inicialmente sus valores. Supóngase que se elige {1, 3}. En este caso se pueden calcular las unidades en el orden LOMSK, lo cual permite obtener nuevos valores de las corrientes 1 y 3. A continuación se usan éstos valores calculados comenzando de nuevo el cálculo LMOSK y repitiendo hasta lograr la convergencia. Estas familias de grupos de corrientes a seccionar (por ejemplo, {1, 3} y {3, 5, 6, 7}) proporcionan los mismos valores de las variables de las corrientes si se emplea un algoritmo de sustitución directa. También hay algoritmos basados en teoría gráfica para identificar las familias de grupos de variables a seccionar no redundantes, y -por lo tanto- para generar corrientes a seccionar que presentan una convergencia más rápida.
174
Recirculaciones: partición y seccionado de corrientes
4. EFECTO DE LAS ESTRATEGIAS DE SECCIONADO SOBRE LOS MÉTODOS TIPO NEWTON En último lugar, se va considerar el empleo un algoritmo de Newton o quasi–Newton en la convergencia de un diagrama de flujo en modo modular. Para ello se forma (o aproxima) la matriz jacobiana por las ecuaciones de las corrientes seccionadas. Se rescriben las ecuaciones:
x = g(x)
f(x) = x – g(x) = 0
donde x son valores de las corrientes seccionadas y g(x) es el valor calculado tras dar un paso por las unidades del bucle. Estas ecuaciones se resuelven mediante las iteraciones de Newton– Raphson o Broyden aplicadas a f (x) = 0. Un caso extremo para resolver las ecuaciones es seccionar todas las corrientes en los bucles. Aplicado al ejemplo que se ha analizado, por ejemplo, para la unidad K: S1 = G(S5, S8)
o bien F(S1, S5, S8) = S1 – G(S5, S8) = 0
En este caso, se define el vector SJ como los valores de la corriente J y G(*,*) representa funciones implícitas que relacionan las corrientes de salida de una unidad con las de entrada. Escribiendo ecuaciones análogas para todas las unidades se llega a obtener un sistema de ecuaciones de las corrientes. La linealización de dicho sistema leva a las ecuaciones que definen el paso de Newton, como se ha visto en los temas anteriores y se ilustra en la figura 5. En la matriz de las ecuaciones se observa que la diagonal es la matriz identidad mientras que los elementos que no están en la diagonal son los jacobianos ∂G ∂SI con respecto a las corrientes de entrada, SI. Para apreciar el efecto de la selección de corrientes a seccionar, una corriente que no ha convergido corresponde a FJ ≠ 0. Por otro lado, si una corriente se calcula directamente como salida de una unidad, el término de la derecha correspondiente es nulo. Por lo tanto, si se seccionan todas las variables, todos los elementos del término de la derecha en la figura 5 la derecha serían vectores no nulos. Si sólo se seccionasen 1 y 3, solo F1 y F3 serían no nulos, como se muestra en la figura 6.
Figura 5. Ecuaciones linealizadas para la partición del diagrama de flujo (Biegler et al., 1997). En el caso de que todas las unidades sean lineales, las estrategias de sustitución directa de primer orden siguen estando afectadas por la selección del sistema de corrientes seccionadas y por el acondicionamiento (y los valores propios) de las matrices unidad. Por otro lado, en un 175
Recirculaciones: partición y seccionado de corrientes
sistema lineal, el método de Newton converge en solo una iteración, independientemente de la localización de los elementos no nulos en la matriz de la derecha. A partir de esto es posible generalizar una observación importante: Mientras que todos los bucles de recirculación se rompan, la selección de las corrientes a seccionar tiene poca influencia en la velocidad de convergencia con los métodos de Newton o Broyden.
Figura 6. Ecuaciones linealizadas con S1 y S3 como corrientes seccionadas (Biegler et al., 1997). En este caso, un criterio razonable para la selección de corrientes a seccionar está basado en la reestructuración de las filas y columnas de la matriz de la figura 6 para identificar la estructura de una estrategia de convergencia de reciclo. En la aplicación de los métodos de Newton o Broyden, los elementos jacobianos de las unidades individuales puede que no estén disponibles directamente. En su lugar, se emplean aproximaciones por perturbaciones finitas diferenciales de las fórmulas quasi–Newton. Por ello, no es necesario mantener la estructura lineal de la matriz I. En su lugar, se separan las corrientes y ecuaciones a seccionar y se permutan el resto de las variables de corrientes y ecuaciones para obtener una forma de bloque triangular. Por ejemplo, si elegimos S1 y S3 y éstas se mantiene constantes, es fácil ver que las corrientes en la diagonal se pueden calcular directamente de corrientes que se determinan a partir de S1 y S3. Consecuentemente, S2, S4, S5, S6, S7 y S8 son funciones implícitas de S1 y S3 y pueden eliminarse simbólicamente del sistema de ecuaciones, lo cual resulta en un sistema a resolver mucho más pequeño, con solo las variables de corrientes S1 y S3. Dado que la matriz jacobiana se constituye por diferencias finitas, una metodología con menos variables es siempre más sencilla de implementación. Por ello, para los métodos de Broyden o Newton, es deseable obtener el mínimo número de variables de corrientes que rompen todos los bucles de recirculación.
176
Recirculaciones: partición y seccionado de corrientes
5. DESCOMPOSICIÓN ECUACIONES
PARA
SIMULACIÓN
ORIENTADA
A
Dado que la simulación orientada a ecuaciones considera el conjunto entero de ecuaciones del diagrama de flujo y adopta una estrategia simultánea para su resolución, parecería que no sería tan necesario el análisis de la estructura del diagrama de flujo. En realidad las estrategias de descomposición son una parte importante de este modo simultáneo, pero se introducen en una etapa posterior, durante la resolución de las ecuaciones. En estos casos, el método de Newton es el más eficaz y más habitualmente empleado para la resolución del sistema de ecuaciones. Además, se suelen introducir varias modificaciones del mismo, para asegurar la convergencia en un amplio intervalo de problemas no lineales. Sin embargo, a la vez que un problema de simulación orientado a ecuaciones se hace mayor, el coste computacional dominante corresponde a la evaluación del paso de Newton a través de la resolución de un sistema de ecuaciones lineales: (Jk) pk = - f(xk) Para problemas de diagramas de flujo a gran escala, se ha visto en los temas anteriores que las ecuaciones y la matriz J tiene una estructura dispersa. En problemas con más de unos pocos cientos de variables, es importante explotar esta estructura tanto para una eficaz descomposición de J y la subsiguiente resolución del sistema de ecuaciones lineales, como para el almacenamiento de la matriz descompuesta. De otro modo, si no se explota la estructura dispersa de la matriz para un sistema de n ecuaciones, el número de elementos a almacenar es n2 y el coste computacional para descomponer la matriz correspondiente es proporcional a n3. Consecuentemente, incluso para sistemas relativamente pequeños de 1000 variables y ecuaciones, el gasto computacional puede ser muy elevado. Por otro lado, si se tiene en cuenta que la mayor parte de estos elementos son nulos (y la descomposición se organiza de modo que permanezcan como valores nulos durante el proceso de resolución), entonces en muchos casos tanto el almacenamiento como el esfuerzo computacional para calcular el paso de Newton pueden llegar a crecer sólo linealmente con el tamaño del problema, en el mejor de los casos. En la actualidad existen varios algoritmos y paquetes informáticos excelentes fácilmente accesibles y aplicables de a los problemas de simulación de procesos. En general estos métodos se pueden clasificar en estructuras especializadas y generales. En el primero de estos tipos, se tiene matrices que presentan una estructura regular, la cual no cambia con el tamaño del problema; ejemplos de esto son matrices con los elementos no nulos agrupados alrededor de la diagonal, matrices aproximadamente diagonales y matrices con una estructura de bloque en sus bordes. Por otro lado, la descomposición de estructuras generales requiere un análisis previo de la estructura y determinación de la secuencia de descomposición que reduzca la aparición de nuevos elementos no nulos y no incremente las necesidades de almacenamiento. Con este objetivo se emplean reglas heurísticas, que se encuentran a su vez implementadas en las rutinas de cálculo. Como resultado, los algoritmos basados en el método de Newton para la resolución de sistemas de ecuaciones no lineales y los métodos de descomposición para la descomposición de la matriz dispersa del sistema lineal son aspectos clave en un simulador orientado a ecuaciones. 177
Recirculaciones: partición y seccionado de corrientes
6. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Scenna, N.J. (Ed.), “Modelado, Simulación y Optimización de Procesos Químicos”, Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica http://www.modeladoeningenieria.edu.ar
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
178
II.
Simulación de procesos en la industria química y de procesos: HYSYS
Simulación en diseño y operación de procesos. Aplicaciones Aurelio B. Vega Granda Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Simulación en diseño y operación de procesos. Aplicaciones
ÍNDICE 1. PROCESO DE PRODUCCIÓN DE PROPILENGLICOL..................................181 2. SELECCIÓN DE UN MODELO DE PROPIEDADES ........................................182 2.1. Cálculo de los coeficientes binarios de interacción.............................................184 3. DEFINICIÓN DE LA REACCIÓN QUÍMICA ....................................................184 4. ENTORNO DE SIMULACIÓN ..............................................................................187 4.1. Definir las corrientes de alimentación .................................................................187 4.2. Añadir la operación unitaria Mixer .....................................................................187 4.3. Añadir la operación reactor CSTR ......................................................................188 4.4. Añadir la columna de destilación ........................................................................190 5. RESULTADOS..........................................................................................................193 6. BIBLIOGRAFÍA ......................................................................................................194
1. PROCESO DE PRODUCCIÓN DE PROPILENGLICOL El propilenglicol (12-C3diol) se obtiene por reacción del óxido de propileno (12C3Oxide) y agua, y posterior separación en una columna de destilación. En la figura se presenta un diagrama de flujo del proceso.
Las condiciones de las corrientes de alimentación al sistema, se indican en la Tabla siguiente. Las corrientes de alimentación se mezclan previamente en un mezclador (Mixer). La corriente resultante se introduce en un reactor CSTR que funciona a temperatura constante de 60 ºC y a presión de 1.1 atm. El reactor tiene un volumen de 7.929 m3, se supone caída de presión nula, y se mantiene un nivel de líquido de 85 %. La reacción química que tiene lugar es: H2O + C3H6O → C3H8O2 181
Simulación en diseño y operación de procesos. Aplicaciones
Nombre Prop Oxide Water Feed Temperatura (ºC) 23.89 23.89 Presión (atm) 1.1 1.1 Flujo molar (kgmole/h) 68.04 Flijo másico (kg/h) 4990 Composición de las corrientes Óxido de propileno 1 0 Agua 0 1 Propilenglicol 0 0 Los datos cinéticos para esta reacción son: r = Ae
⎛ −E ⎞ ⎟ ⎜ ⎝ RT ⎠
C OP
A = 1.7 × 1013 lbmol/ft3
E = 7.5 × 104 kJ/kgmol-K
Siendo COP la concentración molar de óxido de propileno en lbmol/ft3.
2. SELECCIÓN DE UN MODELO DE PROPIEDADES Lo primero que hay que hacer es seleccionar el modelo de propiedades (Fluid Package) dentro del Simulation Basis Manager que será lo primero que aparece si se inicia un nuevo caso. Aquí presionando sobre el botón Add añadiremos un nuevo modelo.
La elección del paquete de propiedades de realiza en la página Prop Pkg. En nuestro ejemplo elegiremos UNIQUAC.
182
Simulación en diseño y operación de procesos. Aplicaciones
El siguiente paso es añadir los componentes utilizados en la simulación, pera ello se selecciona la página Components.
En la casilla Match, se introduce H2O (o water). Una vez aparece el componente en azul, se presiona el botón Add Pure, o se presiona la tecla Enter. En la sección Current Component List aparecerá H2O. Se vuelve a la casilla Match, se hace clic para marcar el componente anterior y se introduce el siguiente componente PropylenOxide, se presiona Add Pure, y se repite el procedimiento con el PropylenGlycol. Una vez seleccionados todos los componentes aparecerá en la pantalla, dentro de la sección Current Component List, una lista con los tres componentes adicionados.
183
Simulación en diseño y operación de procesos. Aplicaciones
2.1. Cálculo de los coeficientes binarios de interacción Ir a la página Binary Coeffs, si aparecen algunos coeficientes binarios sin calcular (esto es, si hay guiones de color rojo), presionar el botón Unknowns only
3. DEFINICIÓN DE LA REACCIÓN QUÍMICA Se cierra el Fluid Package: Basis 1, y una vez en el Basis Manager se va a la página Reactions. Se presiona el botón Add Comps.... Aparecerán los componentes en el recuadro Selected Reaction Components, y se debe pulsar en Add This Group of Components, después cerrar el formulario. En el Simulation Basis Manager en la pestaña Reactions habrán aparecido los componentes adicionados dentro de la sección Rxn Components. Pulsar ahora sobre el botón Add Rxn para añadir la reacción.
184
Simulación en diseño y operación de procesos. Aplicaciones
Aparecerá una pantalla titulada Reactions donde se debe elegir el tipo de reacción a definir. En nuestro caso seleccionaremos Kinetic.
Agregar los componentes de la reacción seleccionándolos de la lista desplegable en el campo superior de la pantalla. Aparecerán los pesos moleculares de cada componente. Completar los coeficientes estequiométricos, recordando que se deben poner valores negativos para los reactivos y positivos para los productos. Verificar que el campo denominado Balance Error sea igual a cero. Nótese que los órdenes de reacción aparecen automáticamente, y son iguales a los coeficientes estequiométricos, aunque se pueden modificar. De hecho el orden respecto del agua es cero. Pasar a la página Basis donde seleccionaremos Molar Concn, en el campo Base Component colocaremos 12C3Oxide seleccionándolo de la lista desplegable del campo superior. En el campo Rxn Phase seleccionar CombinedLiquid. Tener en cuenta las unidades de las velocidades de reacción y de la base, ya que son las que determinarán las unidades de la constante de velocidad en la ecuación de Arrhenius.
Pasar a la página Parameters e introducir los valores de los parámetros de la reacción con las unidades correspondientes. Para el caso de E, es posible introducir el valor y seleccionar la unidad correspondiente de la lista desplegable.
185
Simulación en diseño y operación de procesos. Aplicaciones
Una vez introducidos todos los datos el cartel en rojo Not Ready cambiará por el de Ready en color verde, indicándonos que HYSYS ya cuenta con datos suficientes para la reacción elegida. La reacción que hemos definido se encuentra dentro del grupo de reacciones denominado Global Rxn Set, y es necesario adicionarlo al paquete de propiedades que hemos definido, para ello en la página Reactions se pulsa sobre el botón Add to FP. Aparecerá una pantalla titulada Add “Global Rxn Set”, donde seleccionaremos el paquete Basis-1 NC-3 PP:UNIQUAC, y cuando se haya coloreado de azul pulsaremos sobre el botón Add Set to Fluid Package. La palabra Basis-1 aparecerá en el recuadro Assoc. Fluid Pkgs.
Hasta aquí hemos definido las bases del caso. Pulsando sobre el botón Return to Simulation Environment entraremos en el entorno de simulación.
186
Simulación en diseño y operación de procesos. Aplicaciones
4. ENTORNO DE SIMULACIÓN 4.1. Definir las corrientes de alimentación Al entrar en el entorno de simulación, y dependiendo de la configuración del programa entraremos en una ventana denominada PFD (Process Flow Diagram) o en la ventana correspondiente al Workbook. Si entramos en el Workbook definiremos en primer lugar las corrientes de alimentación, posicionándonos en la celda **New** y añadiendo además del nombre los datos que se han indicado al principio. En la pestaña Compositions se añaden las composiciones de las corrientes, con lo cual quedan definidas completamente las alimentaciones al mezclador y en consecuencia se calcularan el resto de sus propiedades mediante un flash.
4.2. Añadir la operación unitaria Mixer A continuación en la pestaña Unit Ops procederemos a añadir la operación unitaria Mixer, para lo cual pulsamos sobre el botón Add UnitOp. Aparecerá una nueva ventana en la cual podremos seleccionar la unidad Mixer.
187
Simulación en diseño y operación de procesos. Aplicaciones
Al pulsar sobre el botón Add aparecerá el formulario de entrada de datos del Mixer. En él indicaremos los nombres de las corrientes de alimentación y de salida. Estos datos son suficientes para llevar a cabo los cálculos necesarios para determinar las propiedades de la corriente de salida del Mixer.
4.3. Añadir la operación reactor CSTR Al igual que se hizo con el Mixer se añade el reactor CSTR. En la página de conexiones se introducen los nombres de las corrientes correspondientes como se hizo en la unidad anterior. En la página de parámetros se introduce el volumen del reactor, 7.929 m3, el nivel de líquido en el reactor y se selecciona Cooling (la reacción es exotérmica y por tanto es preciso refrigerar el reactor) En la pestaña Reactions hay que asignar un conjunto de reacciones al reactor. Se abre el menú desplegable de la celda Reaction Set y se selecciona Global Rxn Set, con lo que aparecerá el cartel amarillo indicando que está sin especificar el flujo de energía en el reactor. Esto es debido a que el reactor tiene un grado de libertad. En este punto hay que especificar o la temperatura de la corriente de salida (en cuyo caso HYSYS calculará el flujo de energía) o bien el flujo de energía en el reactor 188
Simulación en diseño y operación de procesos. Aplicaciones
(en cuyo caso HYSYS calculará la temperatura de la corriente de salida). En principio vamos a suponer que el reactor opera de forma isotérmica, de manera que en la pestaña Worksheet especificamos 23.89 ºC para la corriente de salida del reactor. HYSYS calculará el proceso. No hay cambio de fase en el reactor bajo condiciones isotérmicas por lo que el flujo de la corriente de vapor es cero. A continuación vamos a examinar la conversión alcanzada en el reactor. Para ello nos dirigimos a la pestaña Reactions del reactor y seleccionamos la página Results, con lo que veremos que la conversión es muy baja 40.3 %.
Para aumentar la conversión entorno al 85-95 % se tiene que aumentar la temperatura del mismo, de manera que vamos aumentar la temperatura de la salida del reactor hasta conversión aproximada del 95 %. Veremos como a 60 ºC la conversión es del 94.7 %.
189
Simulación en diseño y operación de procesos. Aplicaciones
4.4. Añadir la columna de destilación HYSYS dispone de una serie de plantillas de columna preconstruidas que se pueden instalar y personalizar cambiando las corrientes de conexión, el número de etapas y las especificaciones por defecto. Entre éstas se encuentra la columna de destilación, que añadiremos de la misma forma que hicimos con el resto de operaciones unitarias.
Cuando se instalan columnas preconstruidas HYSYS proporciona cierta información por defecto, como por ejemplo 10 etapas en la columna, más condensador y más calderín. En la primera pantalla hay que especificar el número de etapas, las corrientes de alimentación y de salida, plato de las alimentaciones, y si el condensador es total o parcial. Al pulsar sobre el botón Next (que solamente está activo cuando se han introducido todos los datos necesarios) aparece otro formulario donde hay que especificar el perfil de presiones en la columna a través de las presiones en el condensador y calderín. La siguiente página corresponde a opciones de estimación que no son necesarias. La siguiente página es la final y 190
Simulación en diseño y operación de procesos. Aplicaciones
corresponde a las especificaciones. Para una columna con condensador parcial, definidas las alimentaciones y fijados el número de platos, y perfil de presiones, quedan tres grados de libertad, y en consecuencia son necesarias tres especificaciones que HYSYS fija por defecto en flujo molar de líquido y vapor en cabezas, y relación de reflujo. Estas especificaciones se pueden posteriormente cambiar y adaptar a nuestras expectativas. Usaremos 0.0 lbmol/h para el flujo de vapor en cabezas, y 1.0 para la relación de reflujo, dejando sin valor el flujo de líquido en cabezas. Pulsando en el botón Done aparecerá el formulario de propiedades de la columna.
Accediendo a la página Monitor, podremos ver que el número de grados de libertad es cero, pero también que una de las especificaciones (el flujo molar de líquido en cabezas) no tiene asignado ningún valor (<empty>).
191
Simulación en diseño y operación de procesos. Aplicaciones
Vamos a añadir una nueva especificación. Pulsar sobre el botón Add Spec y se abrirá una nueva ventana de especificaciones donde podemos elegir Column Component Fraction, después pulsamos sobre Add Spec(s)..., con lo que aparecerá la vista de Comp Frac Spec.
Ahora editando el nombre de la especificación lo cambiamos a H2O Fraction, seleccionamos la etapa Reboiler , le asignamos el valor 0.005, y especificamos como componente H2O.
Pulsamos el botón Close para volver a la vista de propiedades de la columna. La nueva especificación aparece en la lista Column Specifications. Se desactiva la especificación de flujo de líquido en cabezas y se activa esta ultima especificación, con lo que comenzará el cálculo de la columna.
192
Simulación en diseño y operación de procesos. Aplicaciones
5. RESULTADOS Pulsando sobre el icono del Workbook podremos ver los resultados del proceso completo.
193
Simulación en diseño y operación de procesos. Aplicaciones
6. BIBLIOGRAFÍA •
194
Hyprotech “HYSYS Tutorial & Applications” (2001).
III. Optimización de diagramas de flujo con HYSYS
Introducción a la programación no lineal (NLP) con restricciones José Ramón Álvarez Saiz Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Introducción a la programación no lineal (NLP) con restricciones
ÍNDICE 1.
INTRODUCCIÓN..........................................................................................................197
2.
PROGRAMACIÓN NO LINEAL CON RESTRICCIONES ........................................198 2.1. Condiciones para que exista un óptimo en programación no lineal ....................202
3.
APÉNDICE: CONCEPTOS BÁSICOS EN OPTIMIZACIÓN.....................................207 3.1. Conceptos básicos................................................................................................207 3.2. Condiciones de optimalidad ................................................................................ 211
4.
BIBLIOGRAFÍA ............................................................................................................215
1. INTRODUCCIÓN Una vez que se tienen las ideas de simulación de procesos y de la estructura de los modelos de proceso, vamos a considerar un aspecto clave en diseño de procesos. El objetivo de muchas simulaciones en Ingeniería es el desarrollo de un modelo predictivo que se pueda usar en mejorar el proceso. Vamos a ver las mejoras sistemáticas o estrategias de optimización para procesos químicos con variables continuas. En particular nos centraremos en el algoritmo de programación cuadrática sucesiva (SQP o “Sucessive Quadratic Programming”) que se ha convertido en el estándar en optimización de procesos. El método se deriva desde una perspectiva tipo Newton y en los temas siguientes se verá su aplicación tanto para simulación en modo modular como en modo orientado a ecuaciones, discutiendo las ventajas y limitaciones de cada uno. En un nivel práctico, se puede definir el término “optimización” como: “Dado un sistema o proceso, encontrar la mejor solución al mismo con restricciones”. Para cuantificar la “mejor solución” se necesita primero una función objetivo que sirva de indicador de la bondad de la solución. Típicamente en problemas relacionados con la industria química y de procesos son: costes de capital, operación, rendimiento del producto, beneficios globales, etc. Los valores de la función objetivo se determinan por manipulación de las variables del problema, las cuales pueden representar físicamente tamaños de equipo o condiciones de operación (temperatura, presión, caudal, composición, etc.). Los límites de operación del proceso, pureza del producto, validez del modelo y relaciones ente las variables del proceso han de ser consideradas como restricciones y los valores de las variables se han de ajustar de forma que se satisfagan dichas restricciones. Frecuentemente, las variables del proceso se clasifican en: • Variables de decisión, que representan las grados de libertad de la optimización. • Variables dependientes, que se pueden resolver mediante las restricciones. 197
Introducción a la programación no lineal (NLP) con restricciones
En el desarrollo del problema de optimización, esta distinción es importante, tanto desde un punto de vista conceptual como en problemas de optimización de procesos modelizados en modo modular. En muchos casos, la búsqueda de un diagrama de flujo mejor mediante la manipulación de las variables de decisión se lleva a cabo mediante ensayo y error (a través de casos). En lugar de esto, estamos interesados en métodos de optimización que impliquen una aproximación sistemática para encontrar el diagrama de flujo óptimo (y esta metodología debe ser tan eficaz como sea posible). Las áreas relacionadas con la teoría y los conceptos de optimización son la programación matemática y la investigación operacional: •
Programación matemática: caracterización de las propiedades teóricas de los problemas de optimización y algoritmos, incluyendo existencia de soluciones, convergencia hacia estas soluciones y velocidades de convergencia locales.
•
Investigación operativa: aplicación e implementación de métodos de optimización para su uso eficaz y fiable.
•
Ingeniería de procesos: aplicación de métodos de optimización a problemas del mundo real.
Es preciso, pues, familiarizarse con el funcionamiento del algoritmo de optimización, incluyendo las limitaciones de los métodos (para conocer cuándo pueden fallar). Además, también se necesita formular problemas de optimización que capturen la esencia del proceso real, y que sean resolubles por los métodos de optimización actuales. Este tema se centra en la optimización de sistemas en los que las variables pueden variar de forma continua en una región (se trata de variables del tipo presión, temperatura, caudales, etc., o bien dimensiones de equipo) y que incluyen funciones objetivo o restricciones no lineales, por lo que este tipo de problemas recibe el nombre de programación no lineal (“nonlinear programming” o NLP). A continuación, se a ver una introducción a la programación no lineal y la definición de las condiciones óptimas para la solución del mismo. En el tema siguiente nos centraremos en el método SQP para resolución de programas no lineales (es el más que usa con más frecuencia, tanto en ingeniería de procesos como en otras aplicaciones). En los temas siguientes se verá la aplicación del método SQP a la simulación de procesos en el modo modular secuencial (para lo cual resulta ser un método muy eficaz) y en el modo orientado a ecuaciones (en cuyo caso se necesita un algoritmo a gran escala y es preciso adaptar el SQP).
2. PROGRAMACIÓN NO LINEAL CON RESTRICCIONES Consideramos el problema de programación lineal dado en forma genérica como: Min f (x) x s.a.
g(x) ≤ 0 h(x) =0
198
Introducción a la programación no lineal (NLP) con restricciones
donde x es un vector de n variables continuas, f (x)es una función objetivo escalar, g(x) es un vector de m funciones de restricción en forma de inecuaciones y h(x) es un vector de meq funciones de restricción en forma de ecuaciones. Las restricciones crean una región para las variables, x, denominada “región factible” y se requiere que n ≥ meq para que el problema tenga grados de libertad para la optimización. Aunque la formulación anterior suele ser la más habitual, los problemas NPL se pueden expresar de muy diversas formas. Por ejemplo, se puede cambiar el signo de la función objetivo y de las restricciones: Max q (x) x s.a.
w(x) ≤ 0 h(x) =0
para las funciones definidas como q(x) = - f(x) y w(x) = - g(x). Lo que se pretende es desarrollar un método que encuentre un mínimo local x* para f(x) en una región posible definida por las restricciones, es decir, f(x*) ≤ f(x) para cualquier x, satisfaciendo las restricciones en el entorno de x*. Si la región posible no está vacía y la función objetivo tiene una cota inferior en esta región posible, sabemos que esta solución local existe. Una solución local a un NLP es también una solución global bajo las condiciones de suficiencia siguientes, basadas en el concepto de convexidad. Una función Ф(x) es convexa para x en un dominio X si y sólo si se satisface la ecuación Ф [αξ + (1 − α) η] ≤ α φ(ξ) + (1 − α) φ(η) para cualquier α, 0 ≤ α ≤ 1, en todos los puntos en ξ y η en X. Las condiciones suficientes para una solución global del NPL son: • La solución es un mínimo local del NLP. • f(x) es convexa • todas las g(x) son convexas • todas las h(x) son lineales Las dos últimas condiciones implican que la región factible sea convexa, es decir, que para cualquier punto ξ y η en X y cualquier α (0 ≤ α ≤ 1), el punto (αξ + (1 − α) η) está también en la región. En optimización de procesos, estas propiedades indican que cualquier problema con restricciones en forma de igualdades no lineales es no convexo y, ante la ausencia de información adicional, no hay garantía de que el óptimo local sea también global si estas condiciones de convexidad no se cumplen. Esto se ilustrará con los siguientes ejemplos.
Ejemplo 1. Dimensiones óptimas de un recipiente cilíndrico Considérese la optimización de un recipiente cilíndrico con un volumen dado. ¿Cuál sería la relación L/D para este recipiente que supone un coste mínimo? 199
Introducción a la programación no lineal (NLP) con restricciones Este problema con restricciones se puede formular como un NLP en el que se minimiza el coste basado en la cantidad de material que se necesitan para fabricar las paredes laterales y las dos bases del cilindro. Para un grosor pequeño de pared, la cantidad de material es proporcional a la superficie de dichas piezas. Si el coste de los materiales es de CT para las bases y CL para las paredes laterales, respectivamente, la función objetivo a minimizar (costes totales), tendrá la forma siguiente: ⎧ πD 2 ⎫ Min ⎨C T + C L πDL = coste⎬ 4 ⎩ ⎭
y deberá estar sujeta a la restricción del volumen en la forma πD 2 =0 4 D, L ≥ 0
V−
En este ejemplo, la región factible en las variables D y L es no convexa, puesto que la restricción es no lineal. Sin embargo, en este ejemplo es posible realizar una modificación en la formulación del problema y eliminar L en la función objetivo a partir de la expresión L = 4V πD 2 , con lo que el problema de optimización queda como sigue: ⎧ πD 2 4V ⎫ + CL Min ⎨C T ⎬ D⎭ 4 ⎩
con D ≥ 0
ya que al incorporar la restricción en la función objetivo ésta ya no es necesaria. Si el valor óptimo de D es positivo, podemos encontrar el mínimo de la función por diferenciación del coste respecto de D e igualando a cero: 4VC L d (Coste ) = C T πD − =0 dD D2
Resolviendo para la variable D, se obtiene la expresión siguiente, con L determinado a través de la especificación del volumen: 1/ 3
⎛ 4V C S ⎞ ⎟⎟ D = ⎜⎜ ⎝ π CL ⎠
1/ 3
⎛ 4V ⎞ ⎛⎜ C L ⎞⎟ L=⎜ ⎟ ⎝ π ⎠ ⎜⎝ C S ⎟⎠
2/3
Además, se puede obtener que la relación de aspecto (L/D) para el cilindro óptimo ha de ser igual a CT/CL. Si obtenemos la segunda derivada C d 2 (Coste ) = C t π + 8V L3 > 0 2 dD D
si D >0
por lo que la es función convexa en la región factible (abierta) de D. Como resultado, la solución a este NLP es GLOBAL y no existen más soluciones locales. Ejemplo 2. Minimización de dimensiones de empaquetado Considérense a continuación tres objetos cilíndricos de igual altura, pero diferente radio, como se ilustra en la figura siguiente. Se desea encontrar la caja con el perímetro mínimo que contenga los tres cilindros, problema que se puede plantear como un NLP.
200
Introducción a la programación no lineal (NLP) con restricciones En este caso, las variables de decisión son las dimensiones de la caja (A, B) y las coordenadas del centro de los cilindros (x1, y 1), (x 2, y2), (x 3, y 3). Los parámetros especificados serían los radios de los cilindros: R1, R2, R 3.
2
A
3
1
B
Lo que se desea es minimizar el perímetro, 2(A+B), incluyendo como restricciones que los cilindros permanezcan en el interior de la caja y que éstos no se pueden superponer. Con este objetivo, se puede formular el siguiente NLP: Min (A + B)
Cilindros en caja enteramente
x1, y1 ≥ R1
x1 ≤ B – R1, y1 ≤ A – R1
x2, y2 ≥ R2
x2 ≤ B – R2, y2 ≤ A – R2
x3, y3 ≥ R3
x3 ≤ B – R3, y3 ≤ A – R3
(x1 –x2)2 + (y1 – y2)2 ≥ (R1+R2)2 Cilindros no se superponen
(x1 –x3)2 + (y1 – y3)2 ≥ (R1+R3)2 (x2 –x3)2 + (y2 – y3)2 ≥ (R2+R3)2 x1, x2, x3, y1, y2, y3, A, B ≥ 0
La función objetivo y las restricciones “en la caja” son lineales y, por lo tanto, convexas. Del mismo modo, las cotas de las variables son también convexas. Las no convexidades se observan en las desigualdades (restricciones) no lineales – lo cual se puede verificar en las propiedades que se verán posteriormente. Por ello, no es posible asegurar que hay una solución global única. Intuitivamente, podemos imaginar la existencia de soluciones múltiples, por ejemplo, tras encontrar una solución, observar una equivalente girando la caja 90º, o bien, tras distribuir aleatoriamente los cilindros y reducir las paredes de la caja, se puede observar que la solución depende de la posición inicial de los cilindros. Este problema tiene muchos óptimos locales, debido a que la región factible es no convexa.
Estos dos ejemplos plantean una serie de cuestiones. En primer lugar, ¿cuáles son las condiciones que caracterizan una solución local en un programa no lineal?. En el ejemplo 1, al eliminar L las restricciones perdieron su importancia. En el ejemplo 2, por el contrario, la solución estaba completamente definida por las restricciones. En la solución, estas restricciones se tienen que cumplir como ecuaciones y, por ello, se denominan activas. A continuación ser verán las condiciones de optimalidad de Kuhn Tucker, que permiten definir las soluciones que son óptimos locales. En segundo lugar, la búsqueda de la solución del NLP viene guiada por la determinación del conjunto de restricciones que son activas y la resolución de las ecuaciones que representan las condiciones de optimalidad. En el primer ejemplo, esta tarea fue sencilla, puesto que no se tuvieron que considerar restricciones activas, y porque fue posible encontrar una solución analítica a partir de la función objetivo. Sin embargo, en el segundo ejemplo aún es necesario llevar a cabo esta búsqueda. Estas estrategias de búsqueda se presentarán cuando se desarrolle el algoritmo SQP en el siguiente tema. 201
Introducción a la programación no lineal (NLP) con restricciones
2.1. Condiciones para que exista un óptimo en programación no lineal Antes de pasar a presentar matemáticamente las condiciones de optimalidad, se van a introducir éstas mediante una explicación intuitiva: Consideremos un diagrama de contorno de la función f(x) en dos dimensiones (Fig.1). El mínimo de la función se sitúa en x*. Si imaginamos la representación de esta función como un valle, entonces una “bola” rodando en el valle se pararía en x* (el punto más bajo). En ese punto estacionario tenemos un gradiente nulo, ∇f(x*)=0, y las derivadas segundas revelan la curvatura positiva de f(x). En otras palabras, si movemos la bola alejándola de x* en cualquier dirección, ésta volverá rodando hacia x*.
Figura 1. Diagrama de contorno en minimización sin restricciones (Biegler et al., 1997) Ahora introducimos dos restricciones en forma de desigualdades, g1(x) ≤ 0 y g2 (x) ≤ 0, en el problema de minimización, lo cual podríamos visualizar como dos muros en el valle (Fig. 2). De nuevo, una bola rodando en el valle dentro de la zona delimitada por los muros llegará hasta el punto más bajo posible. Sin embargo, si x* está en el límite (o borde) de una restricción (p.ej. g1(x*)=0), entonces esta desigualdad se dice que es activa, la bola se para en el muro y en ese punto ya no se cumple que ∇f(x*)=0. En su lugar, lo que sucede es que la bola se queda detenida por un balance de fuerzas: la de “gravedad” (-∇f(x*)). y la fuerza “normal” que ejerce el muro sobre la bola (-∇g1(x*)). Además, se puede ver en la figura que la restricción g2 (x) ≤ 0 es inactiva en x* y no participa en este “balance de fuerzas”. Además de este balance de fuerzas, es de esperar que haya curvatura positiva a lo largo de la restricción activa, es decir, si movemos la bola separándola de x* en cualquier dirección siguiendo la valla, ésta volverá rodando hacia x*. Finalmente, introducimos una restricción h (x)=0, visualizada como si introdujéramos un rail dentro de la zona vallada (Fig. 3). Una bola rodando sobre el rail en la zona vallada también se parará en el punto más bajo, x*, el cual está caracterizado también por un balance de fuerzas: la “fuerza de la gravedad” (-∇f(x*)), la fuerza “normal” debido al muro (-∇g1(x*)) y la fuerza “normal” que ejerce el rail sobre la bola (-∇h(x*)). Además, es de esperar que exista curvatura positiva a lo largo de las restricciones activas. Sin embargo, como se puede ver en la figura 3 ya no tenemos direcciones permitidas en las restricciones activas. En su lugar, la bola 202
Introducción a la programación no lineal (NLP) con restricciones
permanece estacionaria en la intersección del rail y el muro (y ésta es la condición suficiente para que éste sea el óptimo).
Figura 2. Problema de minimización con restricciones de inecuaciones (Biegler et al., 1997)
Figura 3. Problema de minimización con ecuaciones e inecuaciones (Biegler et al., 1997) A continuación, se generalizarán estos conceptos, desarrollando las condiciones de optimalidad para minimización con restricciones, denominadas condiciones de Kuhn Tucker (KT) o de Karush Kuhn Tucker (KKT). Por conveniencia en la notación se define una función lagrangiana de la forma siguiente: L( x , µ, λ ) = f ( x ) + g ( x )T µ + h( x ) T λ = 0 Los vectores µ y λ permiten ponderar las “fuerzas” del balance y se denominan variables duales o multiplicadores de KT. La solución del problema de minimización NLP: 203
Introducción a la programación no lineal (NLP) con restricciones
Min f (x) x s.a.
g(x) ≤ 0 h(x) =0
satisface las condiciones de KT de primer orden, necesarias para que haya un óptimo: Condiciones de Kuhn Tucker de primer orden: 1. Dependencia lineal de los gradientes (“el balance de fuerzas”): ∇L( x*, µ*, λ *) = ∇f ( x*) + ∇g ( x*) µ * +∇h( x*) λ* = 0 2. Posibilidad de que exista una solución NLP que cumpla todas las restricciones (que la pelota pueda estar entre los muros y sobre el rail): g (x*) ≤ 0 , h (x*) =0 3. Condición de complementariedad, bien µi*= 0 (la restricción es inactiva y se ignora en la condiciones KT) o gi (x*) = 0 (la restricción es activa y el multiplicador es positivo)(la pelota está bien en el borde del muro o no está en la Fig. 3): µ*T g (x*) =0 4. Los multiplicadores de las restricciones son no negativos (las fuerzas normales desde los muros sólo actúan en una dirección): µ* ≥ 0 (si activa, >0) 5. Los gradientes de las restricciones activas tienen que ser linealmente independientes:
[∇g
A
( x*) ∇h( x*)] para i ∈ A , A = {i g i ( x*) = 0}
Estas condiciones son sólo necesarias. Sin embargo, se precisa de condiciones adicionales para asegurar que x* es una solución local. Por ahora, las condiciones de primer orden sólo definen x* como un punto estacionario que cumple las restricciones. Es decir, las condiciones KT 1 a 4 son equivalentes a hacer al gradiente de la función nulo. Para confirmar un óptimo local se precisa evaluar las derivadas segundas y que estas sean positivas (o, al menos, no negativas.) En un problema multivariables, las derivadas segundas se evalúan mediante los términos de una matriz Hessiana de una función dada. Por ejemplo, la matriz Hessiana de la función objetivo, ∇xx f (x), está constituida por elementos
{∇ xx f ( x )}ij =
∂2 f ∂x i ∂x j
∂2 f ∂2 f = , se cumple que {∇ xx f ( x )}ij = {∇ xx f ( x )} ji y la matriz ∂x i ∂x j ∂x j ∂x i Hessiana es simétrica.
Además, como
204
Introducción a la programación no lineal (NLP) con restricciones
La curvatura positiva de la superficie de la función se puede evaluar basándose en la matriz Hessiana. Por ejemplo, si la función objetivo f (x) tiene curvatura positiva en x*, si su matriz Hessiana es positiva definida, es decir, p T ∇ xx f ( x*) p > 0
∀ vector p ≠ 0
p T ∇ xx f ( x*) p ≥ 0
∀ vector p = 0
o positiva semidefinida:
Para el problema NPL con restricciones, se definen condiciones de segundo orden usando la matriz Hessiana de la función Lagrangiana y definiendo direcciones permitidas no nulas para las variables de optimización basadas en las restricciones activas. Comenzando en la solución, x*, las direcciones permitidas, p, satisfacen las restricciones activas como igualdades y, por lo tanto, permanecen en la región factible. Puesto que el cambio en x en esta dirección puede ser arbitrariamente pequeño, estas direcciones también tiene que satisfacer las correspondientes linealizaciones de las restricciones y, por lo tanto, están definidas por: ∇h( x*)T p = 0 ∇g i ( x*)T p = 0
∀i ∈ A , A = {i g i ( x*) = 0}
Las condiciones de segundo orden suficientes (y necesarias) requieren curvatura positiva (no negativa) de la función lagrangiana en estas direcciones permitidas o “restringidas” p. Usando la matriz de las derivadas segundas para definir esta curvatura, estas condiciones se expresan en la forma siguiente: p T ∇ xx L( x*, µ*, λ*) p > 0
condición suficiente
p T ∇ xx L( x*, µ*, λ*) p ≥ 0
condición necesaria
para todas las direcciones permitidas p. Para ilustrar la condiciones de Kuhn Tucker, se van a considerar los dos ejemplos sencillos de la Fig 4.
-a
x
a
f(x)
-a
x
f(x)
a
Figura 4. Ilustración de las condiciones KT para el ejemplo (adaptado de Biegler et al., 1997) Considérese primeramente un problema de una única variable: Min x2 s.a. –a ≤ x ≤ a, donde a > 0 205
Introducción a la programación no lineal (NLP) con restricciones el mínimo, x*=0, se encuentra por simple inspección visual. La función lagrangiana para este problema tiene la forma: L( x , µ ) = x 2 + µ 1 ( x − a ) + µ 2 ( −a − x ) = 0
estando las condiciones KT de primer orden dadas por: ∇ L( x , µ ) = 2 x + µ 1 − µ 2 = 0
µ 1 ( x − a ) = 0 µ 2 ( −a − x ) = 0
–a ≤ x ≤ a
µ1, µ2 ≥ 0
Para que se puedan satisfacer las condiciones de primer orden, se consideran tres casos: •
µ1 = µ2 = 0
•
µ1 > 0 y µ2 = 0
•
µ1 = 0 y µ2 > 0
(el caso en que µ1 > 0 y µ2 > 0 no puede existir si a>0). Satisfacer estas condiciones requiere la evaluación de las tres posibles soluciones: •
Si la cota superior es activa: x = a, µ1 = −2a, µ2 = 0
•
Si la cota inferior es activa: x = -a, µ2 = −2a, µ1 = 0
•
Si ninguna cota es activa: µ1 = µ2 = 0, x = 0
Claramente, sólo la última de las posibilidades cumple las condiciones de KT, puesto que en las dos primeras opciones se tienen valores negativos para µ1 o µ2. Si se evalúan las condiciones de segundo orden, las direcciones permitidas p = ∆x, con ∆x >0 y ∆x <0. También se tiene que: ∇ xx L( x*, µ*, λ*) = 2 > 0 p T ∇ xx L( x*, µ*, λ*) p = 2∆x 2 > 0
para todas las direcciones permitidas. Por lo tanto, la solución x*=0 satisface las condiciones suficientes de primer orden y segundo orden de KT para que exista un mínimo local. Considérese a continuación una variación del ejemplo anterior. Supóngase que se cambia el signo de la función objetivo y se tiene que resolver el problema: Min -x2 s.a. –a ≤ x ≤ a, donde a > 0 En este caso, las posibles soluciones, x*= a o x*=-a se encuentran también por inspección visual. La función lagrangiana para este problema tiene la forma: L( x ,µ ) = − x 2 + µ1 ( x − a ) + µ 2 ( −a − x )
estando las condiciones KT de primer orden dadas por: ∇L( x , µ ) = −2 x + µ1 − µ 2 = 0 µ 1 ( x − a ) = 0 µ 2 ( −a − x ) = 0
–a ≤ x ≤ a
µ1, µ2 ≥ 0
Para que se puedan satisfacer las condiciones de primer orden, se consideran nuevamente los tres casos: µ1 = µ2 = 0; µ1 > 0 y µ2 = 0 y µ1 = 0 y µ2 > 0: •
206
Si la cota superior es activa: x = a, µ1 = 2a, µ2 = 0
Introducción a la programación no lineal (NLP) con restricciones •
Si la cota inferior es activa: x = -a, µ2 = 2a, µ1 = 0
•
Si ninguna cota es activa: µ1 = µ2 = 0, x = 0
Y en este caso las tres posibles soluciones cumplen las condiciones de KT de primer orden. A continuación, es preciso evaluar las condiciones de segundo orden. Para el punto x = 0 las direcciones permitidas p = ∆x >0 y -∆x y se cumple que: pT ∇ xx L( x*, µ*, λ*) p = −2∆x 2 < 0
por lo que este punto no satisface las condiciones de segundo orden. En los otros dos casos, sin embargo, se requiere que las direcciones permitidas satisfagan las restricciones activas exactamente. En estos casos, cualquier punto a lo largo de la dirección permitida, x* tiene que permanecer en la cota. Consecuentemente, la solución está totalmente definida por la restricción activa. La condición: pT ∇ xx L( x*,µ*, λ*) p > 0
para todas las direcciones permitidas, se cumple, ya que no hay direcciones permitidas.
Las condiciones KT de primer y segundo orden constituyen una linealización útil para identificar soluciones locales a problemas no lineales (No obstante, las derivadas segundas no se suelen calcular en problemas de optimización de procesos, por lo que raramente se comprueban las condiciones de segundo orden). Sin embargo, se necesitan estrategias de búsqueda eficaces que permitan localizar los puntos que satisfagan estas condiciones. En el tema siguiente se vamos a desarrollar un algoritmo de NLP llamado programación cuadrática sucesiva (“Successive Quadratic Programming” o SQP), el cual tiene unas características adecuadas para optimización de procesos y se pude usar en muchas aplicaciones, ya que se ha comprobado que es adaptable a varios tipos de NLP.
3. APÉNDICE: CONCEPTOS BÁSICOS EN OPTIMIZACIÓN Este epígrafe, tomado del libro de Biegler et al. (1997), presenta de un modo conciso los conceptos básicos en optimización y las condiciones de optimalidad.
3.1. Conceptos básicos
Se considerará el siguiente problema de optimización con restricciones: Min f (x) x s.a.
g(x) ≤ 0 h(x) =0 x ∈ Rn
donde f (x) es la función objetivo, h(x) = 0 es el conjunto de m ecuaciones con n incógnitas x, y g(x) ≤ 0 corresponde a un conjunto de r restricciones en forma de inecuación. En general, el 207
Introducción a la programación no lineal (NLP) con restricciones
numero de variables n será mayor que el número de ecuaciones m, y la diferencia (n-m) es el número de grados de libertad del problema de optimización. Cualquier problema de optimización se puede representar en la forma arriba indicada. Por ejemplo, si se quiere maximizar una función, según esta notación, el problema sería equivalente a minimizar esa función puesta en modo negativo. Las inecuaciones que sean mayores o iguales a cero se pueden pasar a inecuaciones que sean menores o iguales a cero simplemente con multiplicar los términos de la inecuación por –1 e invirtiendo el signo de la inecuación.
Figura 1. Región factible para tres inecuaciones (Biegler et al., 1997) DEFINICIÓN 1 La región factible (“feasible region” o FR) del problema de optimización viene dada por. FR={x | h(x)=0, g(x) ≤ 0, x ∈ Rn }
La figura 1 muestra un ejemplo de una región factible en dos dimensiones que implica tres inecuaciones. Los límites de la región vienen dados por los puntos definidos por la siguiente expresión gi(x)=0, i= 1, 2, 3. El lado no factible de las restricciones viene representado por la zona rayada. Si se añade la ecuación h(x)=0, la región factible se reduce a la línea recta más gruesa, como se muestra en la figura 2.
Figura 2. Región factible para tres inecuaciones y una ecuación (Biegler et al., 1997)
208
Introducción a la programación no lineal (NLP) con restricciones
Figura 3. (a) regiones factibles convexas; (b) regiones factibles no convexas (Biegler et al., 1997) DEFINICIÓN 2 La región factible FR es convexa si para cualquier x1, x 2 ∈ FR, x = α x 1 + ( 1-α) x 2 ∈ FR,
α ∈ [0,1]
Esta definición se ilustra en la figura 3, la figura 3a muestra un ejemplo de una región factible convexa, mientras que la región mostrada en la figura 3b es no convexa, porque algunos de los puntos de la línea que resulta de unir x1y x2 caen fuera de la región factible. La condición necesaria para que haya una región factible convexa viene dada por la siguiente: PROPIEDAD 1 Si h(x) = 0 son funciones lineales y g(x) son funciones convexas, entonces FR es una región factible convexa. DEFINICIÓN 3 La función f(x) es una función convexa si para cualquier x1, x 2 ∈ R, f [α x1 + ( 1- α) x 2 ] ≤ f (x1) + ( 1- α) f (x 2)
α ∈ [0,1].
La figura 4a presenta un ejemplo de una función convexa, cuyo valor en el intervalo [x1, x 2], es inferior a la combinación lineal de los valores de la función en los extremos del intervalo. En contraposición, la figura 4b muestra una función no convexa. Si en la expresión anterior se tuviera una inecuación estricta para los puntos en el intervalo [x1, x 2], entonces se podría decir que f (x) es estrictamente convexa. DEFINICIÓN 4 La función f (x) tiene un mínimo local en xˆ ∈ FR, si y sólo si existe δ > 0, f (x) ≥ f( xˆ ) para todo | x- xˆ | < δ, x ∈ FR. Si la desigualdad es estricta se dice que es un mínimo local fuerte (ver figura 5a); de otro modo, s trataría de un mínimo local débil (véase figura 5b).
209
Introducción a la programación no lineal (NLP) con restricciones
Figura 4. (a) Función convexa; (b) Función no convexa (Biegler et al., 1997)
Figura 5 (a) Función como mínimo local fuerte; (b) función con mínimo local débil (Biegler et al., 1997) DEFINICIÓN 5 La función f (x) tiene un mínimo global en xˆ ∈ FR, si y sólo si f (x) ≥ f ( xˆ ) x ∈ FR. Claramente, todo mínimo global es un mínimo local, pero el inverso no es cierto. La figura 6 representa una función con dos mínimos locales fuertes, siendo uno de ellos el mínimo global.
Figura 6. Función con dos mínimos locales (Biegler et al., 1997)
210
Introducción a la programación no lineal (NLP) con restricciones
3.2. Condiciones de optimalidad Minimización sin restricciones
Se considérese a continuación el siguiente problema de optimización sin restricciones: Min f (x) x x ∈ Rn
donde se supone que f (x)es una función continua y diferenciable. Las condiciones de primer orden, aquellas que son necesarias para que exista un mínimo local en xˆ , vienen dadas por un punto estacionario, esto es, un xˆ que satisfaga ∇f ( xˆ ) = 0 . Esto implica la resolución de un sistema de n ecuaciones con n incógnitas dado por: ∂f =0 ∂x1 ∂f =0 ∂x 2 ... ∂f =0 ∂x n Las condiciones de segundo orden para que exista un mínimo local fuerte, que son condiciones suficientes, requieren que la matriz Hessiana H de las derivadas parciales segundas sea positiva definida. Para dos dimensiones, la matriz Hessiana vienen dada por: ⎡∂2 f ∂2 f ⎤ ⎢ ∂x 2 ∂x ∂x ⎥ 1 2 ⎥ ⎢ 1 2 2 ⎢ δ f δ f⎥ ⎢ 2 ⎥ ⎣ ∂x 2 ∂x1 ∂x 2 ⎦
Como se puede observar, la matriz Hessiana es simétrica. La matriz H es positiva definida si y sólo si ∆x T H∆x > 0, ∀∆x ≠ 0. Las dos propiedades siguientes son útiles para determinar en la práctica si la matriz H es positiva definida: 1. H es positiva definida si y sólo si los eigenvalores ρi> 0, i = 1, 2, ..., n. 2. Si H es positiva definida, entonces f (x) es estrictamente convexa Es decir, la propiedad (1) afirma que la matriz Hessiana es estrictamente positiva si los eigenvalores calculados a partir de la misma son todos positivos. La propiedad (2) simplemente indica que aquellas funciones cuya matriz Hessiana es positiva son estrictamente funciones convexas. Por tanto, analizando únicamente la matriz Hessiana de una función se puede determinar si ésta es convexa.
211
Introducción a la programación no lineal (NLP) con restricciones
El siguiente teorema determina la condición de suficiencia para que un mínimo local sea único en un problema de optimización sin restricciones: TEOREMA 1 Si f (x) es estrictamente convexa y diferenciable, entonces si existe un punto estacionario xˆ , este corresponderá a un mínimo local. Minimización con Igualdades
Consideremos ahora un problema de minimización con restricciones en el que sólo hay igualdades. Min f (x) x s.a.
h(x) =0 x ∈ Rn
en este caso, las condiciones necesarias para que haya un mínimo local con restricciones vienen dadas por el punto estacionario de la función lagrangiana: m
L = f ( x) + ∑ λ j hj ( x) j =1
donde λ j son los multiplicadores de Lagrange. Las condiciones para un punto estacionario vienen dadas por a.
m ∂L = ∇f ( x ) + ∑ λ j h j ( x ) = 0 ∂x j =1
b.
∂L = h j ( x) = 0 ∂λ j
j=1,2... m
Obsérvese que (a) y (b) definen un sistema de n+m ecuaciones con n+m incógnitas (x, λ). Además, la ecuación (a) implica que los gradientes de la función objetivo y las restricciones en forma de igualdad deben ser linealmente dependientes, mientras que la ecuación (b) implica la factibilidad de las restricciones en forma de igualdades. Para que las ecuaciones arriba mencionadas sea válidas se tienen que cumplir condiciones adicionales, que siempre se verifican si el problema es convexo. Las condiciones suficientes de segundo orden para que exista un mínimo local fuerte vienen satisfechas cuando la matriz Hessiana del lagrangiano es definida positiva. Esto es, dada una dirección permitida p que está en el espacio nulo, ∇hT p = 0 , se tiene que
pT ∇ 2 L( x*, λ*) p > 0 , donde ∇ 2 L( x*, λ*) p = ∇ 2 f ( x*) + λ *i ∇ 2 hi ( x*) . Minimización con igualdades y desigualdades
Considerando el problema de optimización con restricciones en el que hay igualdades y desigualdades: 212
Introducción a la programación no lineal (NLP) con restricciones
Min f (x) x g(x) ≤ 0
s.a.
h(x) =0 x ∈ Rn
en este caso, las condiciones necesarias para que exista un mínimo local en xˆ vienen dadas por las condiciones Karush-Kuhn-Tucker: a. Dependencia lineal de los gradientes m
r
j =1
j =1
∇ f ( x ) + ∑ λ j ∇h j ( x ) + ∑ µ j ∇ g j ( x ) = 0
b. Restricciones a la factibilidad hj(x) = 0 j=1,2...m
gj ≤ 0 j=1,2...r
c. Condiciones complementarias µ j g j ( x ) = 0 µ j ≥ 0 j=1,2...r
donde µj son los multiplicadores de Kuhn-Tucker correspondientes a las desigualdades, los cuales están restringidos a valores no negativos. Las condiciones complementarias en (c) implican un valor nulo para los multiplicadores de las desigualdades inactivas (cuando gj < 0), y en general un valor no nulo para las restricciones en forma de inecuación activas (cuando gj = 0) La figura 7 muestra una representación geométrica de un punto que satisface las condiciones de Karush-Kuhn-Tucker. Se puede observar que ∇f viene dado por una combinación de los gradientes de las restricciones activas ∇g1 , ∇g 2 .
Figura 7. Representación geométrica de un punto que satisface las condiciones de KarushKuhn-Tucker. Además, los multiplicadores µ j vienen dados por
213
Introducción a la programación no lineal (NLP) con restricciones
⎛ ∂f µ j = −⎜ ⎜ ∂g ⎝ j
⎞ ⎟ ⎟ ∂g =0 ,i ≠ j ⎠ i
En otras palabras, representan la disminución de la función objetivo cuando se produce un incremento en las funciones que representan las restricciones; o alternativamente, el aumento de la función objetivo cuando se produce una disminución en las funciones que representan las restricciones. De esto último, se puede deducir que los multiplicadores de las desigualdades activas deben ser no negativos. El siguiente teorema es la condición suficiente para que un óptimo local en problemas de optimización con restricciones sea único. TEOREMA 2 Si f(x) es una función convexa y la región factible (FR) es también convexa, entonces si existe un mínimo local en xˆ , i.
Es un mínimo global
ii.
Las condiciones de Karush-Kuhn-Tucker son condiciones necesarias y suficientes.
La dificultad con las ecuaciones en (a), (b), (c) para las condiciones de optimalidad del problema de optimización es que no se pueden resolver directamente como en el caso en el que sólo haya igualdades. En general, la solución a estas ecuaciones se puede obtener por medio de un procedimiento iterativo, el cual, de una forma simplificada, consta de los siguientes pasos: Paso 1: Se supone que no hay desigualdades inactivas. Se ajusta el índice de las desigualdades activas JA=Ø, y los multiplicadores µj=0, j=1,2,...r Paso 2: Se resuelve la ecuación en (a) y en (b) para x, los multiplicadores λj de las restricciones en forma de igualdad, y los multiplicadores µj de las restricciones en forma de desigualdades activas (en la primera iteración no hay ninguna) m
m
j =1
jeJ A
∇f ( x ) + ∑ λ j ∇h j ( x ) + ∑ µ j ∇g j ( x ) = 0 hj(x) = 0 j=1,2...m
gj(x)=0
j ∈ JA
Paso 3. Si g(x) ≤ 0 y µj ≥ 0 j=1,2,...r, entonces se para, ya que se ha encontrado la solución. Si no es así, se va al paso número 4. Paso 4. a. Si uno o mas multiplicadores µj son negativos, se elimina de JA la desigualdad activa con el multiplicador negativo de valor absoluto mayor. b. Se añaden a JA las restricciones en forma de desigualdades que violadas gj(x) > 0 y se vuelve al paso 2. Este método arriba indicado es un procedimiento muy general, adecuado sólo para cálculos manuales en problemas pequeños.
214
Introducción a la programación no lineal (NLP) con restricciones
4. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
215
III. Optimización de diagramas de flujo con HYSYS
Programación cuadrática sucesiva (SQP) José Ramón Álvarez Saiz Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Programación cuadrática sucesiva (SQP)
ÍNDICE 1. MÉTODOS DE OPTIMIZACIÓN CON VARIABLES CONTINUAS...............219 1.1. Programación Lineal............................................................................................219 1.2. Programación No Lineal (NLP) ..........................................................................220 2. DERIVACIÓN DE SQP ...........................................................................................223 2.1. Aproximación BFGS para ∇xxL (Broyden, Fletcher, Goldfarb, Shanno)............225 2.2. Características del SQP .......................................................................................225 3. BIBLIOGRAFÍA ......................................................................................................229
1. MÉTODOS DE OPTIMIZACIÓN CON VARIABLES CONTINUAS
1.1. Programación Lineal Cuando solamente hay funciones lineales en el problema, y las variables continuas x están restringidas a valores no negativos, se dice que se tiene un problema LP: Min Z=cTx s.a. A x ≤ a x≥0 donde el signo ≤ se usa para indicar que puede haber restricciones en forma de igualdades o desigualdades. Sabiendo que las funciones lineales son convexas por la Propiedad 1 y por el Teorema 2, el LP tiene un mínimo único, el cual, no obstante, puede ser débil, pudiendo haber otros valores de las variables que conduzcan al mismo valor mínimo de la función objetivo. El método de resolución estándar en el algoritmo Simplex, que explota el hecho de que en un LP el óptimo yace en el vértice de la región factible (véase la figura 1). En este óptimo se satisfacen las condiciones Karush-Kuhn-Tucker. El método Simplex ha sufrido muchas modificaciones durante las tres últimas décadas, y en la actualidad muchos de los códigos comerciales para ordenadores (OSL, CPLEX, LINDO) están basados en él. Permite resolver muy eficazmente problemas con muchísimas ecuaciones (miles de variables y restricciones) pero con un número escaso de variables en cada restricción. En general, el esfuerzo computacional con el algoritmo simplex depende mucho del número de restricciones (filas, en terminología de LP), no dependiendo demasiado del número de variables (columnas). En problemas con muchas filas y relativamente pocas variables, es aconsejables resolver el LP por medio de su problema dual. En el caso de que las variables x puedan ser positivas y negativas, en un LP se realiza un cambio de variable, reemplazando éstas por x=xP-xN, donde xP y xN son no negativas. Si xN es cero entonces tendremos un valor positivo, si xP es cero el valor será negativo. Esta manipulación sólo se debe utilizar cuando la variable x aparece con un coeficiente positivo en la minimización de una función objetivo. 219
Programación cuadrática sucesiva (SQP)
Figura 1. El óptimo yace en el vértice x* para problemas LP (Biegler et al., 1997) Recientemente se han desarrollado los métodos del punto interior para LP, los cuales están emplean polinomios acotados. Aunque estos métodos son teóricamente superiores al algoritmo Simplex, se usan solamente para casos en los que haya un número elevadísimo de variables y restricciones (por ejemplo, problemas con 100000 restricciones y variables) en los que se observa un ahorro en la carga computacional considerable. Hay, sin embargo, clases especiales de problemas LP para aplicaciones concretas que resultan más eficaces que los códigos LP estándar, por ejemplo, para los problemas de redes de flujo, donde la matriz de los coeficientes solo tiene elementos con valores 0, 1 o –1. En este caso, el método Simplex se puede implementar con cálculos computacionales simbólicos para reducir el orden de magnitud del tiempo de computación.
1.2. Programación No Lineal (NLP) En este caso el problema se corresponde con Min f (x) x s.a.
g(x) ≤ 0 h(x) =0 x є Rn
donde, en general, f (x), h(x), g(x) son funciones no lineales. Los métodos NLP más eficaces resuelven este tipo de problemas por determinación directa de un punto que satisfaga las condiciones de Karush-Kuhn-Tucker. Como se ha indicado en el Teorema 2 del tema anterior, se pueden garantizar la obtención de un mínimo global cuando la función objetivo y las restricciones son funciones no lineales convexas y las igualdades son lineales. Como las condiciones de Karush-Khun-Tucker incluyen gradientes de la función objetivo y de las restricciones, es preciso obtener éstas analíticamente o por medio de perturbaciones numéricas. Sin embargo, la última opción supone un gran coste computacional en problemas con un gran número de variables. 220
Programación cuadrática sucesiva (SQP)
Actualmente los dos métodos NLP más utilizados son el algoritmo de programación cuadrática sucesiva (SQP) y el método de gradiente reducido. En el caso del algoritmo SQP la idea básica es resolver en cada iteración un problema cuadrático de la forma: Min ∇f ( x k )T d + 1 / 2d T B K d s.a. h( x k ) + ∇h( x k )T d = 0 g ( x k ) + ∇g ( x k ) T d ≤ 0 donde xk es el punto actual, Bk es la estimación de la matriz Hessiana de la Lagrangiana, y d es la dirección de búsqueda predicha. La matriz Bk normalmente se estima con la formula de actualización BFGS –que se verá más adelante-, y el QP se resuelve con métodos estándar para programación cuadrática (por ejemplo, la rutina QPSOL). Dado que el punto xk será, en general, no factible, el siguiente punto xk+1 se ajustará a xk+1= xk+αd, donde el tamaño del paso α se determina con el objeto de reducir una función de penalización que trata de compensar las mejoras en la función objetivo con la violación de las restricciones. Un aspecto importante del algoritmo SQP es el hecho de que el QP, cuando se emplea la matriz hessiana exacta de la Lagrangiana en B, es equivalente a aplicar el método de Newton, a las condiciones de Karush-Khun-Tucker. Por ello, es posible obtener una convergencia rápida con este algoritmo. En el método de gradiente reducido, la idea básica es resolver una secuencia de subproblemas con restricciones lineales, donde los subproblemas se resuelven por medio de eliminación de variables. En el caso particular de la implementación por medio de MINOS, el NLP se reformula a través de la introducción de variables de holgura para convertir las desigualdades en igualdades; por medio de esto el NLP se reduce a: Min f (x) x s.a.
r(x) = 0
Las aproximaciones lineales de las restricciones se consideran en una Lagrangiana ampliada para la función objetivo:
[
Min Φ ( x ) = f ( x ) + (λk ) T r ( x ) − r ( x k )
]
s.a. J(x k)x=b donde λk es el vector de los multiplicadores de Lagrange, y J(xk) es el jacobiano de la función r(x) evaluada en el punto xk. El subproblema NLP2, que es un problema de optimización con restricciones lineales, viene dado por Min Φ( x ) s.a. Ax=b donde A es una matriz m x n con m
Programación cuadrática sucesiva (SQP)
g R = Z T ∇Φ ( x k )
donde xk es un punto dentro de la región factible que satisface las restricciones lineales, y Z es una matriz de transformación que viene dada por: Z=[-B –1C ⏐ I] En el método de gradiente reducido, el paso de Newton, ∆u, se puede calcular en el espacio reducido por medio de la expresión: H R ∆u = − g R
donde HR es la matriz Hessiana reducida, la cual se estima a través de una expresión de actualización quasi-Newton (por ejemplo, la fórmula BFGS). El cambio en las variables dependientes, ∆v, se obtiene resolviendo las ecuaciones lineales: B∆v = −C∆u
En resumen, en el método de gradiente reducido, el subproblema NLP2 se resuelve como un problema de optimización interno, mientras que en la optimización externa el nuevo punto de evaluación se ajusta a x k +1 = x k + α∆x donde α es un paso que se usa para reducir la Lagrangiana ampliada en el NLP2, y ∆x =[∆v ⏐ ∆u]. La importancia de los métodos de gradiente reducido es que mediante una implementación eficaz de la resolución de las ecuaciones anteriormente mostradas, y puesto que es posible emplear algunas de las herramientas inicialmente desarrolladas para problemas LP a gran escala, es posible explotar el carácter no denso de las matrices. De este modo, se pueden resolver problemas de optimización no lineal efectivamente. A continuación se comparan, a grandes rasgos, los métodos SQP y de gradiente reducido: 1. El método SQP requiere un número menor de iteraciones que los métodos de gradiente reducido. Sin embargo, hay dificultades para aplicarlo a problemas muy grandes, debido a que la matriz Bk ( de dimensiones n x n) se puede hacer muy densa debido a de las actualizaciones del método quasi-Newton. El método SQP es el más adecuado para los modelos de caja negra (por ejemplo, simuladores de procesos), los cuales cuentan con un número relativamente pequeño de variables (por ejemplo, unas 50) y donde los gradientes se pueden obtener por perturbación numérica. No obstante, también se puede aplicar este método a problemas a gran escala que incluyan pocas variables de decisión usando técnicas de descomposición. 2. El método de gradiente reducido, que está implementado en MINOS, se ajusta mejor a problemas que incluyan un número significativo de restricciones lineales, y donde sea posible sustituir las derivadas analíticas por funciones no lineares. Con esta estructura, MINOS puede resolver problemas con varios cientos de variables y restricciones. Comparándolo con el SQP, MINOS requiere un número mayor de evaluaciones de funciones, pero el tiempo empleado en cada iteración es menor. En el caso límite en que todas las funciones sean lineales, el método se reduce a un algoritmo SIMPLEX de programación lineal
222
Programación cuadrática sucesiva (SQP)
2. DERIVACIÓN DE SQP En NLP para ingeniería de procesos, se usan esencialmente dos métodos en todos los problemas: gradiente reducido y SQP. Una ventaja de este último es que necesita muchas menos evaluaciones de funciones que los métodos de gradiente reducido (y otros métodos posibles). En algunos NLP, como es la optimización de diagramas de flujo, esto supone una ventaja clave. El algoritmo SQP se ha venido analizando y probando en análisis numérico y en ingeniería de procesos desde 1977. Requiere en general menor número de evaluaciones de funciones de todos los algoritmos NLP actuales. Además, no requiere que los puntos intermedios estén en la región factible y converge hacia las soluciones óptimas por caminos no posibles. Ambas características lo hacen muy adecuado en problemas de optimización de diagramas de flujo donde la evaluación de funciones es costosa. Por otro lado, el funcionamiento del algoritmo SQP (aunque no la solución final) depende del tamaño de las funciones y variables. Por ello, es preciso tener cuidado por evitar planteamientos iniciales incorrectos. Además, la linealización de las restricciones lejos de la solución pueden dar lugar a problemas QP que no tengan una región posible. En estas condiciones, se aplican estrategias de relajación para las restricciones linealizadas, aunque no son siempre efectivas. El algoritmo SQP que se va a presentar no es eficaz para problemas grandes (>100 variables) dado que las aproximaciones BFGS y el subproblema QP (en paso 3) se resuelven mediante el uso de álgebra lineal excesivamente densa, que implica un coste elevado de tiempo de computación. En estos casos, se deben usar los métodos de espacio reducido, como MINOS (1982) o adaptaciones de SQP que se verán en los temas siguientes. Hay varias formas de llegar al algoritmo SQP. Vamos a ver una basada en condiciones KT, como un sistema de ecuaciones no lineales en x, µ y λ. Estas ecuaciones se pueden resolver mediante el método de Newton. Esto es en esencia el método SQP y la razón de su éxito. En el desarrollo que se va a ver se incluirán algunas modificaciones para poder aplicarlo a las condiciones KT directamente. Se considera inicialmente una modificación de las condiciones KT. Si se conocen a priori las desigualdades activas, se define A = l g l ( x*) = 0 y se hace que las gA(x) sean restricciones
{
}
gl(x), l ∈ A con lo que las condiciones KT se pueden simplificar:
∇ X L( x*, µ*, λ *) = ∇f ( x*) + ∇g A ( x*) µ * +∇h( x*) λ* = 0 (gradiente con respecto a x) gA (x*) = 0 h (x*) = 0 Y la solución se puede obtener resolviendo estas ecuaciones para x, µ y λ. Aplicando el método de Newton para resolver las ecuaciones en la iteración, i, da lugar al siguiente sistema de ecuaciones que definen el intervalo de Newton:
223
Programación cuadrática sucesiva (SQP)
⎛ ∇ XX L ∇g A ⎜ T 0 ⎜ ∇g A ⎜ ∇h T 0 ⎝
(
⎛ ∇ X L x i , µ i , λi ∇h ⎞⎛ ∆x ⎞ ⎜ ⎟⎜ ⎟ 0 ⎟⎜ ∆µ ⎟ = −⎜ gA xi ⎜⎜ 0 ⎟⎠⎜⎝ ∆λ ⎟⎠ h xi ⎝
( ) ( )
)⎞⎟ ⎟ ⎟⎟ ⎠
Lo cual corresponde a las condiciones KT del siguiente problema de minimización:
Min ∇f ( x i )T d + 1 / 2d T ∇ XX L( x i , µ i , λi )d s.a. g A ( x i ) + ∇g A ( x i )T d = 0 h( x i ) + ∇h( x i ) T d = 0 La programación no lineal (NPL) con una función objetivo cuadrática (en la variable vectorial d) y con restricciones lineales se denomina Programación Cuadrática (QP) y si ∇ XX L( x i , µ i , λi ) es positivo definido, es decir, y T ∇ XX L( x i , µ i , λi ) y > 0 , para todos los vectores y no nulos, se dispone de algoritmos de pasos finitos efectivos para la resolución de estos problemas. La resolución origina un vector solución d con los multiplicadores µ y λ para gA y h, respectivamente. Haciendo d = ∆x, ∆µ = µ - µi y ∆λ = λ - λi, la solución es equivalente al intervalo de Newton mencionado inmediatamente antes. Para relajar el problema e incluir las desigualdades g(x*) ≤ 0 se generaliza el QP, modificándolo de forma que determine de forma automática el conjunto de desigualdades activas gA, resolviéndose el siguiente QP: Min ∇f ( x i )T d + 1 / 2d T ∇ XX L( x i , µ i , λi )d s.a. g ( x i ) + ∇g ( x i ) T d ≤ 0 h( x i ) + ∇h( x i ) T d = 0 El QP genera una dirección de búsqueda en x y proporciona valores estimados razonables de los multiplicadores KT. Sin embargo, para su implementación se necesita la evaluación de derivadas segundas de la función objetivo, las restricciones y unos buenos valores iniciales de µ y λ para calcular la matriz Hessiana de la función de Lagrange ( ∇ XX L ). Estas dos tareas son las principales limitaciones del método. Este es un método propuesto en 1963 y aplicado en 1967, al que le condiciona una circunstancia clave: si ∇ XX L no es positiva definida se tiene un problema QP no convexo, difícil de resolver con métodos QP disponibles. En 1977 se desarrollaron los métodos Quasi-Newton y funciones de penalización exacta para resolver los NPL. Consisten en una aproximación de ∇ XX L (matriz Hessiana de la función de Lagrange) por una matriz simétrica positiva definida Bi. Esta aproximación está basada en un método de secante, muy similar al método de Broyden. En este caso, el cálculo de Bi se basa en la diferencia del gradiente de la función de Lagrange ente un punto y el siguiente.
224
Programación cuadrática sucesiva (SQP)
2.1. Aproximación BFGS para ∇xxL (Broyden, Fletcher, Goldfarb, Shanno)
Si se considera la aproximación de la matriz hessiana de la función de Lagrange, ∇ XX L mediante una matriz simétrica Bi, se puede llevar a cabo una actualización de la aproximación mediante una secante: B i +1 ( x i +1 − x i ) = ∇ X L( x i +1 , µ i +1 , λ i +1 ) − ∇ X L( x i , µ i +1 , λ i +1 ) donde se definen: s = xi+1 – xi , y = ∇ X L( x i +1 , µ i +1 , λ i +1 ) − ∇ X L( x i1 , µ i +1 , λ i +1 ) dando lugar a una matriz simétrica, positiva definida: Bi+1 s = y En este caso, ∇ XX L es una matriz simétrica, y se pretende que Bi también lo sea, así como definida positiva. Se puede obtener la actualización de la matriz Bi a Bi+1 utilizando la misma estrategia que se siguió en la derivación del método de Broyden, llegándose finalmente a la expresión: B i +1 = B i + yy T / s T y − B i ss T B i / s T B i s Si Bi es positiva definida y s T y > 0 entonces Bi+1 también lo es. Se debe de comprobar que la condición s T y > 0 sea satisfecha antes de realizar la actualización del valor de Bi. Esta última expresión es la que se denomina actualización de Broyden-Fletcher-GoldfarbShanno (BFGS). El resultado de esta actualización es la obtención de una aproximación razonable de la matriz hessiana que es también positiva definida, lo cual convierte al problema en uno convexo de QP con propiedades de convergencia adecuadas.
2.2. Características del SQP
El método SQP posee una rápida convergencia y necesita pocas evaluaciones de funciones y de gradientes. En un entorno próximo a solución se obtienen las siguientes velocidades de convergencia: •
Si Bi = ∇ XX L( x i , µ i , λi ) , la velocidad de convergencia es cuadrática (K positiva) 2
lim i →∞ x i +1 − x * / x i − x * ≤ K
•
Si Bi se obtiene a partir de una actualización de BFGS y ∇ XX L( x i , µ i , λi ) es positiva definida, la velocidad de convergencia es superlineal: lim i →∞ x i +1 − x * / x i − x * = 0
•
Si Bi se obtiene de una actualización de BFGS, la velocidad de convergencia es superlineal tras dos etapas: lim i →∞ x i +1 − x * / x i −1 − x * = 0 225
Programación cuadrática sucesiva (SQP)
Como para la resolución de ecuaciones no lineales, el método SQP se puede modificar para que pueda empezar lejos de la solución. En este caso, se introduce un algoritmo de búsqueda de línea que usa una dirección de búsqueda generada por el método SQP pero en la que se modifica el paso de la siguiente forma: xi+1 = xi + α d
α (escalar) 0 < α ≤ 1
α se elige para asegurar la disminución de una función que representa a la función objetivo más una suma ponderada de las restricciones. La función elegida para este propósito es la denominada función de penalización exacta (exact penalty function), y es la elección más habitual para los algoritmos SQP: P ( x , γ, η) = f ( x ) + ∑ j γ j max(0, g j ) + ∑ j η j h j
donde las factores de ponderación se eligen lo suficientemente grandes de modo que γj > µj, ηj > λ j , siendo µi y λi los multiplicadores estimados en el algoritmo. Con esta función y la actualización BFGS, se garantiza que el SQP converge hacia una solución local si la función objetivo tiene una cota inferior y los subproblemas QP son resolubles. Existen distintas funciones disponibles junto con modificaciones del algoritmo SQP, pero los elementos básicos del mismo se muestran en la tabla I. Tabla I. Algoritmo SQP básico 0. Se supone x0, y se fija B0 = I (la matriz identidad se elige por defecto). Se evalúan f(x0), g(x0) y h(x0). 1. En xi, evalúa ∇f ( x i ) , ∇h( x i ) , ∇h( x i ) . Si i>0, se calculan s e y. 2. Si i > 0 y sT y > 0, se actualiza Bi usando la formula BFGS. 3. Se resuelve:
Min ∇f ( x i )T d + 1 / 2d T B i d d s.a. g ( x i ) + ∇g ( x i )T d ≤ 0 h( x i ) + ∇h( x i ) T d = 0
4. Si d es menor que la mínima tolerancia o las condiciones Kuhn Tucker están dentro de la mínima tolerancia, el algoritmo se para y ya se tiene la solución. 5. Se busca un tamaño de paso α de forma que 0 < α ≤ 1 y P(xi + α d) < P(xi). Cada prueba para elegir el tamaño del paso requiere la evaluación adicional de f(x), g(x) y h(x). 6. Se hace xi+1 = xi + α d, i= i + 1 y se retorna al paso 1. Para ilustrar el funcionamiento de SQP se va a aplicar éste al siguiente ejemplo
226
Programación cuadrática sucesiva (SQP)
Ejemplo. Funcionamiento de SQP Se va a considerar la solución del siguiente problema (sencillo) no lineal Min x2
s.a. − x 2 + 2( x1 ) 2 − ( x1 ) 3 ≤ 0 − x 2 + 2(1 − x1 ) 2 − (1 − x1 ) 3 ≤ 0 La región factible para el problema propuesto se indica en la figura 2, en la que se observa que x* = [0.5, 0.375]
Figura 2. Región factible y diagrama de contornos para el ejemplo (Biegler et al., 1997) Se comienza en el origen (x0 = [0, 0]T y B0 = I), se linealizan las restricciones y se resuelve el siguiente QP: Min d2+ ½ (d 12 + d 22)
s.a. d 2 ≥ 0
d1 + d 2 ≥ 1 T
De donde se obtiene una dirección de búsqueda con d = [1,0] y multiplicadores µ1 =0 y µ2=1. Los contornos de esta función cuadrática junto con las restricciones linealizadas se muestra en la figura 3 para la primera iteración del método SQP. Una búsqueda de línea a lo largo de d determina un α = 0.5, y el nuevo punto es x1 =[0.5, 0]T (fuera de la región posible). A partir de este punto a partir de:
⎡4 x1 − 3( x1 ) 2 ⎤ ⎡− 4( 1 − x1 ) + 3( 1 − x1 ) 2 ⎤ ⎡0⎤ ∇ X L( x , µ ) = ⎢ ⎥ + µ 1 ⎢ ⎥ + µ2 ⎢ ⎥ ⎣1 ⎦ ⎣− 1 ⎦ ⎣− 1 ⎦ se tiene
s = x 1 − x 0 = [0.5,0]
T
y = ∇ X L( x 1 , µ1 ) − ∇ X L( x 0 , µ1 )
= [− 1.25,0] − [− 1,0] = [− 0.25,0] T
T
T
227
Programación cuadrática sucesiva (SQP)
Figura 3. Primera iteración SQP (Biegler et al., 1997) T
1
Como s y=-0.125 <0, no se puede actualizar la aproximación BFGS y se vuelve a la condición B = I. En la segunda iteración se resuelve el siguiente QP: Min d2+ ½ (d 12 + d 22) s.a. − 1.25d1 − d 2 + 0.375 ≤ 0
1.25d1 − d 2 + 0.375 ≤ 0 Los contornos de esta función cuadrática junto con las restricciones linealizadas se muestra en la figura 4 para la segunda iteración del método SQP
Figura 4. Segunda iteración SQP. Convergencia en el punto óptimo (Biegler et al., 1997) T
La solución de este problema cuadrático proporciona una dirección de búsqueda d = [0, 0.375] Una búsqueda de línea a lo largo de d determina un α = 1( paso completo), de tal modo que el nuevo punto 228
Programación cuadrática sucesiva (SQP) T es x2=[0.5, 0.375] . Del problema QP planteado se obtienen unos multiplicadores µ1 =0.5 y µ2=0.5., de forma que en x2:
⎡4 x − 3( x1 ) 2 ⎤ ⎡− 4(1 − x1 ) + 3(1 − x1 ) 2 ⎤ ⎡0⎤ ⎡0 ⎤ + µ ∇ X L( x 2 , µ 2 ) = ⎢ ⎥ + µ1 ⎢ 1 ⎥ ⎥=⎢ ⎥ 2⎢ ⎣1 ⎦ ⎣− 1 ⎦ ⎣− 1 ⎦ ⎣0 ⎦
g1 ( x 2 ) = − x 2 + 2( x1 ) 2 − ( x1 ) 3 = 0 g1 ( x 2 ) = − x 2 + 2(1 − x1 ) 2 − (1 − x1 ) 3 = 0 , Se cumplen las condiciones KT de primer orden, y el algoritmo se para en x*= x2. Además, como g1(x*)=0 y g2(x*)=0 no hay direcciones posibles para comprobar la curvatura positiva, por lo que también se cumplen las condiciones KT de segundo orden. La figura 4 muestra la convergencia del método en el punto óptimo.
3. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
229
III. Optimización de diagramas de flujo con HYSYS
Optimización de procesos con simuladores modulares Susana Luque Rodríguez Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Optimización de procesos con simuladores modulares
ÍNDICE 1. INTRODUCCIÓN ....................................................................................................233 2. OPTIMIZACIÓN CON SIMULADORES MODULARES .................................233 3. OPTIMIZACIÓN DEL DIAGRAMA DE FLUJO DEL PROCESO WILLIAMS OTTO.........................................................................................................................236 4. OPTIMIZACIÓN DEL DIAGRAMA DE FLUJO DE LA SÍNTESIS DE AMONIACO .............................................................................................................238 5. BIBLIOGRAFÍA ......................................................................................................241
1. INTRODUCCIÓN En los temas del bloque II se ha definido la simulación en modo modular secuencial y se han discutido las estrategias de descomposición y resolución de ecuaciones para modelizar un diagrama de flujo. A continuación, vamos a extender esto a la optimización de procesos. Además de las especificaciones del diagrama de flujo y las ecuaciones que determinan los balances de materia y energía, en un problema de optimización se puede identificar un x , que constituyen los grados de libertad. Estas variables se subconjunto de variables, ~ seleccionan de entre las variables asociadas a las corrientes de alimentación, las condiciones del proceso y las variables o especificaciones de las unidades individuales. En simuladores modulares, la estrategia más eficaz de optimización es la SQP, vista en el tema anterior.
2. OPTIMIZACIÓN CON SIMULADORES MODULARES Los problemas de optimización en simuladores modulares tienen una estructura del tipo de la representada en la Figura 1. Los módulos relacionados con el procesado de la alimentación (PA), reacción (RE), separación y recirculación (SR), tratamiento de la recirculación (TR) y recuperación del producto (RP) contienen las ecuaciones del modelo y los procedimientos para su resolución.
TR Min f(x) g(x) ≤ 0 c(x) = 0
PA
RE
SR
RP
Figura 1. Estructura de un problema de optimización en un diagrama de flujo modular (adaptado de Biegler et al., 1997) 233
Optimización de procesos con simuladores modulares
En estos casos, se formulan las funciones objetivo y las restricciones en términos de variables de corrientes y unidades del diagrama de flujo, siendo funciones implícitas de las variables de decisión, ~ x , que son un subconjunto de las variables del proceso, x. Típicamente, la función objetivo, f(x), representa costes de procesado, rendimiento del proceso o beneficios globales; las purezas de producto y los límites de operación habitualmente vienen representados por desigualdades, g(x); y las especificaciones de diseño implícitas están representadas por restricciones adicionales en forma de igualdades, c(x). Como se va a usar un método algorítmico basado en gradientes, tanto la función objetivo como las restricciones han de ser funciones continuas y diferenciables. Además, en el modo modular, las derivadas de las relaciones implícitas de los módulos (con respecto de ~ x ) no se encuentran directamente disponibles, por lo que frecuentemente se obtienen de diferencias finitas (con evaluaciones adicionales del diagrama de flujo) o mediante la mejora en los modelos de unidades de forma que se puedan obtener las derivadas exactas. Los problemas de optimización de diagramas de flujo emplean modelos grandes y complejos pero con relativamente pocas variables de diseño. Aunque el número de variables del diagrama de flujo puede ser de varios miles, éstas están “escondidas” dentro del simulador y los grados de libertad son raramente más de 50-100 variables. Por todo ello, el modo modular presenta una serie de ventajas para la optimización son: •
facilidad de construcción e inicialización, dado que los procedimientos numéricos empleados están seleccionados a medida de cada unidad
•
facilidad para localizar y eliminar errores, ya que se pueden emplear conceptos intuitivos para el ingeniero.
Por otro lado, un inconveniente que se presenta es debido a que los modelos de unidades se tienen que resolver repetidamente, por lo que es necesario una definición cuidadosa del proceso para evitar el fallo inmediato de dichas unidades. Los primeros métodos de optimización se basaban en estrategias de caja negra, que posteriormente dejaron de usarse. En estos métodos se disponía de un algoritmo de optimación alrededor del simulador. Se necesitaba resolver el diagrama de flujo repetidamente y un fallo en la convergencia del diagrama de flujo iba en detrimento de la optimización. Además, como los gradientes se determinan mediante diferencias finitas, éstas habitualmente fallan debido a errores de redondeo derivados de la convergencia del diagrama de flujo, lo cual tenía un efecto adverso sobre la estrategia de optimización. Típicamente, una optimización de diagrama de flujo con diez grados de libertad requería el tiempo equivalente a varios cientos de simulaciones con la implementación de caja negra. Desde mediados de los 80, la optimización de diagramas de flujo en modo modular se ha convertido en una herramienta industrial ampliamente utilizada, lo cual ha sido posible gracias a tres avances:
234
•
La estrategia SQP requiere pocas evaluaciones de funciones y resulta muy eficaz en los problemas de optimización que requieren pocas funciones a evaluar.
•
Los bucles de convergencia intermedios, como los derivados de las corrientes de recirculación y las especificaciones “implícitas”, se pueden incorporar como restricciones en forma de igualdades al problema de optimización, lo cual es particularmente importante en bucles que de otra forma se harían converger con métodos de punto fijo, que habitualmente resultan seguros, aunque muy lentos. Con
Optimización de procesos con simuladores modulares
SQP se logra una convergencia de las restricciones en forma de igualdades y desigualdades simultáneamente con el problema de optimización. •
Dado que SQP es un método tipo Newton, se puede incorporar en el simulador modular a través de un “bloque” (o módulo) de resolución de ecuaciones que se usa frecuentemente en convergencia de recirculaciones. Como resultado, no es necesario modificar la estructura del simulador ni de los modelos de operación unitarias.
OPTIMIZACIÓN
OPTIMIZACIÓN
OPTIMIZACIÓN SIMULACIÓN
SIMULACIÓN
Figura 2. Evolución desde el método de caja negra (izquierda) a la aproximación de camino imposible usando SQP (adaptado de Biegler et al., 1997). Consecuentemente, esta estrategia se ha podido incorporar fácilmente en los simuladores modulares secuenciales ya existentes y es directamente aplicable a los diagramas de flujos modelizados en ellos. Como se muestra esquemáticamente en la figura 2, esta estrategia “rompe” parte del problema de simulación e incorpora parte del mismo en el NLP. El resultado es una resolución un orden de magnitud más rápida que la caja negra y mucho más fiable. Un esquema de una aplicación típica de la estrategia de optimización SPQ en un diagrama de flujo de proceso se muestra en la figura 3, en la cual se han identificado las variables de optimización, ~ x , así como la corriente a seccionar y las variables de dicha corriente, y. Como se ha descrito en el bloque II, el problema de simulación se puede describir por la ecuación h(y) = y - w(y), siendo w(y) los valores calculados para corriente seccionada tras un paso completo por el diagrama de flujo. La formulación del problema de optimización sería entonces como sigue: Min f ( ~ x,y ) s.a. h( ~ x , y ) = y − w( ~ x, y ) = 0
c( ~ x, y )= 0 g( ~ x, y ) ≤ 0 en el que las ecuaciones, h, correspondientes a las recirculaciones (seccionado) y las especificaciones de diseño se resuelven como parte del problema de optimización.
235
Optimización de procesos con simuladores modulares
3
2
h(y) = 0
4
6
w(y)
y
1
~ x
5
Figura 3. Diagrama de flujo típico para optimización de procesos en modo modular secuencial (adaptado de Biegler et al., 1997). Este problema se puede resolver empleando los algoritmos SQP o de gradiente reducido vistos con anterioridad. Cada evaluación de la función objetivo y las restricciones requiere un paso completo por el diagrama de flujo y se requieren pasos adicionales para los cálculos de x e y. Una vez obtenidos éstos, el SQP resuelve el siguiente gradientes respecto de ~ subproblema QP:
Min ∇f ( ~ x i , y i )T d + 1 / 2d T B i d d s.a.
h( ~ x i , y i ) + ∇h( ~ x i , y i )T d = 0 c( ~ x i , y i ) + ∇c ( ~ x i , y i )T d = 0 g( ~ x i , y i ) + ∇g ( ~ x i , y i )T d ≤ 0
La actualización de ~ x e y se leva a cabo a través de la dirección de búsqueda d:
[~x
i +1T
] [
]
, y i +1T = ~ x iT , y iT + αd
3. OPTIMIZACIÓN DEL DIAGRAMA DE FLUJO DEL PROCESO WILLIAMS - OTTO El proceso simulado en el tema 7 se puede extender a un problema de optimización seleccionando cinco grados de libertad: flujos de alimentación (F1 y F2), volumen del reactor (V), fracción purgada (v) y temperatura del reactor (T). Todas estas variables están acotadas y, además, se impone una cota superior a la producción. La figura 4 muestra el diagrama d flujo del proceso con estas variables señaladas. 236
Optimización de procesos con simuladores modulares
Alimentaciones: F1 (A) F2 (B)
V,T
FP
f(Fd) Fd Fwaste FR (r ecir culación)
Fpurga Purga, ν
Figura 4. Diagrama de flujo típico para optimización de procesos en modo modular secuencial (adaptado de Biegler et al., 1997) La función objetivo se define como el retorno de la inversión (ROI) y viene dada en términos del producto neto de ventas (FP) menos los costes fijos del proceso, el coste de las materias primas (FA y FB), los sistemas auxiliares de la planta (FV)y el tratamiento de residuos (Fwaste). Max ROI = [2207 FP + 50FV − 168.F A − 252FB − 2.22FR − Fwaste + 600Vρ − 1041.6] / 6Vρ Dado que el proceso se modeliza en modo modular, las ecuaciones son las mismas que las indicadas en el tema 7. Los elementos adicionales del problema NLP son las ecuaciones y variables de seccionado. En este caso, se eligió para este propósito la corriente de entrada a la columna de destilación y las variables de seccionado (Fd) representan los flujos de los componentes A, B, C, E y P en esta corriente. El problema consta de diez variables y cinco restricciones en forma de ecuaciones : Max ROI = [2207 FP + 50FV − 168.F A − 252FB − 2.22FR − Fwaste + 600Vρ − 1041.6] / 6Vρ s.a. Fd − f ( Fd ) = 0 0 ≤ FP ≤ 4763
580 ≤ T ≤ 680 30 ≤ V ≤ 100 0 ≤ ν ≤ 0.99 F1 , F2 , FR ≤ 0 237
Optimización de procesos con simuladores modulares
Los valores iniciales y finales de las variables se muestran en la tabla I y en este caso es difícil la convergencia del NLP a partir del punto inicial elegido. Además, en este problema hay varios puntos singulares y soluciones locales. El SQP empleado (tal como se ha descrito en el tema anterior) encontró la solución óptima en 196 iteraciones (se pueden encontrar más detalles en el trabajo de Vasantharajan y Biegler, 1988), lo cual indica la necesidad de una buena inicialización del problema y la importancia del tamaño del problema cuando se emplea SQP. Tabla I. Valores de las variables para la optimización del proceso Williams-Otto Variables Punto inicial Valores óptimos 8820 46261.4 FRA 39910 143281 FRB C 2360 7585.83 FR P 7890 18826.5 FR E 31660 141847 FR 11540 13164.3 FA 31230 29991.2 FB 60 30 V 610 674.36 T 0.5806 0.8998 ν 124624 131423 ROI
4. OPTIMIZACIÓN DEL DIAGRAMA DE FLUJO DE LA SÍNTESIS DE AMONIACO A continuación se presenta un ejemplo de un proceso más complejo en el que se lleva a cabo una optimización mediante el algoritmo del camino imposible. En este caso se va a abordar el diagrama de flujo del proceso de producción de amoniaco mostrado en la figura 5. Las corrientes de alimentación con hidrógeno y nitrógeno se mezclan y comprimen, para posteriormente unirse a una corriente de recirculación antes de pasar por un precalentamiento hasta la temperatura de reacción. La reacción tiene lugar en un reactor de lecho fijo con varios lechos (el cual se modeliza como si fuera un reactor de equilibrio), en donde tiene lugar la conversión parcial de la mezcla de reactivos en amoniaco. La corriente de salida del reactor se enfría y el producto se separa tras dos tanques de equilibrio con refrigeración intermedia. La corriente líquida que abandona la segunda etapa sufre una nueva separación de equilibrio (flash) a menor presión con el objeto de obtener un producto licuado de gran pureza. El vapor de la separación de equilibrio en dos etapas da lugar a la corriente de recirculación y se comprime antes de mezclarse con la corriente de alimentación fresca. Este diagrama de flujo se ha resuelto usando el simulador FLOWTRAN, empleando los datos económicos suministrados por defecto en el programa. La función objetivo maximiza el valor actualizado neto de los beneficios, con un 15 % de retorno de la inversión y una vida del proyecto de 5 años. Las variables para la optimización es este caso se muestran en la figura 5 238
Optimización de procesos con simuladores modulares
y en la tabla II; incluyen las variables de seccionado (flujos de las corrientes seccionadas, presión y temperatura). Las restricciones incluyen las ecuaciones con las variables seccionadas (recirculación), cotas inferiores y superiores de la relación de hidrógeno a nitrógeno en la alimentación al reactor, límites de temperatura en el reactor y pureza de producto. La composición de la alimentación viene dada por:
N2 H2 CH4 Ar
Corriente de Hidrógeno Corriente de Nitrógeno 5.2 % 99.8 % 94.0 % 0.79 % 0.02 % 0.01 % -
Sin embargo, en este problema se especifica una producción de amoniaco en lugar de una alimentación al proceso. Como resultado de esto, los flujos de las corrientes de alimentación son variables de decisión y se impone una restricción de producción en todo el proceso.
Figura 5. Diagrama de flujo del proceso de producción de amoniaco (Biegler et al., 1997) El programa NLP viene dado por:
239
Optimización de procesos con simuladores modulares
Max (Beneficios totales al 15 % durante 5 años) s.a.
105 ton NH3/ Balance de presión Ausencia de líquido en compresores 1 .8 ≤ H 2 / N 2 ≤ 3 .5
Treact ≤ 1000 ºF NH3 purgado ≤ 4.5 lbmol/h Pureza del NH3 producido ≥ 99.9% Ecuaciones de seccionado Empleando el algoritmo SQP, se logra la convergencia en sólo cinco iteraciones. Además, a partir del punto inicial indicado en la tabla II, el NLP es difícil de converger. Como resultado de ello, la estrategia de “caja negra” habría tenido serias dificultades con este problema. Por otro lado, la estrategia de optimización del camino imposible requiere únicamente el tiempo de computación equivalente a 2.2 simulaciones base. Usando SQP, la función objetivo mejora desde 20.66·106 $ hasta 24.93·106 $. Los valores óptimos de las variables de decisión también se indican en la tabla II. Se puede encontrar más información sobre este ejemplo en el trabajo de Lang y Biegler (1987). Tabla II. Resultado del problema de optimización de producción de amoniaco Óptimo Punto inicial Cota inferior Cota superior Función objetivo ($106) Variables de diseño 1. T entrada al reactor (ºF) 2. T entrada Flash 1 (ºF) 3. T entrada Flash 2 (ºF) 4. T entrada comp. reciclo (ºF) 5. Fracción purgada (%) 6. P entrada al reactor (psia) 7. Flujo alimentación 1 (lbmol/h) 8. Flujo alimentación 2 (lbmol/h) Variables de seccionado Flujo (lbmol/h) N2 H2 NH3 Ar CH4 T (ºF) P (psia)
240
24.9286
20.659
400 65 35 80.52 0.0085 2163.5 2629.7 691.78
400 65 35 107 0.01 2000 2632.0 691.4
1494.9 3618.4 524.2 175.3 1981.1 80.52 2080.4
1648 3676 424.9 143.7 1657 60 1930
400 65 35 60 0.005 1500 2461.4 643
600 100 60 400 0.1 4000 3000 1000
Optimización de procesos con simuladores modulares
Dada su eficacia, la estrategia del camino imposible se ha convertido en una herramienta muy usada en simuladores modulares. Dado que es fácil de implementar y se puede aplicar directamente a los modelos existentes, su uso se ha convertido en rutinario en el diseño y operación de procesos. Por otro lado, esta estrategia también requiere modelos de operaciones unitarias robustos para las corrientes de entrada y las variables de diseño. Además la convergencia de los modelos en los puntos intermedios del SQP aún puede ser difícil. Con el objeto de abordar estos casos más complejos, en el tema siguiente se van a introducir las estrategias de optimización aplicables al modo orientado a ecuaciones, el cual permite una convergencia más rápida y gran flexibilidad en las especificaciones del problema de simulación.
5. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Lang, Y.-D., Biegler, L.T., A unified algorithm for flowsheet optimization, Comp. Chem. Eng., 11, 143 (1987).
•
Scenna, N.J. (Ed.), “Modelado, Simulación y Optimización de Procesos Químicos”, Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica http://www.modeladoeningenieria.edu.ar
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
•
Vasantharajan, S., Biegler, .T., Large-scale decomposition for Successive quadratic Programming, Comp. Chem. Eng., 12, 1809 (1988).
241
III. Optimización de diagramas de flujo con HYSYS
Optimización de procesos con simuladores orientados a ecuaciones Susana Luque Rodríguez Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Optimización de procesos con simuladores orientados a ecuaciones
ÍNDICE 1. INTRODUCCIÓN ....................................................................................................245 2. ESTRATEGIA SQP A GRAN ESCALA.................................................................246 3. CARACTERÍSTICAS DE SQP CON HESSIANO REDUCIDO ........................252 4. EJEMPLO. OPTIMIZACIÓN EN TIEMPO REAL CON rSQP........................252 5. BIBLIOGRAFÍA ......................................................................................................255
1. INTRODUCCIÓN La simulación de procesos orientada a ecuaciones se ha convertido en un método habitual para diagramas de flujo complejos con recirculaciones anidadas y especificaciones de diseño implícitas. En esta forma de simulación, la convergencia de las operaciones unitarias y la estructura de la recirculación se lleva a cabo simultáneamente a través de un sistema de resolución Newton–Raphson. Además, en el modo orientado a ecuaciones, habitualmente se dispone de derivadas exactas y el funcionamiento de los métodos de resolución de ecuaciones y algoritmos de optimización no se ve deteriorado por errores de redondeo en los gradientes. Por otro lado, se requiere una formulación e inicialización cuidadosa por el usuario lo cual se lleva a cabo mediante estrategias que varían según el problema. Cuantas más ecuaciones se incorporan en el NLP, mayor se hace el tamaño del mismo que se ha de resolver mediante SQP. Los grados de libertad son los mismos, pero el número de variables incorporadas en el algoritmo se incrementa. Por ejemplo, en la estrategia de caja x son las únicas en el problema de optimización. Con el negra, las variables de diseño ~ método del camino imposible en simuladores modulares se incluyen las variables de corrientes a seccionar y las variables de diseño ( ~ x , y). Finalmente, en simulación orientada a ecuaciones, todas las variables de las corrientes y de las operaciones unitarias (x) que se tienen que resolver simultáneamente se han de incorporar en el problema de optimación. Consecuentemente, el algoritmo de programación no lineal que se emplee debe ser adecuado para problemas grandes. A diferencia del modo modular, el coste computacional más significativo en simulación de procesos orientada a ecuaciones no es la evaluación de funciones del diagrama de flujo, sino en el algoritmo NLP en sí mismo. Los modelos son sistemas grandes de ecuaciones con relativamente pocos grados de libertad. Los costes computacionales en los que incurre con el manejo de grandes sistemas de ecuaciones (linealizadas) tienden a ser dominantes, aunque la evaluación de funciones de modelos de propiedades físicas también supone un coste significativo. Por lo tanto, tanto la eficacia del algoritmo como el número de evaluaciones de funciones son aspectos importantes a tener en cuenta cuando se emplea este modo de simulación y optimización de procesos. El algoritmo SQP que se ha presentado en el tema 13 no es adecuado para problemas grandes. Aunque requiere pocas iteraciones y evaluaciones de funciones para lograr la convergencia, el algoritmo SQP básico no explota la estructura dispersa de los gradientes de las restricciones y, 245
Optimización de procesos con simuladores orientados a ecuaciones
en particular, la resolución del subproblema QP se lleva a cabo con una matriz densa (por lo que el esfuerzo para su resolución crece cúbicamente con el tamaño del problema). Por otro lado, los métodos de gradiente reducido (MINOS) sí son adecuados para muchos problemas grandes en el modo orientado a ecuaciones. Mientras que SQP resuelve subproblemas QP, MINOS resuelve subproblemas NLP con restricciones lineales. Debido a ello, requiere muchas más evaluaciones de funciones. Sin embargo, explota la estructura dispersa de la matriz de los gradientes de las restricciones y lleva implementados procedimientos de descomposición matricial muy eficaces. Como resultado de esta descomposición, MINOS es capaz de resolver un problema de optimización no lineal en el espacio reducido definido por los grados de libertad de la optimización. Dado que éstos son un número reducido, MINOS puede resultar muy eficaz para diagramas de flujo simulados en el modo orientado a ecuaciones. Por otro lado, SQP tiene propiedades de convergencia globales mejores que MINOS y en la práctica MINOS habitualmente tiene problemas en manejar las restricciones no lineales que habitualmente se presentan en los modelos de diagramas de flujo. Basado en las características de la optimización en simulación orientada a ecuaciones y en las ventajas relativas de SQP y MINOS, se va considerar una estrategia SQP a gran escala que incorpore mucha de las características que en MINOS permiten resolver problemas grandes a la vez que se vas a preservar las buenas propiedades de convergencia de SQP. El algoritmo SQP resultante combina estos dos aspectos, trabaja en el espacio reducido de las variables de decisión, y aplica algoritmos de descomposición de matrices de estructura dispersa. Consecuentemente, es más de un orden de magnitud más rápido que el SQP básico en problemas de optimización de diagramas de flujo.
2. ESTRATEGIA SQP A GRAN ESCALA Considérese el programa de optimización NPL a gran escala: Min f(z) s.a. h(z) = 0 zL ≤ z ≤ zU Por conveniencia, se convierten las restricciones en forma de desigualdades en igualdades mediante la incorporación de variables de holgura, s≥0. El NLP se redefine con z T = x T s T con n variables y m restricciones en forma de igualdades.
[
]
En la iteración i, el subproblema QP en el SQP se puede escribir como: Min ∇f ( z i )T d + 1 / 2d T B i d
s.a. h( z i ) + ∇h( z i )T d = 0 z L ≤ z i + d ≤ zU
donde d es la dirección de búsqueda en el espacio de n dimensiones y Bi es la matriz hessiana n*n de la función lagrangiana o de su aproximación. 246
Optimización de procesos con simuladores orientados a ecuaciones
En problemas grandes, la aproximación BFGS no es práctica, puesto que genera una matriz grande y densa. En su lugar las aplicaciones de SQP a gran escala se pueden clasificar en dos estrategias generales: • ESPACIO COMPLETO: se explota la estructura dispersa del QP directamente, tanto de Bi como de ∇h, consiguiéndose una factorización eficaz. Un modo de mantener la estructura dispersa de Bi es usando derivadas segundas exactas del lagrangiano. Esta estrategia es especialmente buena en problemas con muchos grados de libertad (por ejemplo, optimización de trayectorias o formas). Sin embargo, en diagramas de flujo, además de la dificultad de obtener las derivadas segundas, la resolución del QP se puede volver más difícil, si el Hessiano no es positivo definido. Consecuentemente, se necesita implementar un algoritmo más complejo. • ESPACIO REDUCIDO (rSQP): sólo se utiliza la estructura de ∇h y se construye una proyección de la matriz Hessiana. El orden de la matriz proyectada es igual a los grados de libertad (n – m) y la matriz sí se puede calcular directamente a partir de derivadas segundas exactas o mediante una aproximación BFGS. Este método se puede derivar a partir de las condiciones de optimalidad del QP. Sin considerar, por el momento, las restricciones en forma de cotas de z, el sistema resultante linear es: ⎡ B ∇h ⎤ ⎡ d ⎤ ⎡∇f ⎤ ⎢ T ⎥ ⎢ ⎥ = −⎢ ⎥ ⎣h ⎦ ⎣∇h 0 ⎦ ⎣λ ⎦
Se define a continuación una matriz Y n*m y una matriz Z n*(n-m) de modo que: ∇h( z i ) Z = 0 y [Y Z ] es una matriz cuadrada no singular Dada la no singularidad de la matriz, la dirección de búsqueda se puede particionar en dos componentes, dY y dZ, respectivamente: d = Yd Y + Zd Z
La matriz Y es una representación del espacio de rango de ∇h( z i ) y el vector dY contiene las variables que satisfacen las restricciones. Por otro lado, la matriz Z es una representación del espacio vacío de ∇h( z i ) T y el vector dZ contiene las variables que se emplean en mejorar la función objetivo. Aplicando la partición de d y multiplicando la primera línea por la transpuesta de [Y Z ] , las condiciones de optimalidad se pueden rescribir de la forma siguiente: ⎡Y T BY ⎢ T ⎢ Z BY ⎢ RT ⎣
Y T BZ Z T BZ 0
⎡Y T ∇f ⎤ R ⎤ ⎡d Y ⎤ ⎢ ⎥ ⎥ 0 ⎥ ⎢⎢d Z ⎥⎥ = − ⎢ Z T ∇f ⎥ ⎢ h ⎥ 0 ⎥⎦ ⎢⎣ λ ⎥⎦ ⎣ ⎦
Donde R = Y T ∇h( z i ) es una matriz cuadrada no singular de orden m. Este sistema es igual que el original, pero es de más fácil descomposición. A partir de la última línea, resolvemos un sistema disperso de m ecuaciones que permite obtener dY: RT dY = − h( z i ) Con esta solución, resolvemos un sistema de n-m ecuaciones en dZ incluidas en la segunda línea: 247
Optimización de procesos con simuladores orientados a ecuaciones
(
Z T BZd Z = − Z T ∇f ( z i ) + Z T BYd Y
)
y con ello la dirección de búsqueda está totalmente definida. Dado que tanto los intervalos de rango como de espacio vacío se desvanecen al llegar a la convergencia, un modo fácil de calcular los multiplicadores de Lagrange es despreciar los términos de la matriz Hessiana en la primera fila de matriz, y calcular: Rλ = −Y T ∇f ( z i ) Para extender esta descomposición para incluir las cotas de las variables, se modifica la forma de calcular el intervalo de espacio vacío. Después de obtener dY, se obtiene dZ mediante el siguiente QP: Min (Z T ∇f ( z i ) + Z T BYd Y ) d Z + 1 / 2d TZ Z T BZd Z t
s.t. z L ≤ z i + YdY + Zd Z ≤ zU con las restricciones en forma de igualdad eliminadas. De esta forma, sólo es necesario calcular (o aproximar mediante BFGS) la proyección del hessiano ZTBY. El término cruzado ZTBYdY se puede evaluar mediante derivadas segundas exactas o aproximarse mediante diferencias finitas, aunque frecuentemente este término se supone nulo lo cual, cuando dY es menor que dZ, no afecta a la convergencia del SQP. La estrategia SQP con el Hessiano reducido presenta una serie de ventaja sobre el algoritmo SQP básico. En particular, las matrices Y y Z se pueden seleccionar de forma que sea posible una factorizaciones eficaz explotando su condición de matrices dispersas. Para ello, se dividen las variables z en n-m (u) independientes y m (v) variables dependientes. La división se hace de forma que v se determinan a partir de las restricciones de igualdad una vez se fijan u. En simulación de diagramas de flujo, por lo tanto, u representa las variables de decisión mientras que v son las variables dependientes que se calculan en el diagrama de flujo. Se divide a continuación el sistema disperso de gradientes de restricciones en:
[
]
∇ z h( z i )T = ∇ u h( z i )T ∇ v h( z i )T = [N C ] donde C es una matriz cuadrada no singular de orden m. Z viene entonces dado por: ⎡I ⎤ Z =⎢ ⎥ −1 ⎣− C N ⎦
y satisface ∇h( z i )T Z = 0 . Y se elige de modo que la matriz n*n [Y Z ] sea no singular, y las dos posibilidades más habituales para ello son la base de coordenadas y la base ortogonal: ⎡0 ⎤ Y =⎢ ⎥ ⎣1 ⎦
⎡ N T C −T ⎤ Y =⎢ ⎥ ⎣I ⎦
Con la base ortogonal Y T Z = 0 y el paso de espacio de rango dY se determina por una proyección de mínimos cuadrados y es de longitud mínima. Esto lleva generalmente a menor número de iteraciones y un funcionamiento más estable de SQP. Por otro lado, el esfuerzo de cálculo de dY es proporcional a (n-m)3.
Con la base coordenada el cálculo es más sencillo, puesto que sólo involucra una factorización de la matriz C, es decir, Cd Y = −h( z i ) . En realidad, este paso es equivalente a 248
Optimización de procesos con simuladores orientados a ecuaciones
calcular el intervalo de Newton para resolver el diagrama de flujo (muy adecuado en implementación de SQP en modelos de procesos grandes). Sin embargo, la determinación de dY mediante la base de coordenadas también puede originar direcciones de búsqueda largas, por lo que habitualmente se requiere el uso de márgenes de seguridad para evitar un funcionamiento pobre durante la resolución del NLP. La estrategia SQP a gran escala es, sin embargo, muy similar al SQP básico (en la tabla I se muestra un resumen de la misma). Exceptuando la eliminación de restricciones en forma de igualdad y la descomposición, la mayor parte de los componentes del SQP básico permanecen, incluyendo el método de búsqueda de la línea, y la fórmula BFGS aplicada a una matriz más pequeña (ZTBZ). No obstante, la diferencia clave entre el algoritmo de la tabla I y el SQP básico es el paso de descomposición para encontrar la dirección de búsqueda en el QP. Para ilustrar cómo funciona el procedimiento de descomposición en espacio de rango y espacio vacío se va a abordar un ejemplo de una iteración de un programa QP.
Tabla I. Resumen del algoritmo rSQP 1. Se elige el punto inicial, z0. 2. Para la iteración i, se evalúan funciones y gradientes, ∇f ( z i ) y ∇h( z i ) . 3. Se calculan las matrices base Y y Z. 4. Se resuelve el paso dY en el espacio de rango utilizando una factorización de matriz dispersa.
(∇h( z ) Y )d i T
Y
= −h( z i )
y, si es necesario, calcula el término cruzado, ZTBYdY. 5. Resuelve el QP reducido para el paso dZ en el espacio vacío: Min (Z T ∇f ( z i ) + Z T BYd Y ) d Z + 1 / 2d TZ Z T BZd Z t
s.t. z L ≤ z i + YdY + Zd Z ≤ zU 6. Si la dirección de búsqueda o el error de Kuhn Tucker es menor que la tolerancia cero, el algoritmo se detiene. 7. En caso contrario, se calcula el paso total d= YdY + Z dZ
8. Se busca un tamaño de paso α de forma que 0 < α ≤ 1 y P (z i + αd ) < P ( z i ) . Cada prueba de tamaño de paso requiere evaluaciones adicionales de f(z) y h(z). 9. Se actualiza el Hessiano proyectado (ZTBZ) usando la fórmula BFGS. 10. Se hace z i +1 = z i + αd , i = i + 1 y se vuelve al paso 2.
249
Optimización de procesos con simuladores orientados a ecuaciones
Ejemplo. Una iteración del algoritmo rSQP En la iteración i, se tiene el siguiente QP con n=3 y m=2: Min ( 5d 1 + d 2 + 4d 3 ) + 1 / 2( d 12 + 4d 22 + 3d 32 ) s.a.
d1+2 d2 = 7 2 d 1+3 d3 = 5 -1 ≤ d1 ≤ 5 -2 ≤ d2 ≤ 6 0 ≤ d3 ≤ 4
Los términos del QP se pueden identificar como sigue:
( )
∇f z
i T
( )
= [5 ,1,4]
hz
i T
⎡1 0 0 ⎤ ⎢ ⎥ y Bi = 0 4 0 ⎢ ⎥ ⎢⎣0 0 3⎥⎦
= [− 7 ,−5]
Las cotas dl QP están dadas por:
z L − z i = [− 1,−2 ,0]
T
z U − z i = [5 ,6 ,4]
T
y los gradientes de las restricciones se pueden dividir en:
( ) = [N C ] = ⎡⎢12
∇h z i
T
⎣
2 0⎤ con C = 0 3⎥⎦
⎡2 ⎢0 ⎣
0⎤ 3⎥⎦
y
⎡1 ⎤
N= ⎢ ⎥ ⎣ 2⎦
La matriz Z de n* (n-m) es:
⎡1 ⎤ ⎡ I ⎤ ⎢ = ⎢− 1 / 2 ⎥⎥ Z =⎢ −1 ⎥ ⎣− C N ⎦ ⎢− 2 / 3⎥ ⎣ ⎦ y eligiendo la base de coordenadas la matriz Y n*m toma la forma:
⎡ 0 0⎤ ⎡0 ⎤ ⎢ ⎥ Y = ⎢ ⎥ = ⎢1 0 ⎣ I ⎦ ⎢0 1 ⎥ ⎣ ⎥⎦
[ ]
Se puede verificar rápidamente que ∇h( z i )T Z = 0 y que Y Z es una matriz cuadrada no singular. Para calcular la dirección de búsqueda, d = YdY + Z dZ se consideran los vectores componentes de rango y espacio vacío. El vector dY de dimensión m se puede evaluar a partir de la siguiente relación:
∇h( z i )T Y = R T = C Lo cual lleva a:
⎡2 0⎤ ⎡7 ⎤ R T d Y = Cd Y = −h( z i ) o ⎢ ⎥ dY = ⎢ ⎥ ⎣0 3⎦ ⎣5⎦ 250
Optimización de procesos con simuladores orientados a ecuaciones y el paso de espacio de rango está dado por d Y = [7 2 , 5 3] . Para el vector Z de dimensiones (n – m), es necesario resolver un QP cuyos elementos se pueden evaluar como sigue: T
⎡ 0 0⎤ ⎡0 ⎤ 7 / 2 ⎤ ⎡ ⎢ = ⎢7 / 2 ⎥ Yd Y = ⎢1 0⎥ ⎢ ⎥ ⎣5 / 3 ⎥⎦ ⎢ ⎥ ⎢⎣0 1 ⎥⎦ ⎢⎣5 / 3 ⎥⎦ ⎡1 0 0⎤ ⎡1 ⎤ T ⎥ ⎢ ⎢ Z BZ = [1 -1/2 − 2 / 3] 0 4 0 = − 1 / 2 ⎥ = 10 / 3 ⎥ ⎢ ⎢ ⎥ ⎣⎢0 0 3⎦⎥ ⎣⎢ − 2 / 3⎦⎥ ⎡5 ⎤ Z ∇f ( z ) = [1 -1/2 − 2 / 3]⎢1 ⎥ = 11 / 6 ⎢ ⎥ ⎢⎣4⎥⎦ T
i
⎡1 0 0⎤ ⎡0 0⎤ ⎡7 / 2 ⎤ Z T BYd Y = [1 -1/2 − 2 / 3]⎢0 4 0⎥ ⎢1 0⎥ ⎢ = −31 / 3 ⎥ ⎢ ⎥ ⎣5 / 3 ⎥⎦ ⎢ ⎣⎢0 0 3⎦⎥ ⎣⎢0 1 ⎥⎦ La combinación de estos términos en el QP:
(
Min Z T ∇f ( z i ) + Z T BYd Y
)d t
Z
+ 1 / 2d TZ Z T BZd Z
s.a. z L − z i − Yd Y ≤ Zd Z ≤ zU − z i − Yd Y da lugar al siguiente QP para obtener dZ: Min ( −17 / 2 )d Z + ( 10 / 6 )( d Z )2
⎡− 1 ⎤ ⎡1 ⎤ ⎡5 ⎤ ⎢ ⎥ ⎢ ⎥ s.a. − 11 / 2 ≤ − 1 / 2 d Z ≤ ⎢5 / 2⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣⎢ − 5 / 3 ⎦⎥ ⎣⎢ − 2 / 3⎦⎥ ⎣⎢7 / 3⎦⎥ cuya solución es
dZ = 5 / 2 Combinando los componentes de rango y espacio vacío, el vector solución es:
⎡0 ⎤ ⎡1 ⎤ ⎡5 / 2 ⎤ ⎢ ⎥ ⎢ ⎥ d = YdY + Z dZ = 7 / 2 + − 1 / 2 (5 / 2) = ⎢9 / 4⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎣5 / 3 ⎥⎦ ⎢⎣ − 2 / 3⎥⎦ ⎢⎣0 ⎥⎦
251
Optimización de procesos con simuladores orientados a ecuaciones
3. CARACTERÍSTICAS DE SQP CON HESSIANO REDUCIDO En el ejemplo anterior se puede observar que la descomposición en espacio de rango y espacio vacío es equivalente a resolver el QP original. Por lo tanto, la estrategia del hessiano reducido (rSQP) tiene mucho en común con el algoritmo SQP básico. Por otro lado, en el algoritmo rSQP, el término ZTBiYdY y el Hessiano ZTBiZ se calculan directamente y no se derivan del Hessiano completo Bi, por lo que no es preciso evaluar o aproximar éste último. Las propiedades de convergencia local son también similares para rSQP y SQP. Además, si se incluye el término cruzado ZTBiYdY (por ejemplo, con una aproximación por diferencias finitas) entonces la velocidad de convergencia pasa de ser superlineal en 2 pasos a 1 paso, ligeramente mejor que el SQP básico. Otra ventaja de la estrategia reducida es que proyección que se realiza del Hessiano es positiva definida en la solución local (como se deriva de las condiciones de optimalidad de segundo orden) mientras que el Hessiano completo no tiene porqué serlo. Como resultado de esto, el uso de la aproximación BFGS para ZTBiZ funciona mejor que su aplicación directa sobre Bi. Por ejemplo, para el problema de Williams-Otto (de tamaño pequeño), eligiendo las variables de las corrientes de recirculación (seccionado) como variables dependientes y resolviendo el problema con rSQP, se requieren sólo 38 iteraciones con la base ortogonal para Y (40 si se emplea la base coordenada), frente a las 196 iteraciones del SQP básico. Como se observa, pues, el rSQP presenta ventajas incluso para problemas pequeños. En problemas grandes, las diferencias computacionales entre los dos métodos están dominadas por las diferencias en los cálculos de álgebra lineal, pudiendo resumirse mediante las siguientes relaciones: Coste del SQP básico = k1 m3 + k2 (n-m)β Coste del rSQP = k3 mα + k4 (n-m)β donde las constantes ki son del mismo orden de magnitud. El exponente α refleja los costes asociados a la descomposición de la matriz dispersa y habitualmente se encuentra comprendido entre uno y dos. El exponente β incluye el coste de resolución del problema QP, y dependiendo del algoritmo seleccionado toma valores comprendidos entre dos y tres. Por lo tanto, en problemas donde n-m sea pequeño, la ventaja clave del rSQP radica en la diferencia entre los dos primeros términos, debida a la eliminación dispersa de las restricciones en forma de igualdad. Esto lleva a diferencias en el funcionamiento de ambos algoritmos para problemas de optimización pequeños (por ejemplo, 1000 variables y menos de 10 grados de libertad) de más de un orden de magnitud. Para problemas de mayor tamaño, la estrategia rSQP es claramente superior.
4. EJEMPLO. OPTIMIZACIÓN EN TIEMPO REAL CON rSQP En este ejemplo se van a determinar las condiciones óptimas de operación para una planta de fraccionamiento tras un proceso de hidrocraqueo. Este problema presenta un proceso existente en el cual se desea realizar una optimización en línea a intervalos regulares para actualizar las 252
Optimización de procesos con simuladores orientados a ecuaciones
condiciones de operación. Esto se denomina optimización en tiempo real. La planta de fraccionamiento separa la corriente que sale de una etapa de hidrocraqueo y la parte más relevante de la misma se muestra en la parte derecha de la figura 1. El proceso tiene 17 componentes, seis unidades de intercambio de calor entre corrientes del proceso y sistemas auxiliares , dos cambiadores de calor entre corrientes del proceso y los siguientes modelos de columna: absorbedor/desorbedor (30 platos), debutanizador (20 platos), separador C3/C4 (20 platos) y desisobutanizador (33 platos). Los detalles de estas unidades se puede obtener de Bailey et al. (1993).
Figura 1. Diagrama de flujo del proceso Sunoco de hidrocraqueo con optimización en tiempo real (Biegler et al., 1997). En la resolución de problemas de optimización en tiempo real, se suele emplear un procedimiento en dos pasos. Primeramente, se resuelve un caso paramétrico para ajustar el modelo a un punto de operación (la solución de este caso proporciona las condiciones de operación en ese preciso momento). A continuación, se lleva a cabo la optimización, comenzando en el punto anteriormente calculado. El modelo del proceso incluye restricciones en forma de igualdad que se emplean para representar las unidades individuales y restricciones en forma de cota que representan los límites de operación físicos de las variables involucradas (por ejemplo, los flujos o las temperaturas siempre han de ser positivos) así como cotas en variables clave que impiden que haya grandes cambios respecto de las condiciones de trabajo iniciales. El modelo consiste en 2836 restricciones en forma de igualdad y sólo diez variables independientes. La estructura de la matriz que genera es razonablemente dispersa, con 24123 elementos no nulos en el jacobiano. La función objetivo para la optimización en línea incluye los costes energéticos así como el valor añadido a las materias primas a lo largo del proceso, y tiene la siguiente forma:
253
Optimización de procesos con simuladores orientados a ecuaciones Np
P = ∑ z i C iG + ∑ z i C iE + ∑ ∑ z i C Pm − U i∈E
i∈E
m =1 i∈Pm
donde: P = beneficios zi = flujos de las corrientes
∑z C
G i
= valor de los productos y materias primas como gasolinas
∑z C
E i
= valor de los productos y materias primas como combustible
i∈E
i∈E
i
i
CPm = costes de productos y materias primas como compuestos puros U = costes de sistemas auxiliares (utilities) Además de la optimización del caso base, se han considerado cuatro problemas adicionales para este proceso. Los casos 2 y 3 estudian el efecto del ensuciamiento de los cambiadores de calor mediante una disminución en los coeficientes de intercambio de calor en los cambiadores de la alimentación y las colas del desbutanizador y del separador C3/C4. Los cambios en las condiciones del mercado se reflejan en un incremento del precio del propano (caso 4) o en un incremento del precio base de la gasolina junto con un incremento de su octanaje (caso 5). Los valores numéricos para todos los parámetros se muestran en la tabla II. Para resolver estos casos se empleó un algoritmo rSQP con base coordenada y con una tolerancia para la convergencia de 10-8. Se ha comparado la resolución de los casos partiendo de un punto inicial no factible y partiendo del resultado del caso base, así como el funcionamiento de rSQP y MINOS. En la tabla II se puede observar como rSQP es 8 veces más rápido de MINOS para la resolución del caso base. Además, en todos los casos MINOS requiere al menos dos órdenes de magnitud más de evaluaciones de funciones que rSQP. Dado que la solución del caso base es el punto de partida para un sistema en línea, resulta también apropiado comparar los resultados de la inicialización paramétrica. Como se observa en la tabla II, el tiempo de CPU es un orden de magnitud inferior en SQP comparado con MINOS. Si además se comparan ambos para el caso de que se inicie el problema con datos imposibles, la ventaja de rSQP sobre MINOS es de al menos dos órdenes de magnitud. Por lo tanto, se puede concluir que rSQP es menos sensible que MINOS a una mala inicialización del problema.
254
Optimización de procesos con simuladores orientados a ecuaciones
Tabla II. Resultados numéricos para el problema de la planta Sunoco de fraccionamiento tras el hidrocraqueo. Caso 0 (base) U (TJ/d ºC) Alim. debutanizador/colas Alim. separador/colas Precio Propano ($/m3) Precio base gasolina ($/m3) Octanaje ($/RONm3) Beneficios Cambio con caso base ($/d, %) Inicialización imposible MINOS Iteraciones (mayor /menor) Tiempo de CPU (s) rSQP Iteraciones Tiempo de CPU (s) Inicialización paramétrica MINOS Iteraciones (mayor / menor) Tiempo de CPU (s) rSQP Iteraciones Tiempo de CPU (s) Tiempo rSQP/MINOS (%)
Caso 1 Caso 4 Caso 5 Caso 2 Caso 3 (base (Cambio (Cambio (Fouling 1) (Fouling 2) optimizado) Mercado 1) Mercado 2)
6.565 10-4 6.565 10-4 1.030 10-3 1.030 10-3
5.000 10-4 5.000 10-4
2.000 10-4 2.000 10-4
6.565 10-4 1.030 10-3
6.565 10-4 1.030 10-3
180 300 2.5 230968.96
180 300 2.5 239277.37 8308.41 (3.6%)
180 300 2.5 239267.57 8298.61 (3.6%)
180 300 2.5 236706.82 5737.86 (2.5%)
300 300 2.5 258913.28 27944.32 (12.1%)
180 350 10 370053.98 139085.02 (60.2%)
5/275 182
9/788 5678
-
-
-
-
5 23.3
20 80.1
12 54.0
24 93.9
17 69.8
12 54.2
n/a n/a
12/132 462
14/120 408
16/156 1022
11/166 916
11/76 309
n/a n/a 12.8
13 58.8 12.7
8 43.8 10.7
18 74.4 7.3
11 52.5 5.7
10 49.7 16.1
-
5. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Bailey, J.K., Hrymak, A.N., Treiber, S.S., Hawkins, R.B., Nonlinear optimization of a Hydrocracker Fractionation Plant, Comp. Chem. Eng., 17, 123 (1993).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Scenna, N.J. (Ed.), “Modelado, Simulación y Optimización de Procesos Químicos”, Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica http://www.modeladoeningenieria.edu.ar
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
255
III. Optimización de diagramas de flujo con HYSYS
Optimización en diseño y operación en la industria química. Aplicaciones Susana Luque Rodríguez Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Optimización en diseño y operación en la industria química. Aplicaciones
ÍNDICE 1. INTRODUCCIÓN ....................................................................................................259 2. FORMULACIÓN DEL PROGRAMA NO LINEAL (NLP).................................260 2.1. Función objetivo ..................................................................................................260 2.2. Restricciones de igualdad ....................................................................................260 2.3. Restricciones de desigualdad (inecuaciones) ......................................................261 2.4. Formulación general ............................................................................................262 2.5. Algoritmo de optimización ..................................................................................262 3. OPTIMIZACIÓN CON HYSYS .............................................................................263 3.1. Parámetros del optimizador .................................................................................264 3.2. Algoritmos de optimización ................................................................................265 3.3. Procedimiento recomendado en optimización.....................................................267 4. EJEMPLO DE OPTIMIZACIÓN: RED DE CAMBIADORES DE CALOR ...268 4.1. Simulación de una red de cambiadores de calor..................................................268 4.2. Optimización de una red de cambiadores de calor ..............................................272 5. BIBLIOGRAFÍA ......................................................................................................274
1. INTRODUCCIÓN Tras haber efectuado la síntesis de un diagrama de flujo y haber seleccionado la estructura básica del mismo, el paso siguiente es la optimización del mismo mediante la modificación de sus parámetros de operación (relacionados bien con las corrientes de proceso o bien con las unidades seleccionadas). Habitualmente, esto se lleva a cabo sobre el diagrama de flujo más prometedor tras la evaluación de un caso base, en el que se ha realizado el dimensionado de los equipos y se ha efectuado una estimación preliminar de los costes de inmovilizado y operación para obtener una análisis preliminar de los beneficios del proceso. En otros casos, sin embargo, la optimización se lleva a cabo mucho en una etapa mucho más temprana del diseño de procesos, mediante el uso de datos de costes aproximados y medidas aproximadas de los beneficios. El diseño de procesos utiliza la optimización principalmente con el objetivo de minimizar costes o maximizar beneficios. Es posible utilizar métodos para optimizar una superestructura de unidades de proceso (con unidades redundantes) de forma que la optimización (que en ese caso emplea variables continuas y discretas –habitualmente binarias- siendo éstas últimas las asociadas a las decisiones de situar o no un equipo en el diagrama de flujo) permite al seleccionar simultáneamente el mejor diagrama de flujo y optimizarlo respecto a sus variables continuas, tales como niveles de presión, relaciones de reflujo, tiempos de residencia, y fracciones separadas. En la práctica, sin embargo, la mayoría de los problemas de diseño no se resuelven usando superestructuras y algoritmos de optimización mixtos (con variables enteras y continuas) puesto que la representación del problema resulta demasiado compleja. En este tema se aplicará lo visto en los temas anteriores para formular un programa no lineal (NLP) para la optimización de un diagrama de flujo de proceso dado. Esto comprende la 259
Optimización en diseño y operación en la industria química. Aplicaciones
definición de una función objetivo, las restricciones de igualdad, que usualmente representan especificaciones del proceso, y las restricciones de desigualdad, que normalmente representan los límites superior e inferior de las variables de operación. Se hará énfasis en el uso de simuladores de proceso que llevan a cabo la optimización mientras convergen los bucles de recirculación. Casi de forma universal, los simuladores comerciales usan la Programación Cuadrática Sucesiva (SQP) para realizar la optimización. En este capítulo se verá cómo HYSYS aborda un problema de optimización con una red de cambiadores de calor
2. FORMULACIÓN DEL PROGRAMA NO LINEAL (NLP)
La formulación de un programa no lineal comienza con la simulación en estado estacionario del diagrama de flujo de un proceso para un conjunto nominal de especificaciones o variables de diseño. Durante la creación del modelo de simulación (que comprende balances de materia y energía, ecuaciones cinéticas, etc., para las unidades del proceso), se ha de llevar a cabo un análisis de los grados de libertad. Habitualmente el número de variables, NVariables, excede el número de ecuaciones, NEcuaciones, de forma que la diferencia entre ambas determina el número de grados de libertad o variables de diseño, ND. Para la primera simulación o caso base, estos se fijan de acuerdo a reglas heurísticas (dictadas por la experiencia). Después, gradualmente, cuando se han llevado a cabo varias simulaciones, la experiencia permite que los valores se ajusten para obtener el mejor diseño. Además, en los problemas de optimización reales las unidades de proceso se simulan con modelos más adecuados posibles(muchas veces, si es necesario se recurre a programación de los mismos), las propiedades termodinámicas y de transporte se adecuan, con frecuencia utilizando datos experimentales y de planta piloto, y se evalúa la rentabilidad. Después de completar estos pasos, y teniendo ya una mejor apreciación de la operación del proceso y alguna indicación de las claves para la optimización, se está ya preparado para formular un problema no lineal.
2.1. Función objetivo Los candidatos para la medida de la idoneidad de un diseño, o de la función objetivo, f(x), (función de las variables de diseño, ~ x ) son las medidas de la rentabiliza del proceso, comenzando con mediadas aproximadas, como es el ROI (retorno de la inversión) o los costes anuales. Para un análisis más profundo se usan medidas más rigurosas que incluyen la variación del valor del dinero con el tiempo y flujos de caja. Estos incluyen el valor actualizado neto (VAN) y la tasa interna de retorno (TIR). Es frecuente empezar con una medida aproximada y cambiar a medidas más rigurosas a medida que el diseño avanza y se perfecciona el modelo del diagrama de flujo.
2.2. Restricciones de igualdad Cuando se usan simuladores de procesos, la mayoría de restricciones de igualdad, c(x)=0, son ecuaciones del modelo asociadas con las unidades del proceso. Por ejemplo, una columna de destilación que se modeliza por etapas en equilibrio de fases con frecuencia tiene varios 260
Optimización en diseño y operación en la industria química. Aplicaciones
cientos de ecuaciones MESH (balances de materia, equilibrio, suma de fracciones molares y balances de energía). Sin embargo, en la implementación de la mayoría de los simuladores, estas ecuaciones se resuelven para cada unidad de proceso, conocidos los parámetros del equipo y las variables de las corrientes (normalmente para las corrientes de alimentación), usando subrutinas de la librería del programa. Por lo tanto, cuando se usan estos simuladores, las ecuaciones (o restricciones de igualdad) para las unidades del proceso no se muestran explícitamente en el NLP. Dados unos valores para las variables de diseño, los simuladores llaman a estas subrutinas para resolver la ecuación apropiada y obtener las variables desconocidas que sean necesarias para llevar a cabo la optimización. Las restricciones de igualdad comprenden potencialmente a todas las variables en el modelo del diagrama de flujo del proceso. En muchos casos, el simulador provee de todas las restricciones de igualdad. Sin embargo, ciertas especificaciones, sobre todo aquellas que comprenden más de una unidad de proceso, pueden requerir que su formulación explícita. Por ejemplo, si se desea que una corriente producto contenga el 95 % de una especie química presente en la corriente de alimentación se necesitaría añadir la siguiente restricción desigualdad:
x i D − 0.95z i F = 0 donde xi es la fracción molar de la especie i en la corriente de producto, con un flujo molar D y zi es la fracción molar de i en la alimentación, con un flujo molar F.
2.3. Restricciones de desigualdad (inecuaciones) La mayor ventaja de llevar a cabo procesos de optimización es que es posible incluir explícitamente las restricciones de desigualdad ( g ( x ) ≤ 0 ) que se usan para limitar la región de operación factible. Por ejemplo, cuando se opera con una bomba centrífuga, la carga desarrollada es inversamente proporcional a la cantidad tratada. Por lo tanto, cuando se varía el flujo mientras se optimiza el proceso, se debe tener cuidado de que el incremento de presión requerido no exceda el que la bomba puede soportar. Tipos similares de restricciones son aquellas relacionadas con la relación de reflujo en destilación, la cual debe exceder Rmin, o con la presión de operación de la torre, de la misma forma que en un cambiador de calor no se debe violar el gradiente mínimo de temperatura entre las corrientes que intercambian calor, ∆Tmin. En general, el usuario debe especificar cuidadosamente las variables de diseño que puedan incumplir las restricciones de desigualdad. En algunos casos, los incumplimientos pueden detectarse cuando se examinan los resultados de la simulación. En otros casos, las subrutinas son incapaces de resolver las ecuaciones – por ejemplo, cuando la relación de reflujo se ajusta por debajo de Rmin para una separación especificada de los componentes clave.
Algunas restricciones de desigualdad incluidas en el NLP simplemente sitúan los límites (cotas) inferior y superior de las variables, xL y xU. Otras permiten la especificación de, por ejemplo, un límite inferior de la fracción recuperada de una especie en la corriente de producto. Por ejemplo, cuando se requiere recuperar más del 95% de la especie i en la corriente de producto, la ecuación (especificación de diseño) anterior se convierte en: x i D − 0.95z i F ≥ 0
261
Optimización en diseño y operación en la industria química. Aplicaciones
2.4. Formulación general
Combinando los componentes vistos, el NLP para la optimación de un diagrama de flujo de proceso se puede escribir como Min f ( x ) ~ x
s.a.
c( x) = 0 g( x) ≤ 0 x L ≤ x ≤ xU
Ha de tenerse en cuenta que mientras el algoritmo de optimización ajusta las variables de diseño, que son un subconjunto de las variables del proceso, las subrutinas resuelven mediante las NEcuaciones las variables del proceso desconocidas, permitiendo la evaluación de la función objetivo y las restricciones, procediéndose al ajuste de las variables de decisión para minimizar el valor de la función objetivo mientras se satisfacen las restricciones.
2.5. Algoritmo de optimización
La forma más directa de mejorar la función objetivo es mediante la simulación repetida. En este procedimiento, se seleccionan valores de las variables de diseño y se completa una simulación. Después, usando generalmente una estrategia sistemática, se ajustan las variables de diseño y se repite la simulación, por ejemplo, usando un análisis de sensibilidad en el simulador de proceso, en el cual los resultados de la simulación se recalculan mientras que una variable de diseño se ajusta usando incrementos uniformes entre los límites fijados por el usuario. Sin embargo, el análisis de sensibilidad puede llevar mucho tiempo y generar archivos de información muy grandes, la mayoría de los cuales están asociados con procesos que no son óptimos. Alternativamente, se puede seleccionar un algoritmo de optimización formal construido dentro del simulador para ajustar las variables de diseño, una estrategia que es normalmente más eficaz. Dentro de esta posibilidad, las estrategias actuales utilizan la optimización simultáneamente con la convergencia de los bucles de recirculación. En estas estrategias, el algoritmo de optimización no converge los bucles de recirculación para cada grupo de variables de diseño. En su lugar, se lleva a cabo sólo un paso a través de los bucles de recirculación antes de ajustar las variables de diseño y, por lo tanto, las estrategias se denominan algoritmos de caminos no factibles. En la mayoría de los casos, la estrategia del camino no factible tiene éxito al converger los bucles de recirculación hacia un diseño factible mientras se optimiza el proceso. Por otro lado, cuando se resuelve un NLP para optimizar un diagrama de flujo es preferible incorporar las especificaciones de diseño como restricciones de igualdad. Antes de implementar una optimización de camino no factible, es muy útil realizar búsquedas preliminares variando las variables de diseño clave, en muchos casos al azar, para tener una idea inicial del problema de optimización. Para estas búsquedas, es casi mejor no utilizar algoritmos de optimización que requiere derivadas, o aproximaciones de ella, como SQP. Un procedimiento común es usar el análisis de sensibilidad del simulador de procesos mencionado anteriormente. Como precaución final, no se deben utilizar planteamientos basados en el gradiente, como SQP, mientras se selecciona una variable de diseño discreta como el número de platos en una 262
Optimización en diseño y operación en la industria química. Aplicaciones
torre de destilación. En estos casos, no tendría sentido estimar las derivadas parciales en la expresión del gradiente de la función objetivo o su matriz Hessiana, porque las variables de diseño están restringidas a cantidades enteras. La misma consideración se puede hacer cuando hay cambios discretos en los costes de los equipos, por ejemplo, cuando una unidad es reemplazada por dos o más unidades. Esto ocurre con frecuencia cuando el tamaño de las variables excede por encima de los límites incluidos en las subrutinas para los cálculos de los costes y tamaño del equipo. Este tipo de cambios discretos es más difícil de detectar cuando se calculan tamaños y costes para varias unidades de proceso en un análisis de rentabilidad complejo. Por esa razón, se recomienda frecuentemente levar a cabo la optimización utilizando inicialmente una función objetivo simple que no incluya discontinuidades. Después, tras encontrar el óptimo, se pueden realizar estimaciones más rigurosas y optimizarlas posteriormente, usando métodos simples (que no incluyan derivadas).
3. OPTIMIZACIÓN CON HYSYS HYSYS tiene incorporado un optimizador que funciona en simulaciones en estado estacionario (no en el modo dinámico) y que se puede emplear una vez que se ha creado un diagrama de flujo y éste se ha resuelto en modo simulación (ha convergido para dar una solución). El “Optimizer” dispone de su propia hoja de cálculo (SpreadSheet) para definir la función objetivo y las restricciones que se van a emplear, lo cual proporciona gran flexibilidad al usuario. Dentro del Optimizer, HYSYS se distingue los siguientes elementos: •
Variables primarias (Primary Variables). Son las variables importadas del diagrama de flujo cuyos valores se van a manipular para minimizar (o maximizar) la función objetivo. Es preciso indicar las cotas inferior y superior de dichas variables (para ello es buena idea usar las opciones DataRecorder o Case Study, de forma que mediante una manipulación manual de las variables se tenga una idea de los límites de operación en las mismas), las cuales se utilizan para delimitar el intervalo de búsqueda así como para normalización de las mismas, que se lleva a cabo mediante la transformación:
x norm =
x − x min x max − x min
•
Función objetivo (Objective Function), que se va a maximizar o minimizar, y puede estar definida directamente a partir de las variables primarias o mediante manipulaciones de éstas que se llevan a cabo en la hoja de cálculo (Spreadsheet).
•
Restricciones (Constraint Functions) que pueden tener la forma de igualdades o desigualdades, y se definen también en la forma deseada en la hoja de cálculo. Se pueden especificar de forma independiente (en la pestaña Functions) los términos de la izquierda (LHS) y la derecha (RHS) de las restricciones, así como la relación entre ambos (<, > o =, en la columna Cond). El usuario también puede decidir multiplicar las restricciones por una constante de penalización (Penalty Value) en los cálculos de 263
Optimización en diseño y operación en la industria química. Aplicaciones
optimización, cuanto mayor sea el valor de dicha constante, más importancia se le da a la restricción en el problema de optimización (el valor por defecto es la unidad). Los métodos de optimización disponibles son los de BOX, mixto y SQP. Todos ellos se pueden emplear con restricciones en forma de desigualdades, mientras que el SQP es el único aplicable al caso en que se tengan restricciones en forma de ecuaciones. Para los problemas de optimización sin restricciones, los métodos disponibles son los de Fletcher-Reeves y QuasiNewton. El usuario también tiene la posibilidad de seleccionar el algoritmo de resolución y los parámetros de éste, tales como el máximo número de iteraciones y la tolerancia.
3.1. Parámetros del optimizador
Los parámetros asociados al algoritmo de optimización que se pueden seleccionar por el usuario son los siguientes: •
Número máximo de evaluaciones de funciones (Maximum Function Evaluations), que no se debe confundir con el máximo número de iteraciones. Durante cada iteración, la parte relevante del diagrama de flujo se resuelve un número de veces, dependiendo de factores tales como el algoritmo de optimización y el número de variables primarias.
•
Tolerancia (Tolerance). HYSYS determina el cambio en la función objetivo entre cada dos iteraciones así como los cambios en las variables primarias normalizadas. Con esta información HYSYS determina si se cumple la tolerancia especificada por el usuario.
•
Máximo número de iteraciones (Maximum iterations), tras las cuales los cálculos se detendrán.
•
Máximo cambio en iteración (Maximum change/iteration) de las variables primarias normalizadas (entre dos iteraciones sucesivas). El valor por defecto es 0.3 (por ejemplo, si se tiene el caudal másico de una corriente entre los límites 0 y 100 kg/h, el máximo cambio permitido en una iteración será de 30 kg/h).
•
Modificación de A/B (Shift A/Shift B). Habitualmente se necesitan derivadas de la función objetivo y de las restricciones con respecto a las variables primarias, y éstas se calculan mediante diferenciación numérica empleando la siguiente expresión:
x shift = ShiftA * x + ShiftB siendo x es la variable que se perturba (normalizada) y xshift es el intervalo de perturbación (también normalizado). En general, no se suele necesitar cambiar los valores de Shift A o Shift B. Este último se incluye con el objeto de asegurar que xshift nunca sea cero. Las derivadas se calculan con la expresión: ∂y y1 − y 2 = x shift ∂x
en la que y2 es el valor de la variable objeto de estudio correspondiente a x+xshift e y1 es el valor correspondiente a x. 264
Optimización en diseño y operación en la industria química. Aplicaciones
Antes de cada iteración, el optimizador necesita determinar el gradiente de la superficie a optimizar en el punto actual, para ello mueve cada variable primaria una cantidad igual a xshift y calcula la derivada para cada función (objetivo y restricciones) usando los valores de y en los dos puntos de x. A partir de esta información y de la historia de la optimización, se seleccionan la dirección de búsqueda y el paso de iteración. Algunos algoritmos realizan la variación de todas las variables primarias simultáneamente, mientras que otros las modifican de forma secuencial. Para determinar cada derivada, por lo tanto, se necesita una evaluación adicional de las funciones (adicional a la precisada en la iteración del diagrama de flujo); por lo tanto, si hay dos variables primarias, se tendrán tres evaluaciones de funciones en cada iteración.
3.2. Algoritmos de optimización
El Optimizer manipula los valores de un conjunto de variables primarias con el objeto de maximizar o minimizar una función objetivo definida por el usuario, construida a partir de un número indeterminado de variables de proceso. Las variables primarias pueden fluctuar en un intervalo que viene dado por sus cotas inferior y superior, respectivamente. Además, los valores iniciales suministrados por el usuario deben estar comprendidos entre estos límites. Si HYSYS falla al evaluar la función objetivo o cualquiera de las restricciones, el optimizador reducirá el paso de la última variable primaria a la mitad y procederá a recalcular el diagrama del flujo. Si la evaluación de la función falla nuevamente, la optimización se detiene. Método BOX Está basado en el método “Complex”, que es una extensión del algoritmo Simplex. Es un método de optimización de los del tipo “caja negra” que requiere que los puntos intermedios (durante las iteraciones) estén todos en la región factible. Este método incorpora una estrategia de búsqueda sistemática que resuelve problema con funciones objetivo no lineales y restricciones no lineales en forma de inecuaciones. No requiere el cálculo de derivadas y no permite el uso de restricciones en forma de ecuaciones (que sí se pueden incluir de forma independiente, como especificaciones de diseño o recirculaciones). No es muy eficaz en términos de número de evaluaciones de funciones. En general, requiere un gran número de iteraciones para que la solución converja, pero en los casos en que es aplicable, es un método muy robusto. El procedimiento de cálculo es el siguiente: 1. Dado unas condiciones iniciales en la región factible, el programa genera un “complex” original de n+1 puntos alrededor del centro de la región factible (siendo n el número de variables). 2. La función objetivo se evalúa en cada punto, y el punto que tiene el mayor valor de la función se reemplaza por otro punto obtenido mediante extrapolación a través de la cara del complex (reflejo). 3. Si el nuevo punto presenta un valor de la función objetivo menor, HYSYS intenta de nuevo una extrapolación. De otro modo, si el nuevo punto es peor que el segundo mayor punto, HYSYS lleva a cabo una contracción en una dimensión. 265
Optimización en diseño y operación en la industria química. Aplicaciones
4. Si un punto persiste en proporcionar valores elevados, todos los puntos se contraen alrededor del punto más bajo. 5. El nuevo punto debe satisfacer tanto las cotas de las variables como las restricciones en forma de desigualdades. Si se sale fuera de ellas, se lleva a la cota más próxima. Si el punto no satisface las restricciones, se mueve hacia el centro de los puntos restantes hasta que satisface todas las restricciones. 6. Los pasos 2 a 5 se repiten hasta convergencia. Método SQP Permite incluir restricciones en forma de igualdades y desigualdades. Es el método más eficaz en problemas de minimización con restricciones lineales y no lineales, si se le proporciona una buena inicialización y el número de variables primarias es pequeño. Permite converger simultáneamente con el problema de optimización tanto las especificaciones de diseño como los bucles de recirculación. La versión implementada en HYSYS sigue esencialmente el algoritmo de Powell. El método minimiza una aproximación cuadrática de la función de Lagrange con aproximaciones lineales de las restricciones. La matriz que contiene las derivadas segundas de la función lagrangiana se estima automáticamente. Usa un método de búsqueda usando la técnica de búsqueda de “pata de perro” de Powell para forzar la convergencia. Método Mixto Este método pretende combinar las ventajas de las características globales de convergencia del método BOX y la eficacia del SQP. Comienza la minimización con el método BOX con una convergencia muy relajada (50 veces la tolerancia deseada) y tras convergencia, pasa a emplear el método SQP para llegar el punto final con la tolerancia deseada. Es capaz de manejar únicamente restricciones en forma de inecuaciones. Método de Fletcher Reeves Este método aplica una modificación del método de gradiente conjugado, y es eficaz para minimización sin restricciones. El procedimiento a grandes rasgos es como sigue: 1. Dado un punto inicial, evalúa las derivadas de la función objetivo respecto de las variables primarias. 2. Evalúa la nueva dirección de búsqueda como el conjugado del gradiente anterior. 3. Lleva a cabo una búsqueda en una dimensión a lo largo de la nueva dirección hasta que localiza un mínimo local. 4. Si alguna variable se sale de sus límites, se limita ésta a su cota. 5. Se repiten los pasos 1 a 4 hasta lograr la convergencia. Método Quasi-Newton (de BFGS) En términos de aplicabilidad y limitaciones, es similar al anterior. Calcula la nueva dirección de búsqueda mediante aproximaciones del inverso de la matriz Hessiana. 266
Optimización en diseño y operación en la industria química. Aplicaciones
3.3. Procedimiento recomendado en optimización
Los problemas de optimización pueden ser muy difíciles de formular y hace que converjan, por ello, es muy importante tener un buen conocimiento del problema de simulación antes de adicionar la complejidad que supone una optimización. El procedimiento recomendado para crear un problema de optimización es el siguiente: 1. Comenzar con una simulación (en lugar de con una optimización). Las razones para esto son: a. Es más fácil de detectar los posibles errores en una simulación b. Se pueden determinar especificaciones que resulten razonables c. Se puede determinar el intervalo razonable de las variables de decisión d. Se puede obtener una buena estimación inicial de las corrientes seccionadas (recirculaciones) 2. A continuación, realizar un análisis de sensibilidad, para encontrar las variables de decisión que resultan más apropiadas, así como sus intervalos de variación. 3. Una vez que se lleva a cabo la optimización, evaluar la solución usando análisis de sensibilidad, para determinar si el mínimo es ancho o estrecho. Las siguientes recomendaciones también resultan útiles en la optimización de diagramas de flujo con HYSYS y, en general, con cualquier simulador de procesos: 1. El proporcionar cotas superiores e inferiores razonables a las variables es muy importante. No sólo previene la generación de diagramas de flujo con valores imposibles (por ejemplo, temperaturas cruzadas en una cambiador de calor) sino también porque las variables se modifican en el intervalo comprendido entre 0 y 1 definido usando dichas cotas. 2. En los métodos BOX y Mixed, el Maximum Change/Iteration de las variables primarias se debe reducir. Un valor de 0.05 a 0.1suele ser apropiado. 3. El método Mixed es el que en general requiere el menor número de evaluaciones de funciones (es decir, es el más eficaz). 4. Si con los métodos BOX, Mixed o SQP no se cumplen bien las restricciones, se puede probar a aumentar la penalización de las mismas (en 3 ó 6 órdenes de magnitud, hasta obtener un valor similar al esperado de la función objetivo). 5. Por defecto, HYSYS minimiza el valor de la función objetivo, aunque es posible que ésta se maximice también. Si se elige la opción Maximize, no obstante, HYSYS internamente minimiza el valor negativo de la función introducida.
267
Optimización en diseño y operación en la industria química. Aplicaciones
4. EJEMPLO DE OPTIMIZACIÓN: RED DE CAMBIADORES DE CALOR
4.1. Simulación de una red de cambiadores de calor
La resolución de problemas para determinar la adecuación del empleo de cambiadores de calor sencillos o múltiples es un problema típico de simulación, en el que equipos existentes se usan en condiciones de operación o en aplicaciones ligeramente diferentes a las inicialmente diseñadas. En estos casos, se debe determinar si es posible emplear los equipos existentes, los cuales tienen limitado su intervalo de funcionamiento por sus valores de UA. El primer ejemplo ilustrativo trata de optimizar el funcionamiento de tres cambiadores de calor independientes. La corriente de entrada a un proceso se debe enfriar, para lo cual se divide en dos, las cuales se enfrían en una batería de cambiadores de calor situados en paralelo. Una de las corrientes se enfría intercambiando calor con una corriente rica en metano (corriente de recirculación que sale como destilado en una columna desmetanizadora) que proviene de una parte posterior del proceso, mientras que la otra parte intercambia calor con una corriente de una unidad refrigerante que emplea propano, tras lo cual intercambia calor con la corriente que abandona un calderín lateral de la columna desmetanizadora situada posteriormente en el proceso.
Las corrientes de entrada al proceso tienen las especificaciones indicadas a continuación. Para este ejemplo se puede emplear el modelo PR. Alimentación (Alim) Temperatura (ºF) Presión (psia) Flujo molar (lbmol/h) Composición Metano (fracción Etano molar) Propano i-Butano n-Butano Condiciones
268
20 1000 2745 0.7515 0.2004 0.0401 0.0040 0.0040
Cabezas desmetanizador (Cab) -142 250 1542 0.9073 0.0927 0.0000 0.0000 0.0000
Refrigerante Colas laterales (Ref) (Col) 120 350 0.0000 0.0000 1.0000 0.0000 0.0000
251 1640 0.2828 0.2930 0.1414 0.1313 0.1515
Optimización en diseño y operación en la industria química. Aplicaciones
En este ejemplo se tienen que incluir en el diagrama de flujo un divisor de corriente, un mezclador, una válvula y tres cambiadores de calor. La incorporación de datos a todos ellos se muestra a continuación:
Cambiador de calor E-100
269
Optimización en diseño y operación en la industria química. Aplicaciones
Parámetros de diseño
∆P tubos (psia) ∆P carcasa (psia) UA (Btu/ºF h) Pérdidas calor Modelo HEX Intervalos (E-100 in) Intervalos (Cab) Punto rocío/burbuja (Cab)
10 10 4.00 e+04 ninguna Weighted 10 10 Inactivo
Cambiador de calor E-101
Parámetros de diseño
270
∆P tubos (psia) ∆P carcasa (psia) UA (Btu/ºF h) Pérdidas calor Modelo HEX Intervalos (E-100 in) Intervalos (Cab)
5 1 5.00 e+04 ninguna Weighted 10 10
Optimización en diseño y operación en la industria química. Aplicaciones
Cambiador de calor E-102
Parámetros de diseño
∆P tubos (psia) ∆P carcasa (psia) UA (Btu/ºF h) Pérdidas calor Modelo HEX Intervalos (E-100 in) Intervalos (Cab) Punto rocío/burbuja (Cab)
5 5 3.50 e+04 ninguna Weighted 10 10 Inactivo
A continuación se incorporan las siguientes especificaciones de corrientes: •
Temperatura de la corriente E-102 out: -40 ºF
•
Fracción de vapor de la corriente E-101 Frío out: 1.00
•
Temperatura de la corriente E-100 out: -65 ºF
•
Presión de la corriente E-101 Frío out: 20 psia
•
No comprobar puntos de burbuja/rocío para los las corrientes frías que entran en E100 o E-102
Con estos datos, el diagrama de flujo converge, y se pueden comprobar los datos calculados en el Workbook:
271
Optimización en diseño y operación en la industria química. Aplicaciones
4.2. Optimización de una red de cambiadores de calor
A continuación, se va a emplear el Optimizer para determinar la división de corrientes óptima de forma que se minimice el valor UA global de la red. Para ello, es preciso eliminar las especificaciones individuales de UA dadas para cada cambiador, y reemplazarlas por las siguientes especificaciones: •
Temperatura de la corriente Col: -85 ºF
•
Flujo de Ref: 495 lbmol/h
•
El flujo de E-101 in: es la variable a optimizar, inicialmente se fija en el valor anteriormente empleado: 1670 lbmol/h
Una vez que se han introducido estas especificaciones, se resuelve automáticamente el diagrama de flujo de nuevo y los UA calculados que se obtienen se encuentran muy próximos a los valores anteriormente especificados.
Para proceder a la optimización del proceso, se abre el Optimizer (F5) en el menú Simulation y el primer paso en la definición del problema es la selección de la variable primaria, fijando las cotas inferior y superior de la misma en 1450 y 1800 lbmol/h, respectivamente.
272
Optimización en diseño y operación en la industria química. Aplicaciones
A continuación, se importan los valores de UA de los tres cambiadores a la hoja de cálculo (SpreadSheet) del Optimizer, para lo cual se presiona el botón SpreadSheet y se selecciona la pestaña SpreadSheet.
La información importada se muestra a continuación. En la celda B4 se introduce la fórmula del sumatorio de los UA (+B1+B2+B3). En la celda B5 se introduce 0.0, valor que se va a emplear posteriormente en las restricciones.
En la pestaña Functions del Optimizer se define la función objetivo y las restricciones. En este caso la función objetivo es la suma de los UA, que estamos tratando de minimizar, calor que importamos desde la celda B4 del SpreadSheet. Es necesario introducir restricciones que aseguren que la solución es razonable. En este caso, el valor UA de cada cambiador ha de ser positivo, para lo cual se completa la zona de restricciones como se muestra a la derecha. En la pestaña Parameters, se elige el método de resolución Mixed, dejando el resto de parámetros con los valores por defecto del programa.
273
Optimización en diseño y operación en la industria química. Aplicaciones
Para que comience la simulación, se presiona el botón Start, y si se desea seguir la evolución de la optimización, se puede ir a la pestaña Monitor.
El valor óptimo encontrado para la corriente E-101 in es de 1800 lbmol/h, correspondiente a un UA global de 1.43·104 But/ºFh, que es aproximadamente un 10 % inferior al valor inicial de 1.56·104 Btu/ºFh.
5. BIBLIOGRAFÍA •
AspenTech, ASPEN Plus 11.1 User guide (2002).
•
Biegler, L.T., Grossmann, I.E., Westerberg, A.W., “Systematic Methods of Chemical Process Design”, Prentice Hall, Nueva Jersey (1997).
•
Hyprotech, HYSYS user’s guide.
•
Scenna, N.J. (Ed.), “Modelado, Simulación y Optimización de Procesos Químicos”, Universidad Tecnológica Nacional, F.R. Rosario (1999). Versión electrónica http://www.modeladoeningenieria.edu.ar
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
274
Simulación de procesos con HYSYS
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias Aurelio B. Vega Granda Susana Luque Rodríguez Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
ÍNDICE 1 INTRODUCCIÓN ....................................................................................................277 2 INTERFACES Y PROCEDIMIENTO OPERATIVO ..........................................278 2.1 Procedimiento operativo......................................................................................279 3 MODELOS SIMPLES DE OPERACIONES UNITARIAS .................................281 3.1 Divisor de componentes (Component splitter) ....................................................281 3.2 Divisor (Te)..........................................................................................................283 3.3 Mezclador (Mixer) ...............................................................................................283 3.4 Válvula.................................................................................................................284 3.5 Compresor (Compressor)/Expansor(Expander) ..................................................285 3.6 Bombas (Pumps)..................................................................................................286 3.7 Enfriador (Cooler)/Calentador (Heater)..............................................................288
1
INTRODUCCIÓN
El programa HYSYS es una extensión de un simulador denominado HYSIM –desarrollado por Hyprotech para simular procesos de gas natural, refino de petróleo, petroquímica y combustibles sintéticos- el cual estaba inicialmente desarrollado sólo para llevar a cabo modelización en estado estacionario. Empleando HYSYS es posible llevar a cabo una simulación en estado estacionario, posteriormente adicionar controladores y activar el integrador para llevar a cabo una simulación dinámica. Es un simulador completamente interactivo que se diferencia de otros simuladores (por ejemplo, ASPEN PLUS, PRO/II o CHEMCAD) en dos aspectos característicos: interpreta interactivamente los comandos, desde el momento en que éstos se introducen, mientras que la mayoría de los simuladores comerciales requieren que se pulse la tecla “Run” una vez que se ha finalizado la introducción de datos. Además, pese a que -al igual que otros programas de simulaciónutiliza subrutinas o procedimientos para modelizar las unidades de proceso, es capaz propagar la información hacia adelante o hacia atrás a través de una operación unitaria. Esto hace que en muchos casos sean innecesarios cálculos iterativos. Cuando se suministra cualquier información nueva, el programa determina automáticamente qué nueva información puede calcularse. A continuación, pasa esta información a cualquier otra operación, conectada a la que dio lugar al cálculo, que a su vez repetirá este proceso hasta que ya no pueda determinarse nueva información. Esto hace que el programa sea rápido y fácil de usar. Además, al igual que otros simuladores, HYSYS permite descomponer el diagrama de flujo global en secciones, de forma que éstas se simulen de forma independiente (por ejemplo, para la estimación de propiedades físicas). A continuación se incluyen algunas indicaciones básicas para el uso de HYSYS en problemas sencillos. Una explicación más detallada, muy útil y fácil de seguir, se puede encontrar en el manual de referencia de HYSYS, disponible electrónicamente.
277
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
2
INTERFACES Y PROCEDIMIENTO OPERATIVO
Cuando se trabaja con HYSYS, se emplean cuatro interfaces –mostradas como ventanas-: (1) El diagrama de flujo del proceso o PFD (Process Flow Diagram), donde se construye el diagrama de flujo que se quiere simular: Se puede imprimir directamente desde el menú del PFD Con doble click en cualquier icono se abre su Property View Con el botón derecho del ratón sobre una corriente u operación se despliega el menú correspondiente
Con el botón derecho del ratón sobre una zona vacía del PFD se accede al menú
(2) El Property View, que es un conjunto de páginas en las que se muestra información en sobre un elemento del diagrama de flujo, corriente u operación unitaria. A continuación se muestra uno para una corriente: Con el botón derecho del ratón sobre la barra del título se accede al menú de impresión
En todo el programa, los valores introducidos por el usuario aparecen en azul y los calculados por el programa en negro
Toda la información de la corriente se encuentra en las hojas correspondientes a las pestañas Se muestra también el status del objeto
Presionando estos botones aparece el Property View de operación anterior o posterior
También se puede emplear el navegador de objetos: Seleccionar el objeto que se desea ver
Presionar el botón Build para entrar en el diagrama de flujo elegido
Los filtros permiten acceder rápidamente a un objeto concreto Presionar el botón View para ver la información del objeto seleccionado (Prop Oxide)
(3) El Workbook, que es un conjunto de páginas en las que se muestra información en forma de tabla, muy similar a una hoja de cálculo:
278
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
Hacer doble click para abrir el Property View
Con el botón derecho del ratón sobre la barra del título se accede al menú de impresión, donde se pueden seleccionar las opciones de impresión
Se pueden introducir directamente los datos, tanto de corrientes como de operaciones
Se puede acceder directamente a las operaciones vinculadas
Las pestañas indican diferentes formas del Workbook
(4) El Summary, una ventana donde se muestra una lista de las corrientes y unidades de proceso de las que consta el diagrama de flujo. Seleccionar la corriente para abrir su Property View
También se puede abrir el Property View de operaciones
Se puede modificar un elemento de una ventana siempre que ésta se encuentre activa. Para facilitar su manejo, HYSYS permite tener abiertas dos o más ventanas simultáneamente. Independientemente de cuál de ellas se encuentre activa, todos los elementos de las demás ventanas se actualizan simultáneamente cuando el usuario introduce nueva información.
2.1
Procedimiento operativo
Cuando se inicia el programa es posible comenzar una nueva simulación o bien abrir un caso previamente almacenado en memoria. En el caso de comenzar un nuevo caso, la primera pantalla corresponde a la selección del paquete termodinámico de predicción de datos de equilibrio (property prediction package) y de los compuestos químicos involucrados en el diagrama de flujo. Conjuntamente, éstos constituyen la base de la simulación (Simulation Basis). En este momento se pueden definir reacciones químicas, que luego estarán disponibles en la modelización de las operaciones unitarias. Finalmente, es posible especificar el sistema de unidades deseado (por ejemplo, SI o Field –americano de ingeniería-) y el modo de nombrar a las corrientes y unidades del proceso. A continuación, aparece el escritorio (Desktop) de HYSYS, junto con la ventana definida por omisión (a elección del usuario ésta puede ser el PFD, el Workbook o el Summary). Empleando las interfaces (ventanas), el usuario puede construir un diagrama de flujo para su simulación e introducir las variables de diseño (grados de libertad), a partir de los cuales HYSYS resuelve los balances de materia y energía. 279
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
2.1.1.1 Introducción de componentes Una de las primeras informaciones a introducir es la referente a los componentes químicos que intervienen en el proceso. El programa dispone de una amplia lista de componentes con sus propiedades, y basta con seleccionarlos. Si no están en la lista, se consideran hipotéticos y deben de introducirse. El programa pedirá datos sobre los mismos (peso molecular, densidad, etc.), debiendo introducirse al menos dos de ellos. Si no se consideran necesarios para los cálculos, se les puede dar cualquier valor. 2.1.1.2 Las operaciones El programa permite resolver un gran número de Operaciones Unitarias de Ingeniería Química. Para ello, HYSYS define y utiliza una serie de subrutinas. Un resumen de las mismas se muestra en la tabla siguiente: Tabla 1. Resumen de unidades (subrutinas de operación) en HYSYS Mezcladores y divisiones Separadores Separadores flash
Mixer Tee Component Splitter Separator 3-Phase separator Tank
Destilación (método abreviado) Separación multietapa (simulación basada en datos de equilibrio)
Shortcut Column
Intercambio de calor
Cooler/Heater Heat Exchanger
Reactores
Bombas, compresores y turbinas Tuberías
280
Column
Lng Conversion Reactor Equilibrium Reactor Gibbs Reactor CSTR PFR Pump Compressor Expander Valve Pipe Segment
Mezcla de corrientes División de corrientes Separador de componentes con dos salidas Alimentación múltiple, una corriente vapor y una líquida como producto Alimentación múltiple, una corriente vapor y dos líquida como producto Alimentación múltiple, una corriente líquida como producto Diseño con el método Fenske-Underwood Separación multifásica genérica, incluyendo absorción, desorción, destilación y extracción líquido-líquido. Es posible añadir secciones de columna y recirculaciones adicionales. Todos los modelos (aplicaciones en refino de petróleo) soportan dos o tres fases así como reacciones químicas. Calentamiento o refrigeración Intercambio de calor entre dos corrientes de proceso Intercambio de calor entre varias corrientes Se especifica la conversión Reacción de equilibrio Equilibrio químico multifásico (no se requiere la estequiometría) CSTR PFR Bomba o turbina hidráulica Compresor Turbina Válvula adiabática Tubería con flujo monofásico o multifásico con transmisión de calor
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
3
MODELOS SIMPLES DE OPERACIONES UNITARIAS
En este capítulo presentaremos un sumario de los modelos rigurosos de las operaciones unitarias más simples disponibles en HYSYS, que permiten resolver los balances de materia y energía sin necesidad de suponer un comportamiento ideal. El desarrollo de los balances de materia y energía es un componente básico en función del cual se tomarán decisiones durante las etapas de evaluación y diseño del proceso. En este capítulo nos centraremos en las operaciones más simples para presentar una representación detallada de estas unidades de operación. El principal objetivo de este capítulo es alcanzar un mejor conocimiento del nivel de detalle de los modelos empleados en los simuladores comerciales, en concreto en HYSYS.
3.1
Divisor de componentes (Component splitter)
Se necesita especificar la fracción de cada componente de la alimentación que sale con la corriente de cabezas (overhead product). Por tanto, se puede emplear para aproximar la separación de un proceso no estándar o propietario que no pueda ser tratado con HYSYS. El divisor de componentes satisface el balance de materia para cada componente: fi = ai + bi donde:
fi = flujo molar del componente i en la alimentación ai = flujo molar del componente i en cabezas bi = flujo molar del componente i en colas
Los flujos molares en cabezas y colas se calculan como: ai = xi fi
bi = (1-xi) fi
siendo xi la fracción (split) del componente i que va por cabezas. Una vez conocidas la composición, fracción de vapor y presión de las corrientes de salida, se efectúa un flash P-VF para obtener las temperaturas y flujos de calor. Un balance global de calor permite obtener el flujo de calor: hE = hF – ho - hB donde:
hE = entalpía del corriente de energía desconocida hF = entalpía de la alimentación ho = entalpía de la corriente de cabezas hB = entalpía de la corriente de colas
En la página de Conexiones se especifican un número ilimitado de alimentaciones, así como los nombres de las corrientes de salida (cabezas y colas), y un número ilimitado de corrientes de energía (de las cuales una se debe dejar como incógnita para que se pueda calcular mediante el balance de energía).
281
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
En la página de Parámetros se deben fijar las especificaciones del sistema: fracción de vapor y presión en cabezas, presión en colas, y si se ha incluido alguna corriente de energía también la fracción de vapor en colas.
En la página Splits se tiene que especificar para cada componente la fracción de separación por cabezas. En la página Worksheet podemos observar los resultados de los cálculos
282
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
3.2
Divisor (Te)
Esta operación divide una corriente de alimentación en múltiples corrientes de producto, todas con la misma composición y condiciones que la alimentación. Se usa para simular Tes en tuberías. En la página de Conexiones se deben proporcionar los nombres de la alimentación y de las salidas. En la página Splits se deben fijar N-1 relaciones de flujo, siendo N el número de salidas, ya que N
∑r i =1
donde:
i
= 1.0
y ri =
fi F
ri = relación de flujo de la corriente i-ésima fi = flujo de salida de la corriente i-ésima F = flujo de la alimentación N = número de corrientes de salida
3.3
Mezclador (Mixer)
Es una operación que combina dos o más entradas para producir una única salida. Se efectúan los correspondientes balances de materia y energía completos, es decir, se calcula rigurosamente una de las temperaturas desconocida, bien a la entrada o a la salida. Si se conocen todas las propiedades (temperatura, presión, y composición) de todas las corrientes de entrada, se calculan automáticamente todas las propiedades de la corriente de salida, ya que se conocen composición, temperatura y entalpía para esta corriente. En la página de Conexiones se especifican las corrientes de entrada, así como una única corriente de salida. En la página de Parámetros se debe indicar el tipo de asignación automática de presión. Por defecto se emplea la asignación de fijar como presión de salida la más baja de las entradas (Set Outlet to Lowest Inlet), en cuyo caso se deben conocer todas las presiones excepto la de salida. Si se especifica ecualizar todas (Equaliza All), HYSYS asignará a todas las corrientes conectadas a la operación la misma presión una vez conocida una de ellas. Si dos o más corrientes tienen presiones distintas se producirá un error de consistencia. 283
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
3.4
Válvula
La operación válvula realiza un balance de materia y energía a dos corrientes. Se necesita indicar las corrientes de entrada y salida, y se puede especificar la caída de presión a través de la válvula. HYSYS efectúa un flash basado en la igualdad de materia y energía entre las dos corrientes. Por ejemplo si sólo se especifica la presión de la corriente de salida, se calcula la temperatura a la salida mediante un flash isoentálpico (dado que la entalpía de entrada es conocida). La operación válvula calculará solo una incógnita de entre las dos corrientes, que puede ser: temperatura a la entrada, presión a la entrada, temperatura a la salida, presión a la salida.
284
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
3.5
Compresor (Compressor)/Expansor(Expander)
El compresor se utiliza para aumentar la presión del gas a su entrada. Dependiendo de la información facilitada, calculará o una propiedad de la corriente (presión o temperatura), o la eficacia de compresión. El expansor se usa para disminuir la presión de una gas a alta presión en la entrada y producir un gas a baja presión y alta velocidad. Un proceso de expansión implica convertir la energía interna del gas en energía cinética y finalmente en trabajo. El expansor calculará o una propiedad de la corriente o la eficacia de la expansión . Para un compresor la eficacia viene dada por la relación entre la potencia isoentrópica (ideal) requerida y la potencia real requerida. Para un expansor, la eficacia viene dada por la relación entre la potencia real producida por el fluido y la potencia producida en una expansión isoentrópica. Para un compresor o expansor adiabático, HYSYS calcula la compresión (o expansión) rigurosamente, siguiendo la línea isoentrópica desde la presión de entrada hasta la de salida. Usando la entalpía en este punto, así como la eficacia especificada, determina entonces la entalpía a la salida. A partir de este valor y la presión de salida se determina la temperatura a la salida. Para un compresor o expansor politrópico, el camino del fluido no es ni adiabático ni isotérmico. Cuando la eficacia es del 100 %, es el único caso en que el proceso es reversible. Para procesos irreversibles, la eficacia politrópica es menor del 100 %. Dependiendo de si el proceso es una expansión o compresión, el trabajo determinado por el proceso reversible mecánicamente se multiplica o divide por la eficacia real para dar el trabajo real. Las formas de las ecuaciones para las eficacias politrópicas son iguales a las anteriormente expuestas. Todas las entropías y entalpías se determinan de forma rigurosa empleando el paquete de propiedades especificado. En general, el trabajo para un proceso reversible mecánicamente se puede determinar a partir de la expresión:
W = ∫ PdV La potencia real requerida es la diferencia entre las entalpías a la entrada y a la salida. Existen varios métodos para la resolución el compresor/expansor dependiendo de la información facilitada. En general, la solución es una función del flujo, cambios de presión, energía aplicada y eficacia. Métodos típicos de resolución son: 1. Conocidos el flujo y la presión de entrada. 2. Especificada la presión de salida. 3. Especificada la eficacia adiabática o politrópica. 4. HYSYS calcula la energía requerida, la temperatura de salida y otra eficacia. Otra posibilidad de cálculo es: 1. Conocidos el flujo y la presión de entrada. 2. Especificada la eficacia y energía requerida. 3. HYSYS calcula la presión de salida, temperatura y otra eficacia.
285
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
En la página de Conexiones, como se muestra en la figura, es preciso indicar las corrientes de entrada, salida y de energía. En la página de Parámetros se puede especificar la energía necesaria (duty) o permitir que HYSYS la calcule.
3.6
Bombas (Pumps)
Se emplean para aumentar la presión de la corriente líquida a su entrada. Dependiendo de la información suministrada puede calcular una presión o temperatura desconocidas, o la eficacia de la bomba. Los cálculos están basados en la potencia estándar para la potencia de una bomba, que utiliza el aumento de presión, el flujo de líquido y la densidad: Potencia requeridaideal =
donde:
(Pout − Pin ) × Flujo densidad del liquido
Pout = presión a la salida Pin = presión a la entrada
La potencia anterior corresponde a la potencia ideal necesaria para elevar la presión del líquido. La potencia real se define en términos de la eficacia de la bomba, definida como la relación entre la potencia ideal y la real. 286
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
Cuando la eficacia sea menor del 100 %, el exceso de energía provocará una elevación de la temperatura en la corriente de salida.
Potencia requerida real =
Potencia requeridaideal × 100 % Eficacia
Finalmente, la potencia real es igual a la diferencia de energía entre la salida y la entrada. Si la alimentación está completamente definida, es posible calcular dos de las siguientes variables: •
Presión a la salida o caída de presión
•
Eficacia
•
Energía de la bomba
HYSYS también puede calcular hacia atrás la presión a la entrada. Adviértase que una bomba con una eficacia del 100 % no corresponde a una compresión isoentrópica del líquido, ya que los cálculos se hacen con la suposición de que el líquido es incompresible. Suposición aceptable para líquidos alejados del punto crítico. Sin embargo, si se desea llevar a cabo un cálculo más riguroso para el bombeo de líquidos compresibles (por ejemplo, en las proximidades del punto crítico), se debe instalar un compresor para representar la bomba.
287
Introducción al uso de HYSYS. Modelos simples de operaciones unitarias
3.7
Enfriador (Cooler)/Calentador (Heater)
Los enfriadores y calentadores son intercambiadores de calor en los que solo se está interesado en una de las partes del intercambio, y por lo tanto lo importante es la energía requerida para enfriar o calentar una corriente de proceso, pero no se está interesado en las condiciones o el fluido de utilidad. Ambas operaciones usan la misma ecuación básica, la única deferencia es la convención para el signo de la energía. Para el enfriador a la entalpía de entrada se le resta la corriente de energía del cooler: Flujo de calorentrada – Energíacooler = Flujo de calorsalida Para el calentador la corriente de energía se suma a la entrada: Flujo de calorentrada + Energíacooler = Flujo de calorsalida Los parámetros aplicables son la caída de presión y el intercambio de energía. Ambos parámetros se pueden especificar directamente o ser determinados a partir de las corrientes conectadas a la operación. Hay que recordar que HYSYS usa el convenio de signo adecuado para la unidad, de manera que independientemente de la operación hay que especificar siempre un valor positivo para el intercambio de energía.
288
Simulación de procesos con HYSYS
Simulación de procesos con HYSYS. Aspectos básicos Susana Luque Rodríguez Aurelio B. Vega Granda Departamento de Ingeniería Química y Tecnología del Medio Ambiente
Simulación de procesos con HYSYS. Aspectos básicos
ÍNDICE 1. EJEMPLO: SEPARACIÓN DE AMONIACO Y AGUA......................................291 1.1. Análisis de sensibilidad o paramétrico ................................................................297 2. RESOLUCIÓN DE NUEVOS PROBLEMAS......................................................300 2.1. Problema adicional ..............................................................................................300 3. BIBLIOGRAFÍA ......................................................................................................301
1. EJEMPLO: SEPARACIÓN DE AMONIACO Y AGUA Se trata de un proceso cuyo objetivo es la separación de una corriente de 10000 lb/h, mezcla de amoniaco (80 % en peso) y agua, en estado de vapor saturado a 250 psia. Para lograrlo se combinan un condensador (en el que se retira energía a una velocidad de 5.8·106 Btu/h), una válvula de expansión y un separador flash que trabaja a 100 psia. El objeto de la simulación es determinar la composición de la corriente líquida que sale del separador, despreciando las pérdidas energéticas de todos los equipos hacia los alrededores y la caída de presión en el condensador. VAPOR
Unidad de Separación
ALIMENTACIÓN
Condensador LÍQUIDO
Paso 1. Selección del paquete de propiedades y definición de la base para la simulación En primer lugar es necesario definir el sistema con el que se trabaja y el método de predicción de propiedades que se desea utilizar, lo cual se lleva a cabo mediante el Simulation Basis manager, apareciendo el menú mostrado a la derecha.
Dado que se debe definir un nuevo paquete de propiedades, se debe hacer clic en el botón Add..., lo que resulta en que
291
Simulación de procesos con HYSYS. Aspectos básicos
en el botón Add..., lo que resulta en que aparezca la ventana Fluid Package: Basis1, en el que se debe seleccionar un método de predicción de propiedades (en el manual de HYSYS se describen brevemente dichos métodos). En este caso se elige la ecuación de estado SoaveRedlich-Kwong (SRK), como se muestra a la derecha. Para este problema, las especies químicas involucradas son agua y amoniaco, las cuales se adicionan a la información base del proceso abriendo la hoja correspondiente a la pestaña Components, como se muestra en la siguiente figura. Para adicionar un compuesto químico, se teclea su nombre o su fórmula en el campo Match. A la vez que se introduce el texto, HYSYS intenta buscar en su base de datos el compuesto correspondiente.
Una vez seleccionado el compuesto, éste se adiciona presionando el botón Add pure. Después de añadir el agua, la pantalla se muestra como en la figura de la derecha. Si se presiona el botón Close, el programa devuelve el control al Simulation basis manager. A continuación, presionando el botón en la parte inferior de la ventana (Enter Simulation Environment...), se entra en la ventana principal del simulador.
292
Simulación de procesos con HYSYS. Aspectos básicos
Paso 2. Introducción de las especificaciones de corrientes para los balances de materia y energía En este ejemplo, el Workbook está definido como ventana por omisión. Por ello, las especificaciones de las corrientes se muestran en forma de hoja de cálculo, en la que las variables de cada corriente están dispuestas en columnas.
Inicialmente, el Workbook tiene las cuatro páginas indicadas en la figura: una con los datos de las corrientes de materia (Material Streams), la siguiente incluyendo las composiciones de todas las corrientes (Compositions), una página con los requerimientos energéticos de cada equipo (Energy Streams) y la última, desde donde se puede acceder a las variables y parámetros de las operaciones unitarias (Unit Ops). Es posible adicionar más páginas al Workbook yendo al botón Workbook en el menú de HYSYS, y seleccionando la opción Setup. El sistema de unidades empleado en los datos de las corrientes se selecciona mediante el botón Tools-Preferences en el menú de HYSYS. En este ejemplo se ha seleccionado el sistema americano (Field). Sin embargo, en la resolución de todos los problemas de esta práctica se ha de usar el sistema internacional (SI). Empleando el Workbook, el usuario introduce valores para las variables. Cuando HYSYS tiene disponibles todos los datos necesarios (se han suministrado tantos datos como grados de libertad), procede a calcular directamente los datos desconocidos. Para definir la corriente de alimentación es preciso seleccionar un nombre para la misma (A, en este caso), como se muestra en la figura anterior, en la que se han introducido tres de las variables de la corriente, con la fracción de vapor fijada en la unidad, lo que indica que se trata de vapor saturado.
293
Simulación de procesos con HYSYS. Aspectos básicos
En este punto, la corriente no está completamente especificada, con varios datos marcados como vacíos (<empty>), puesto que la composición de la corriente no se ha especificado. Para ello se debe hacer doble clic en el flujo másico en la columna 2, que abre la ventana Input Composition for Stream A, en la que se pueden introducir las fracciones másicas de amoniaco y agua. Tras pulsar OK, HYSYS vuelve al Workbook, en donde las definición de la corriente ya está completa, como se muestra a la derecha (y las variables definidas por el usuario se indican en azul)
A continuación, se instala el condensador, usando la operación Cooler, para lo cual se hace doble click sobre el icono correspondiente de la paleta de objetos situada a la derecha (Mediante la tecla F4 se accede a la paleta, si ésta no está visible), con lo que se abre una nueva ventana correspondiente al Property view del condensador.
294
Simulación de procesos con HYSYS. Aspectos básicos
Se introducen los nombres de las corrientes entrante y saliente en la página de Connections, y la pérdida de carga (Pressure drop) se especifica en la página Parameters, donde además es posible indicar la energía transmitida (Duty). En este ejemplo, A es la corriente de entrada, B la de salida y C-DUTY la corriente de energía. Después de introducir el valor de la pérdida de carga (nula) y de cerrar la ventana del Property view del condensador, el Woorkbook presenta el aspecto mostrado en la figura de la derecha. La corriente de salida, B, no está completamente definida hasta que se especifique bien la temperatura de salida, bien la energía eliminada en el condensador. La energía se puede especificar en la página Energy Streams, como se muestra en la figura, o bien en la página Parameters del Property view del condensador, como se ha mencionado. Tras especificarla, el Workbook tiene el aspecto indicado a la derecha.
A continuación, se adiciona la válvula de expansión (VLV100) al diagrama de flujo, usando la operación Valve, a cuyo Property view se accede mediante un doble click sobre el icono de la paleta de objetos. Se introducen los nombres de las corrientes de entrada y salida (B y C, respectivamente) en la página Connections, y la pérdida de carga en la pagina Parameteres (o en el Workbook introduciendo directamente el valor de la presión de la corriente de salida). 295
Simulación de procesos con HYSYS. Aspectos básicos
El aspecto que tiene entonces el Workbook se muestra a la derecha.
El último paso es definir las variables asociadas con el separador flash, al cual se accede con un doble clic sobre el icono Separator, en la paleta de objetos. Tras introducir los nombres de las corrientes de entrada y salida, VAP y LIQ, en Connections, el Workbook tiene el aspecto indicado en la figura de la derecha:
Para obtener las fracciones másicas en la corriente de producto líquido, se hace doble click en el campo Mass Flow en la columna de la corriente LIQ.
Finalmente, es posible visualizar el diagrama de flujo seleccionando el botón PFD en l barra de herramientas:
296
Simulación de procesos con HYSYS. Aspectos básicos
1.1. Análisis de sensibilidad o paramétrico Una de las principales ventajas de los programas de simulación es la facilidad para, una vez establecido un diagrama de flujo, estudiar el efecto de variaciones en las corrientes o las unidades de proceso. Para ilustrar esto, modificar en el caso ejemplo desarrollado la energía retirada en el condensador (tomar, por ejemplo, seis valores comprendidos entre 1·106 y 6·106 Btu/h) y anotar los flujos y composiciones de la corrientes de salida del separador flash Esto se puede llevar a cabo usando el DataBook (en el menú Tools). Esta herramienta permite seleccionar variables a modificar y visualizar los resultados de los cálculos sucesivos en forma gráfica (de forma que se pueden analizar posibles efectos transitorios), así como evaluar en diferentes posibles casos problema el efecto que sobre las variables clave del proceso (variables dependientes) tienen los parámetros modificados (variables independientes). Todas las variables que se van a utilizar (tanto independientes como dependientes) se han de seleccionar primeramente en la página Variables del DataBook, pulsando en el botón Insert..., tras lo cual aparece la lista de diagramas de flujo (y sus subdiagramas), los objetos y las variables asociadas a cada objeto. De esta forma se puede seleccionar el Heat flow (flujo de energía) de la corriente energética C-DUTY asociada al diagrama de flujo principal que será la variable independiente, así como las variables dependientes en el ejemplo (flujos de VAP y LIQ y composición de las mismas):
297
Simulación de procesos con HYSYS. Aspectos básicos
Una vez que se han seleccionado todas ellas, la página Variables del DataBook presenta el siguiente aspecto:
El siguiente paso es registrar las coordenadas (denominadas datos “Data”), lo cual se puede llevar a cabo de dos formas. La primera alternativa es usar el Data Recorder, en el cual los grupos de variables dependientes e independientes, definidos como states (estados), se almacenan manualmente de la forma deseada. Para ello, primeramente se selecciona en la pestaña Data Recorder un Scenario (escenario) o bien se adiciona uno nuevo (Add...) y se seleccionan las variables que se han de incluir en el estudio (en este caso todas), marcando las casillas correspondientes
298
Simulación de procesos con HYSYS. Aspectos básicos
A continuación, cada solución que aparece en el Workbook se almacena en el Data Recorder como un state, tras activación del botón Record... en la página Data Recorder. A modo de ejemplo se muestra el resultado (denominado State 1, y visualizado tras pulsar View) en forma de tabla para el estado actual (resultado de la simulación anteriormente realizada). También es posible ver los resultados en forma gráfica. Claramente, esta opción no es muy adecuada cuando se quieren evaluar un gran número de casos. Para estas situaciones es más conveniente elegir la segunda alternativa: la opción Case Studies, en la cual el estudio paramétrico se hace de forma automática. Para ello el primer paso es establecer el problema, en la página Case Studies del DataBook. Esta página contiene una lista de variables dependientes e independientes a la derecha, y un nombre asociado al estudio a efectuar a la izquierda
El intervalo de variación de las variables independientes (indicado por una cota inferior, una superior y el incremento por paso) se ha de estipular en la página Case Studies Setup –Main, accesible tras pulsar el botón View...
Tras completar estos valores, los cálculos se inician pulsando la tecla Start, lo cual hace que se repitan automáticamente los cálculos de la simulación para cada valor de la variable independiente definida anteriormente. Los resultados (Results...) se pueden visualizar bien en forma gráfica o de tabla.
299
Simulación de procesos con HYSYS. Aspectos básicos
De la misma forma se puede, por ejemplo, modificar la condición (fracción de vapor) de la alimentación (tomando cinco valores entre 0.8 y 1), para un valor dado de la energía retirada en el condensador y observar el efecto de la misma sobre los flujos y composición de las corrientes de salida.
2. RESOLUCIÓN DE NUEVOS PROBLEMAS Para resolver nuevos problemas, se selecciona New case en el menú principal de HYSYS.
2.1. Problema adicional El tolueno se produce a partir de n-heptano por deshidrogenación con un catalizador de Cr2O3 adsorbido sobre Al2O3:
Como se muestra en el diagrama de flujo siguiente, el n-heptano se calienta desde 65 hasta 800 ºF, y luego se alimenta al reactor, que opera isotérmicamente, y con una conversión del 15 % (molar) de n-heptano a tolueno. La salida del reactor se enfría hasta 65 ºF y se alimenta a un separador de equilibrio.
Aliment. n-heptano
Vapor
SOBRECALENTADOR
Separ ador flash Ener gía sobr ecalentador
REACTOR CATALÍTICO
Líquido
Suponiendo que todas las unidades trabajan a presión atmosférica, se pide determinar los flujos de las especies en todas las corrientes. El separador de equilibrio se emplea para eliminar el hidrógeno y normalmente se usa una columna de destilación para posteriormente recuperar el tolueno. 300
Simulación de procesos con HYSYS. Aspectos básicos
Una vez resuelto este problema se puede modificar para mejorar la integración energética del proceso. Para ello se puede introducir un precalentamiento de la alimentación, usando la corriente de salida del reactor como fuente de energía, lo cual implicaría un menor consumo energético del proceso. Para el sistema con recuperación energética, se puede estudiar el efecto que sobre la energía necesaria en el sobrecalentador y el producto UA del precalentador tiene la temperatura de precalefacción.
3. BIBLIOGRAFÍA •
Hyprotech “HYSYS user’s guide” (2001).
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
301
Simulación de procesos con HYSYS
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones Aurelio B. Vega Granda Susana Luque Rodríguez Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones
ÍNDICE 1. PRODUCCIÓN DE CLORURO DE ETILO ........................................................305 2. RESOLUCIÓN PASO A PASO ...............................................................................305 3. PROBLEMA ADICIONAL: BUCLE DE REACCIÓN EN EL PROCESO DEL AMONIACO ............................................................................................................. 311 4. BIBLIOGRAFÍA ......................................................................................................312
1. PRODUCCIÓN DE CLORURO DE ETILO Una de las rutas para obtener cloruro de etilo es por reacción en fase gas del HCl con etileno en presencia de un catalizador de cloruro de cobre soportado sobre alúmina. C 2 H 4 + HCl → C 2 H 5 Cl En el proceso que se muestra en la figura, la corriente de alimentación está compuesta por un 50 % mol de HCl, 48 % mol de C2H4, y 2 % mol de N2 con un flujo de 100 kmol/h a 25 ºC y 1 atm. Dado que la reacción alcanza solamente una conversión de 90 % mol, el producto cloruro de etilo se separa de los reactivos sin reaccionar, y posteriormente se recicla. La separación se lleva a cabo en una columna de destilación, donde se supone que se produce una separación perfecta. El proceso se opera a presión atmosférica y se desprecia la caída de presión. Para prevenir la acumulación de inertes en el sistema, se hace una purga de 10 kmol/h.
2. RESOLUCIÓN PASO A PASO Los pasos necesarios para llevar a cabo esta simulación en HYSYS son:
305
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones
1. Selección del paquete de propiedades y definición de la base Esto se realiza invocando al Simulation Basis Manager, donde se selecciona como ecuación de estado PengRobinson, y ethylene, ethyl chloride, and nitrogen como componentes. Dado que vamos a suponer separación perfecta en la columna de destilación, la ecuación de Peng-Robinson es suficiente. 2. Definición de conversión
la
reacción
de
En el Simulation Basis Manager, dentro de la pestaña Reactions hay que definir la reacción que va tener lugar. Para ello se pulsa sobre el botón Add to FP con el objeto de añadir el Fluid Package, anteriormente definido, al conjunto de reacciones. Posteriormente se pulsa el botón Add Comps con lo que aparecerá otro formulario donde pulsaremos el botón Add This Group of Components. Con esto tendremos todos los componentes que habíamos definido anterior-mente. Pulsaremos ahora Add Rxn con el fin de definir la estequiometría de la reacción, el componente base, la fase en la que tiene lugar la reacción, y el valor de la conversión.
306
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones
3. Introducir las especificaciones Se define la corriente de alimentación (FEED) con los datos indicados anteriormente.
4. Se instala la operación unitaria Mixer, MIX-100 En el Workbook dentro de la pestaña Unit Ops se selecciona añadir unidad de operación y se selecciona la unidad Mixer. Esta unidad se alimenta con las corrientes FEED y R*, y tiene como corriente de salida S2. Como R* es una corriente no definida se inicializa con un flujo cero y una composición igual a la de la alimentación. De esta forma se permite llevar a cabo los cálculos. Posteriormente generaremos un mecanismo para permitir la actualización de esta corriente hasta que se alcance la convergencia. También es posible adicionar posteriormente al Mixer esta corriente de recirculación. 5. Se instala un reactor de conversión De manera análoga a la instalación del Mixer se instala un reactor de conversión. Se le asocia el Reaction Set previamente definido en el apartado 2.
307
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones
6. Se instala el divisor de componentes (Component Splitter) D-1 Esta operación va a simular la columna de destilación en la que se produce la separación perfecta (100 % de pureza) del cloruro de etilo por colas, con los otros tres componentes en la corriente de cabezas. Para completar la definición de esta unidad es preciso fijar las presiones en cabezas y colas, junto con las temperaturas de las corrientes o las fracciones de vapor. Después de efectuar estos pasos el Workbook aparecerá como se indica en la figura adjunta.
7. Instalación del divisor de flujo (Te), TEE-100 Tiene como entrada la corriente de destilado S4 y como salidas la corriente de purga W, y la de reciclo R. En el Workbook se especifica como flujo de W 10 kmol/h de manera que la unidad quedará completamente definida.
308
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones
8. Instalación del reciclo, RCY-1 La corriente R entra en un unidad matemática de convergencia de reciclo, que compara las variables correspondientes a las corrientes R* y R y comprueba el criterio de convergencia. Cuando la convergencia no se alcanza en la primera iteración, se usa el método de Wegstein para actualizar las variables de R* después de llevar a cabo otra iteración sobre el bucle de reciclo.
En la siguiente figura se muestra el diagrama de flujo completo, y en la siguiente los resultados obtenidos simulando el proceso con HYSYS, con una purga de 10 kmol/h. Los resultados muestran que el flujo del reciclo es de 6.579 kmol/h y que la alimentación al reactor S2 contiene 3.09 % mol de nitrógeno.
309
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones
También se puede investigar el impacto del flujo de purga sobre el flujo del reciclo y sobre la composición a la entrada del reactor. Se accede al Databook a través del menú Tools/Databook. En la pestaña Variables se seleccionan las variables fracción molar de nitrógeno en la corriente S2, flujo molar de purga W, y flujo másico de la corriente de reciclo R.
En la pestaña Case Studies se pulsa el boton Add para añadir un nuevo caso. Se selecciona el flujo molar de la purga W como variable independiente, y las otras dos como variables dependientes. Se pulsa sobre el botón View
310
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones
Se hace variar el flujo molar de la purga W desde 5 hasta 13 kmol/h en cambios de 0.5, y se pulsa el botón Start, con lo que se iniciarán las simulaciones necesarias. Una vez concluida pulsando sobre el botón Results se podrán observar los resultados tanto en forma gráfica como tabular.
Obsérvese que los limites empleados para el flujo molar de purga están cerca de valores limites determinados por el balance materia. Cuando el flujo de purga es de 5 kmo/h el flujo de reciclo es de aproximadamente 1024 kg/h y la fracción molar de nitrógeno en la corriente S2 es 11 %, mientras que cuando el flujo de purga es de 13 kmol/h el flujo de reciclo cae cero y la composición en nitrógeno de la corriente S2 es del 2 %. Los resultados del estudio paramétrico, que se muestra en la gráfica de más abajo, indica el impacto del aumento de flujo de purga sobre el equilibrio entre costes de operación y equipos (disminuir el reciclo y tamaños más pequeños de los equipos) y los costes de las materias primas (mayores pérdidas de materia primas al disminuir el reciclo).
3. PROBLEMA ADICIONAL: BUCLE DE REACCIÓN EN EL PROCESO DEL AMONIACO En algunos procesos, las trazas de algunos compuestos, introducidas como impurezas en la alimentación, o bien como subproductos de reacciones secundarias, pueden presentar graves 311
Simulación de procesos con HYSYS. Sistemas de reacción y recirculaciones
problemas. En un proceso continuo, éstas se acumulan continuamente a no ser que se prevea un medio para su eliminación, bien mediante reacción, separación, o a través de corrientes de purga. Dado que la reacción o la separación de especies en baja concentración es habitualmente costosa, se utilizan corrientes de purga cuando las especies no son tóxicas y tienen un bajo impacto sobre el medioambiente. Las corrientes de purga también se usan para eliminar especies presentes en grandes cantidades cuando su separación de otros productos químicos presentes en la mezcla es difícil. Como un ejemplo de lo anterior, considérese el proceso de producción de amoniaco (N2 + 3H2 2 NH3). En este proceso al nitrógeno le acompañan cantidades traza de argón, que se obtiene del aire, mientras que al hidrógeno le acompañan pequeñas cantidades de metano, que se obtienen por reformado con vapor (CH4 + H2O 3 H2 +CO). Después del reformado, el CO y el metano sin reaccionar y el vapor de agua se recuperan, dejando en la corriente de hidrógeno trazas de metano. Aunque el nitrógeno y el hidrógeno reaccionan a presión elevada (200 atm), la conversión a amoniaco es baja (aprox. 20 % en moles) y es necesario recircular grandes cantidades de nitrógeno e hidrógeno sin reaccionar. La corriente de purga proporciona un medio de eliminar argón y metano que, de otra forma, se acumularían de forma inaceptable en los tubos del reactor, que están empaquetados con catalizadores de platino. Los vapores que se obtienen del separador flash se dividen en purga y recirculación, con la relación purga/recirculación siendo una variable de decisión clave. Diagrama de flujo del proceso: Compresor Trazas Trazas
Compresor Reactor Condensador parcial
Purga
Separador flash
Otros datos. Alimentación: 77 ºF, 200 atm. Composición: 73.2 % H2, 24.4 % N2; 2.1 % CH4 y 0.3 % Ar. Reactor: 932 ºF, 200 atm Separador flash: -28 ºC, 136.3 atm
4. BIBLIOGRAFÍA •
Hyprotech “HYSYS user’s guide” (2001).
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
312
Simulación de procesos con HYSYS
Simulación de procesos con HYSYS. Especificaciones de diseño Susana Luque Rodríguez Aurelio B. Vega Granda Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Simulación de procesos con HYSYS. Especificaciones de diseño
ÍNDICE 1. INTRODUCCIÓN ....................................................................................................315 2. EJEMPLO 1: COLUMNA DE DESPROPANACIÓN..........................................315 2.1. Resolución paso a paso........................................................................................316 3. EJEMPLO 2: SEPARACIÓN DE AMONIACO Y AGUA...................................321 3.1. La operación ADJUST.........................................................................................321 3.2. Aplicación al ejemplo de separación de amoniaco y agua ..................................321 3.3. Resolución paso a paso........................................................................................322 4. MÚLTIPLES ESPECIFICACIONES DE DISEÑO..............................................324 5. PROBLEMA ADICIONAL: COLUMNAS DE DESTILACIÓN CON INTEGRACIÓN ENERGÉTICA ...........................................................................325 6. BIBLIOGRAFÍA ......................................................................................................325
1. INTRODUCCIÓN En este tema se va a emplear HYSYS para realizar cambios en un diagrama de flujo de forma que se cumplan ciertas especificaciones de diseño (pureza de productos, o flujo de corrientes, por ejemplo) mediante la modificación automática de otras variables del proceso. Esto se puede llevar a cabo de formas diferentes: •
Si las especificaciones corresponden a la operación de una columna de destilación, es posible introducirlas directamente en las ventanas correspondientes a la operación Column.
•
Por otro lado, si se trata de otro tipo de especificaciones, que involucran diferentes partes u operaciones del diagrama de flujo, HYSYS precisa de la adición de una operación adicional ADJUST, que permite seleccionar con total libertad las variables independientes (aquellas que se vana modificar) y la dependientes (las que se desean ajustar a unos valores definidos por el usuario).
2. EJEMPLO 1: COLUMNA DE DESPROPANACIÓN En este ejemplo, se tiene que separar una mezcla de parafinas en una columna de destilación de 12 platos ideales con un condensador parcial, con la alimentación entrando en el plato 7 contado desde la parte superior de la columna. Se emplea el modelo de SRK. La composición de la alimentación (a 250 psia y 225 ºF) es 30 lbmol/h de C2H6, 200 lbmol/h de C3H8 (LK, considerado como el compuesto clave ligero), 370 lbmol/h de n C4H10 (HK, considerado como el compuesto clave pesado), 350 lbmol/h de n C5H12 y 50 lbmol/h de n 315
Simulación de procesos con HYSYS. Especificaciones de diseño
C6H14. La presión en el condensador es de 248 psia y de 252 psia en el calderín; estos niveles de presión se han seleccionado de forma que se pueda emplear agua como medio refrigerante. Las especificaciones de diseño preliminares requieren una relación de reflujo de 6.06, y un flujo de destilado como vapor de 226 lbmol/h. Posteriormente, el diseño se ha de modificar para lograr una recuperación de propano en cabezas de 191 lbmol/h y de butano en colas de 365 lbmol/h. 2.1. Resolución paso a paso Se selecciona primeramente el modelo de propiedades físicas y los componentes, eligiéndolos de entre la lista de disponibles:
En el Workbook se introducen los datos de la alimentación (F) proporcionados (mostrados por HYSYS en azul, mientras que los datos calculados por HYSYS aparecen en negro).
A continuación se introduce una operación de destilación (modelo Distillation Column de la paleta de objetos del PDF) y se incluyen en la ventana de especificaciones correspondientes (Distillation Column Input Expert, accesible mediante un doble click en el icono de la columna de destilación) todos los datos proporcionados en el problema.
316
Simulación de procesos con HYSYS. Especificaciones de diseño
En la página Connections se especifican los nombres de las corrientes (de materia y energía) que entran y salen de la columna (incluidas las salidas laterales, si las hubiera, así como el número de platos –y el orden en su numeración-, y los platos de alimentación y salidas laterales). También se especifica el tipo de condensador: total (destilado como corriente líquida), parcial (dos corrientes en cabezas en equilibrio, una líquido y otra vapor) y reflujo total del líquido (con una única corriente de destilado en forma de vapor). Este último caso corresponde al ejemplo que nos ocupa. En la siguiente página (Pressure Profile) se especifican las presiones de trabajo en calderín y condensador, así como la pérdida de carga en este último. A continuación, en la ventana Optional Estimates es posible suministrar valores estimados (opcionales) de temperatura en calderín y condensador (supóngase que estos son 240 F y 100 F, respectivamente, para el caso objeto de estudio).
HYSYS resuelve los balances de materia y energía en la columna con la pérdida de carga introducida y suponiendo un perfil de temperatura lineal entre los valores introducidos como estimaciones en calderín y condensador. Si no se especifican valores en esta hoja, HYSYS estima unos valores a partir de cálculos de equilibrio L-V. Finalmente, la última página (Specifications) permite asignar especificaciones para el funcionamiento de la columna:
317
Simulación de procesos con HYSYS. Especificaciones de diseño
Una columna de destilación tiene dos o tres grados de libertad, dependiendo del tipo de condensador que se elija. Para condensadores totales (sin corriente producto de cabezas en forma de vapor) o condensadores parciales en los que todo el condensado se retorna a la columna como reflujo (sin corriente producto de cabezas en forma de líquido), sólo existen dos grados de libertad. Existe un grado de libertad adicional cuando se usa un condensador parcial con dos corrientes producto (una líquido y otra vapor). El número de grados de libertad también aumenta si existen corrientes laterales, habitualmente resueltas especificando el flujo molar de las corrientes laterales. Para la columna despropanizadora, con un condensador parcial y destilado únicamente en forma de vapor, se seleccionan como especificaciones el flujo de destilado vapor y la relación de reflujo (las especificaciones por defecto). Posteriormente, en la página Specs del modelo Column se pueden seleccionar otras especificaciones. Tras completar la introducción de la información (presionando Done), se accede a la ventana del modelo Column, cuya primea hoja (Design-Connections) permite una revisión de una gran parte de los datos anteriormente introducidos.
A continuación se pasa a la página Monitor, y se presiona la tecla Run para comenzar los cálculos iterativos. Típicamente la convergencia o se consigue rápidamente o no se consigue en absoluto (debido a que se han introducido especificaciones imposibles). En esta página se puede seguir el curso de las iteraciones y los perfiles calculados de presión, temperatura y flujos. 318
Simulación de procesos con HYSYS. Especificaciones de diseño
El PDF para la columna, junto con los datos de flujos molares de cada uno de los componentes (adicionado al PDF con la opción Add Workbook Table tras pulsar el botón derecho del ratón sobre una zona vacía del mismo) se muestra a continuación (la selección de otras variables a mostrar u otras unidades de las mismas se puede llevar a cabo con la opción Setup... del menú Workbook cuando se está visualizando el Workbook).
Cuando no se logra la convergencia, es conveniente seguir las siguientes pautas: •
Obtener soluciones para las especificaciones por defecto. Los resultados habitualmente proporcionan una buena inicialización para otras especificaciones.
•
Intentar relajar las especificaciones que presentan mayor dificultad para su consecución.
•
Modificar el número de platos y la posición de la alimentación y corrientes laterales para mejorar los perfiles de composición. Cuando los cambios en composición son muy pequeños en una sección de la columna, se debe de considerar eliminar platos.
Los resultados de la simulación son accesibles desde el Property view de Column, algunas d cuyas páginas se describen a continuación: En la pestaña Worksheet se muestra una lista de variables de las corrientes de alimentación y productos. La página Summary en la pestaña Performance proporciona información sobre presión, temperatura, flujos de líquido y vapor asociados con cada plato, así como un resumen de flujo total de cada corriente de alimentación y producto. También muestra las necesidades energéticas en calderín y condensador.
319
Simulación de procesos con HYSYS. Especificaciones de diseño
Mediante Results, en la pestaña Performance se puede observar en el perfil de composiciones mostrado a la derecha. Es posible obtener datos de temperaturas, presiones, flujos y composición en función del numero de etapa en forma gráfica o de tabla. Las gráficas se pueden modificar de acuerdo a las indicaciones del usuario usando el Graph Control, accesible presionando el botón derecho del ratón en cualquier punto del gráfico. A continuación, las especificaciones de diseño consideradas preliminarmente se van a reemplazar por especificaciones de flujo molar de propano en el destilado (191 lbmol/h) y de butano en colas (365 lbmol/h). Estos cambios se incorporan en la ventana Specs de la pestaña Design del Property view de Column, desde donde se tiene acceso a una lista de las posibles variables a especificar, como se muestra a la derecha. Tras pulsar el botón Add Spec(s)..., se puede especificar el valor deseado, y dar un nombre a la especificación.
Tras añadir las dos nuevas especificaciones, es necesario actualizar la lista de especificaciones activas, lo cual se lleva a cabo en la página Monitor, desactivando las especificaciones anteriormente empleadas y activando las nuevas. Tras esto, la columna converge en una sola iteración, ajustando la relación de reflujo a 8.7 y l flujo molar de destilado a 226 lbmol/h. 320
Simulación de procesos con HYSYS. Especificaciones de diseño
3. EJEMPLO 2: SEPARACIÓN DE AMONIACO Y AGUA 3.1. La operación ADJUST Otra de las opciones que tiene HYSYS para introducir especificaciones de diseño es mediante la operación ADJUST, que hace que varíe el valor de una variable de corriente (la variable independiente) para lograr el valor requerido o especificación (la variable dependiente) en otra corriente u operación. En un diagrama de flujo es posible que se requieran ciertas especificaciones de diseño que no se pueden resolver directamente, y para los cuales es preciso emplear un proceso iterativo. Con este objetivo se puede introducir la operación ADJUST, de forma que dicho procedimiento se lleve a cabo de forma automática. La operación ADJUST permite acoplar variables de corrientes del diagrama de flujo que no están físicamente conectadas por operaciones. Se puede emplear para una única especificación de diseño (una variable dependiente) o también es posible instalar ADJUST múltiples para resolver casos con varias variables simultáneamente. La operación ADJUST lleva a cabo las siguientes funciones: •
Ajusta la variable independiente hasta que la variable dependiente alcanza un valor objetivo (Target Value)
•
Ajusta la variable independiente hasta que la variable dependiente se iguala al valor de la misma variable para otro objeto, más una tolerancia opcional.
Para una única especificación de diseño, se puede elegir entre los algoritmos de la secante (Secant) o de Broyden. A ADJUST también se le suministra un intervalo o paso (Step size) de variación de la variable que el programa usa inicialmente para variar (aumentando o disminuyendo) la variable independiente. El algoritmo usa pasos del tamaño especificado hasta que acota la solución. A partir de ese momento, se emplea bien la estrategia de búsqueda de la secante (con su propio tamaño de paso) o de Broyden, dependiendo de la elección previamente efectuada, para converger rápidamente hasta el valor especificado. Si la solución no se consigue en el máximo número de iteraciones especificadas, la rutina de cálculo se detendrá y preguntará al usuario si se desea iniciar otra secuencia de iteraciones. Esto se repite hasta que se alcanza la solución o el usuario decide interrumpir la búsqueda. El algoritmo de la secante suele proporcionar buena convergencia una vez que la solución ha sido acotada con los pasos iniciales.
3.2. Aplicación al ejemplo de separación de amoniaco y agua Supóngase que en el caso ejemplo del tema H1, la separación de amoniaco y agua mediante un calentamiento y separación de equilibrio, se desea obtener una cantidad determinada de la corriente líquida, por ejemplo, 4000 lb/h (variable dependiente o especificación de diseño). Una de las posibles variables a manipular para lograr este objetivo es la cantidad de energía suministrada en el cambiador de calor (variable independiente). A continuación se indica, paso a paso, el procedimiento a seguir para lograr dicha especificación empleando la operación ADJUST.
321
Simulación de procesos con HYSYS. Especificaciones de diseño
3.3. Resolución paso a paso Se parte inicialmente del ejemplo del tema H1, previamente convergido. En el PDF, se selecciona (mediante la paleta de objetos), la operación ADJUST (indicada con una A)
o mediante la opción Add Operation... (F12) en el menú Flowsheet, seguido de la opción ADJUST.
La primera página de ADJUST (Connections) permite seleccionar la variable independiente (Adjusted Variable), la dependiente (Target Variable), así como el valor especificado para esta última (Target value).
En el ejemplo que nos ocupa la variable independiente es el flujo de energía (Heat Flow) de C-DUTY y la variable dependiente es el flujo másico de la corriente LIQ, que ha tomar un valor de 4000 lb/h.
322
Simulación de procesos con HYSYS. Especificaciones de diseño
Tras especificar toda esta información, el aspecto de la hoja Connections es el mostrado a la derecha.
La elección del algoritmo de resolución (secante, en este caso), la tolerancia (1 lb/h), el paso de la variable independiente (106 Btu/h) y en número máximo de iteraciones se incluyen en la pestaña Parameters, que por omisión –antes de introducir los valores antes mencionados- presenta el aspecto mostrado a la derecha. En este caso no se incluyen cotas inferior ni superior para la variable independiente. Cuando se presiona Start, HYSYS inmediatamente comienza el procedimiento de convergencia. En la pestaña Monitor se puede realizar un seguimiento de los valores de la variable independiente y de la variable dependiente. Para este ejemplo, la historia de las iteraciones se muestra a la derecha. ADJUST converge al valor especificado en 8 iteraciones, para un valor de C-DUTY de 4.185·106 Btu/h.
323
Simulación de procesos con HYSYS. Especificaciones de diseño
Los datos para todas las corrientes del proceso se pueden revisar en el Workbook.
Tras instalar la operación ADJUST, el PDF muestra el aspecto siguiente:
Si se elimina la operación ADJUST, los nuevos valores permanecen en el diagrama de flujo.
4. MÚLTIPLES ESPECIFICACIONES DE DISEÑO Para varias especificaciones de diseño (Multiple ADJUST) se puede efectuar una resolución simultánea de todos los ADJUST incorporados al diagrama de flujo. En estos casos, cuando el resultado de una de las operaciones ADJUST afecta directamente a otra(s), es posible usar la opción Simultaneous para minimizar el número de iteraciones del diagrama de flujo. Un ejemplo de esto se puede encontrar en el manual de Aplicaciones de HYSYS (Looped Pipeline Example). En estos casos HYSYS usa el algoritmo de Broyden para variar simultáneamente todos los parámetros ajustables definidos en los ADJUSTs hasta que se cumplen todas las especificaciones de diseño. El papel que juegan en este caso los pasos o intervalos iniciales de variación de las variables independientes es diferente. En el ADJUST individual, el algoritmo usa un valor previamente fijado para sucesivamente ajustar la variable independiente hasta que la solución se ha acotado. En el caso del algoritmo simultáneo, el paso de cada variable sirve como cota superior para el ajuste de dicha variable. Es muy importante en estos casos, que se inicialice la búsqueda con un diagrama de flujo previamente 324
Simulación de procesos con HYSYS. Especificaciones de diseño
convergido, sin valores de las variables de las corrientes que supongan imposibles físicos (por ejemplo, cruce de temperaturas en una cambiador de calor). La programación de estos ajustes múltiples se lleva a cabo de forma fácil, instalando todos los ADJUSTs a resolver usando la opción Simultaneous (en la pestaña Parameters) y luego presionando Start para comenzar los cálculos.
5. PROBLEMA ADICIONAL: COLUMNAS DE DESTILACIÓN CON INTEGRACIÓN ENERGÉTICA El objetivo de esta simulación es simular la deshidratación de metanol por destilación de doble efecto con división de la alimentación. La alimentación es una mezcla equimolar a 2700 kmol/h, 25 ºC, y 5.2 bar. Se divide y alimenta a dos columnas de destilación, una de ellas trabaja a presión más reducida, con las especificaciones de diseño indicadas en la tabla siguiente. Columna 1 Columna 2 Presión (bar) 5.20 1.01 Número de platos 16 13 Plato de alimentación* 12 9 Relación de reflujo 1.26 0.834 xD (fracción molar) 0.96 0.96 xB (fracción molar) 0.04 0.04 * Contando desde la parte superior de la columna Primero, se configuran las dos columnas para que operen independientemente, con la alimentación igualmente distribuida. A continuación, las columnas se conectan térmicamente, con la energía que se retira del condensador de la columna de alta presión suministrando la energía correspondiente a la vaporización que se lleva a cabo en el calderín de la columna de baja presión
6. BIBLIOGRAFÍA •
Hyprotech “HYSYS user’s guide” (2001).
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
325
Simulación de procesos con HYSYS
Simulación de procesos con HYSYS. Optimización de diagramas de flujo Susana Luque Rodríguez Aurelio B. Vega Granda Departamento de Ingeniería Química y Tecnología del Medio Ambiente Universidad de Oviedo
Simulación de procesos con HYSYS. Optimización de diagramas de flujo
ÍNDICE 1. INTRODUCCIÓN ....................................................................................................329 2. EJEMPLO: OPTIMIZACIÓN DE UNA TORRE CON SALIDAS LATERALES ....................................................................................................................................330 2.1. Resolución paso a paso .....................................................................................330 3. PROBLEMA ADICIONAL: OPTIMIZACIÓN DE LA PRODUCCIÓN DE CLORURO DE ETILO............................................................................................337 4. BIBLIOGRAFÍA ......................................................................................................338
1. INTRODUCCIÓN En este tema se va a mostrar cómo usar simuladores de procesos para optimizar los diagramas de flujo más prometedores durante el diseño de procesos. Para ello se abordarán las estrategias de optimación actualmente implementadas en simulación modular de procesos químicos con variables continuas. Para cuantificar las condiciones de operación más adecuadas se necesita primero una función objetivo que sirva de indicador de la bondad de la solución, típicamente: costes de capital, operación, rendimiento del producto, beneficios globales, etc. Los valores de la función objetivo se determinan por manipulación de las variables del problema (variables de decisión o variables independientes, que representan las grados de libertad de la optimación), las cuales pueden físicamente representar características del equipo o condiciones de operación (temperatura, presión, caudales, composiciones, etc.). Los límites de operación del proceso, la pureza del producto, así como las relaciones ente las variables del proceso han de ser consideradas como restricciones y los valores de las variables se han de ajustar de forma que se satisfagan dichas restricciones. El resto de variables del proceso se denominan variables dependientes, y sus valores se pueden obtener mediante las restricciones. Los objetivos de este tema son: •
Formulación de un problema de optimización no lineal (NLP), para maximizar o minimizar una función objetivo ajustando variables continuas en el modelo del proceso. Opcionalmente, el NLP incluye especificaciones en forma de ecuaciones (restricciones en forma de igualdades) y expresiones acotadas (restricciones en forma de inecuaciones).
•
Utilización de HYSYS para resolución del NLP, comenzando con un modelo de simulación del proceso que se ha de optimizar.
329
Simulación de procesos con HYSYS. Optimización de diagramas de flujo
2. EJEMPLO: OPTIMIZACIÓN DE UNA TORRE CON SALIDAS LATERALES En este ejemplo, se desea optimizar el funcionamiento de una torre de destilación. La alimentación consiste en una mezcla de parafinas nC5 a nC9, y se alimenta a una torre de 23 platos. El objetivo es ajustar las condiciones de operación de modo que se obtenga un destilado (D) concentrado en nC5, una corriente lateral (S1) concentrada en nC6, otra lateral (S2) concentrada en nC7 y nC8, y una corriente de colas (B) concentrado en nC9. Las condiciones de operación que se deben ajustar (variables de decisión) son la relación de reflujo y los flujos de destilado y de las dos corrientes laterales. Esto se consigue formulando un NLP en el cual se fija el plato de alimentación (11) y los platos de donde se obtienen las salidas laterales (6 y 16, respectivamente): Max (DC5 +S1C6+S2C7+S2C8+BC9) con las restricciones:
5
R
10
0.1
D/F
0.7
0.1
S1/F
0.7
0.1
S2/F
0.7
B/F
0.05
siendo R la relación de reflujo, y D, F, S1, S2 y B flujos molares de destilado, alimentación, corrientes laterales y producto de colas, respectivamente. Las corrientes que abandonan la torre se consideran líquidos saturados. Todas las fases líquidas y vapores se suponen ideales y en equilibrio en cada etapa de la torre. Se emplea el modelo de propiedades físicas de Chao-Seader. La composición de la alimentación (a 50 ºC y 175 kPa) es 220 kg/h de nC5, 110 kg/h de nC6, 160 kg/h de nC7, 50 kg/h de nC8 y 400 kg/h de nC9. La presión en el condensador es de 138 kPa y de 145 kPa en el primer plato. La presión en el calderín es de 180 kPa. 2.1. Resolución paso a paso Se selecciona primeramente el modelo de propiedades físicas y los componentes, eligiéndolos de entre la lista de disponibles:
En el Workbook se introducen los datos de la alimentación proporcionados
330
Simulación de procesos con HYSYS. Optimización de diagramas de flujo
A continuación se introduce una operación de destilación y se incluyen en la ventana de especificaciones correspondientes todos los datos de diseño proporcionados en el problema (número de platos, platos de alimentación y salidas laterales, presión de operación) además de identificar tanto las corrientes de materia como de energía asociadas.
Se resuelve inicialmente la columna (modo simulación) especificando los cuatro grados de libertad disponibles: relación de reflujo (5), flujo de destilado (200 kg/h), y flujo de las corrientes laterales (2 kmol/h, estos dos últimos se han de incluir previamente en la página Specs durante el diseño de la columna).
En la página Monitor se puede ver el resultado de la simulación, en cuanto a: •
evolución de la convergencia
•
perfil de temperaturas, presiones o flujos
•
valores de las especificaciones de diseño.
En la opción Results, en la ventana Performance:
se puede observar en el perfil de composiciones mostrado a la derecha.
331
Simulación de procesos con HYSYS. Optimización de diagramas de flujo
El funcionamiento de la columna es bastante pobre, con varias zonas de retromezcla y consiguiéndose una separación relativamente pobre de las fracciones pesadas, como también se puede ver en el Workbook. En realidad la corriente lateral S2 sólo contiene el 72 % del heptano y octano alimentados, mientras que en la corriente de colas sólo se obtiene el 80 % de nonano presente en la alimentación. La interface Optimizer, es accesible desde el menú principal o mediante F5, y su estructura sirve de guía al usuario en la formulación y resolución del problema de optimización.
Esta aplicación permite optimizar un diagrama de flujo, determinando los valores de unas variables indicadas que optimizan una función objetivo (tal como la calidad de un producto, los beneficios económicos o la productividad). También se puede aplicar para ajustar parámetros del proceso de forma que su resultado coincida con datos obtenido de la planta real (DataReconciliation). En esta ventana se introduce toda la información relativa al problema de optimización. Las variables independientes que se van a manipular durante la optimización (R, D, S1 y S2) se especifican en la página Variables. En la pagina Functions se introducen todas las funciones, incluyendo la objetivo y las restricciones: Max (DC5 +S1C6+S2C7+S2C8+BC9) 5 R 10 0.1 D/F 0.7 La hoja de cálculo interna del Optimizer 0.1 S1/F 0.7 (Spreadsheet) facilita la definición de todas las 0.1 S2/F 0.7 funciones. B/F 0.05 332
Simulación de procesos con HYSYS. Optimización de diagramas de flujo
La selección del algoritmo de resolución y los parámetros ajustables del mismo se fijan en la página Parameters. Para obtener la solución al problema NLP se presiona Start, siendo posible seguir la evolución de la resolución en la página Monitor. Siempre es adecuado obtener una solución del problema (caso base) en modo simulación, tal y como se ha hecho. Para poder llevar a cabo la optimización del funcionamiento de la columna es necesario seguir un procedimiento que, supone cuatro pasos: Paso 1. Definición de las variables independientes y sus intervalos de variación en la página Variables. En este caso, se seleccionan de entre las especificaciones de diseño (Spec value) definidas previamente en la interface de la columna, denominada T-100. Una vez seleccionadas las variables, HYSYS toma como valores iniciales los resultantes de la simulación realizada. Por omisión, las cotas inferiores son la mitad del valor inicial y las superiores el doble de este valor. No obstante, el usuario puede modificarlas según conveniencia. En este caso, se fija una relación de reflujo mínima de 5. Los flujos aparecen en las unidades internas de HYSYS, kmol/s. Paso 2. A continuación se define tanto la función objetivo como las restricciones en la pestaña Functions, usando Spreadsheet, disponible en la parte inferior de la ventana (el funcionamiento de la misma es análogo al de una hoja de cálculo) para llevar a cabo los cálculos necesarios. Para ello, en la página Connections se importan todas las variables del diagrama de flujo que intervienen en las ecuaciones de la función objetivo o de las restricciones, análogamente a la selección de variables independientes. 333
Simulación de procesos con HYSYS. Optimización de diagramas de flujo
Por ejemplo, se necesita el flujo molar de n-pentano en el destilado para la función objetivo, por lo que esta variable se importa y se coloca en la celda A1 de la hoja de cálculo. De modo análogo se importa el flujo molar de n-hexano en S1, de n-heptano y noctano en S2 y de n-nonano en B, a las celdas A2 a A5. Los flujos de F, D, S1, S2 se introducen en las celdas C1 a C4.
El resto de variables involucradas, obtenidas mediante operaciones (lógicas o matemáticas) de las variables importadas del diagrama de flujo se llevan a cabo en el Spreadsheet. De este modo, por ejemplo, se calcula el valor de la función objetivo (celda A6), como suma del contenido de las celdas A1 a A5.
También se calcula el valor de B en la celda C5, empleando para ello los valores importados de F, D, S1 y S2, así como las relaciones B/F, S1/F, S2F y D/F, situándolos en las celdas C7 a C10. Finalmente, se introducen las constantes 0.1, 0.7 y 0.05, presentes como cotas en las restricciones, en las celdas D2, D4 y D6, respectivamente. Es posible incluir identificadores del contenido de cada celda, incluyéndolos en el campo Variable, en la zona superior de la ventana. El código de colores es el estándar de HYSYS: azul para valores definidos por el usuario, negro para los calculados por HYSYS en la simulación y rojo para los calculados en la hoja de cálculo. En caso de duda, se dispone de una ventana con ayuda sobre la formulación de funciones matemáticas o lógicas (Function Help en la parte inferior de la pantalla).
334
Simulación de procesos con HYSYS. Optimización de diagramas de flujo
En la hoja Formulas se pueden revisar todas las formulas matemáticas empleadas en el cómputo de las celdas del Spreadsheet.
El control del tamaño de la hoja de cálculo, así como la visualización del contenido de las celdas calculadas, exportables a la definición de la función objetivo o de las restricciones del proceso se puede observar en la pantalla Parameters del Spreadsheet.
Volviendo a la pantalla Optimizer, en la pestaña Functions se selecciona la celda A6 como función objetivo y se elige maximizar la misma (modificando el valor por omisión de HYSYS: Minimize). Además de las cotas inferior y superior de las variables de decisión (definidas en la página Variables), hay restricciones adicionales. Las restricciones, originalmente en el formato: cota inferior Variable
cota superior
se introducen como dos desigualdades: Variable > cota inferior Variable < cota superior Por ejemplo: en B/F
0.05.
Para su formulación, como se ha indicado, primeramente se ha calculado el valor de B en la celda C5, empleando para ello los valores importados de F, D, S1 y S2. Luego se ha calculado la relación B/F en la celda C7 y la cota de la restricción (0.05), se ha incluido en la celda D6. 335
Simulación de procesos con HYSYS. Optimización de diagramas de flujo
En Functions se indica que el valor de la celda C7 (correspondiente a B/F), debe ser mayor que el de la celda D6 (en este caso la constante 0.05). Análogamente se introducen todas las demás cotas superiores en inferiores (de D/F, S1/F y S2/F) que constituyen las restricciones en este problema. De esta forma, es posible introducir relaciones más complejas no lineales como restricciones, refiriéndose al valor de las mismas que se calcula en la hoja de cálculo del Optimizer. Paso 3. En la página Parameters del Optimizer, se seleccionan el algoritmo de resolución (SQP en este caso), así como los parámetros modificables del mismo. El algoritmo SQP requiere el cálculo de gradientes locales y los parámetros ajustables Shift A y Shift B indican en este caso que las aproximaciones numéricas a los gradiente se generan mediante perturbaciones del 1 % de las variables de decisión. Paso 4. La optimización comienza cuando se pulsa Start, en la parte inferior derecha de la ventana, siendo posible seguir el progreso del algoritmo en la página Monitor. Volviendo al Property View de la columna se puede observar (Monitor) que la optimización ha forzado la relación de reflujo hacia su valor máximo (10), y ha modificado ligeramente el flujo de destilado, así como los de las corrientes S1 y S2. La solución a los balances de materia y energía, como se muestra en el Workbook, indica que la recuperación de todos los componentes en las corrientes deseadas es superior al 90 %, lo cual supone una mejora significativa con respecto a la solución inicial, tal y como también se puede visualizar con los perfiles de composición de todos los componentes de la mezcla.
336
Simulación de procesos con HYSYS. Optimización de diagramas de flujo
3. PROBLEMA ADICIONAL: OPTIMIZACIÓN PRODUCCIÓN DE CLORURO DE ETILO
DE
LA
Una de las rutas para producir cloruro de etilo es mediante la reacción de HCl con etileno en fase gas empleando un catalizador de cloruro de cobre soportado sobre sílice: C2H4 + HCl → C2H5Cl Como se muestra en el diagrama de flujo, la corriente de alimentación (100 kmol/h, 25 ºC y 1 atm) está compuesta de 50 % mol HCl, 48 % mol C2H4 y 2 % mol de N2. Dado que la reacción alcanza sólo una conversión molar del 90 %, el cloruro de etilo producto se separa de los reactivos sin reaccionar recirculando estos últimos. La separación se lleva a cabo usando una columna de destilación, en la que se supone que la separación es perfecta. El proceso opera a presión atmosférica, despreciando las pérdidas de carga. Para prevenir la acumulación inertes, se retiran 10 kmol/h mediante una purga. Es interesante estudiar el efecto que tiene la magnitud de la purga sobre la recirculación y la composición de la alimentación al reactor. Pur ga
Columna de destilación
Aliment. REACTOR CATALÍTICO
Pr oducto pur o
Lo que se pretende es maximizar los beneficios del proceso ajustando el flujo de purga. Para estimar los costes se emplean las siguientes expresiones:
⎛ 330 x 24 ⎞ Coste equipos instalados: 500⎜ FR ⎟ ⎠ ⎝ 1000
0.6
€
Coste de etileno: 1.5·10-3 €/kg Coste de HCl: 1.0·10-3 €/kg Producto de ventas del cloruro de etileno: 2.5·10-3 €/kg Donde FR es el flujo de alimentación al reactor en kg/h. Se supone un 10 % de ROI (equivalente a considerar que los gastos anuales por el inmovilizado son un 10 % de la inversión inicial) y que la planta opera 330 días al año. Con todos estos datos, la función a optimizar es ⎡ ⎛ 330 x 24 ⎞ 0.6 ⎤ FO = 330 * 24 *10 [2.5P − (1.5x Et + x HCl )F] − 0.1⎢500⎜ FR ⎟ ⎥ ⎠ ⎥⎦ ⎢⎣ ⎝ 1000 −3
donde xEt y xHCl son las fracciones másicas de etileno y HCl en la alimentación, respectivamente, y F y P son los flujos de alimentación y producto en kg/h. 337
Simulación de procesos con HYSYS. Optimización de diagramas de flujo
4. BIBLIOGRAFÍA •
Hyprotech “HYSYS user’s guide” (2001).
•
Seider, W.D., Seader, J.D., Lewin, D.R., “Process Design Principles”, John Wiley & Sons, Nueva York (1999)
338