Fellows Feature: Ziyue Gao


Ziyue Gao is a CEHG postdoctoral fellow in the lab of Dr. Jonathan Pritchard. She received her Bachelor’s Degree in Biological Sciences and a second degree in Economics from Tsinghua University in China. She then did her Ph.D study in genetics at the University of Chicago, working with Dr. Molly Przeworski. Her research focuses on understanding the roles of mutation and natural selection in shaping the genetic variation pattern in human populations, particularly their impact on the prevalence and distribution of disease-associated mutations.

Can you tell us a bit about yourself, personally and professionally?

I started my postdoc in Jonathan Pritchard’s lab in September 2015, after finishing a PhD in genetics at the University of Chicago. I was a graduate student in Molly Przeworski’s lab, and we studied the impact of balancing selection on maintaining genetic diversity in primates and the burden of recessive lethal mutations in human.

A bit of background about myself: I was born and raised in Beijing, China. My childhood and teenage years were pretty boring: the kindergarten, elementary school, middle school, and high school I went to were all within a 5km radius circle around home, and I attended a university where my grandfather and my mother worked. I was so glad that this routine finally ended with my journey to Chicago for graduate study.

What have you perceived to be the differences between the US and your home country? Have you enjoyed your time at Stanford?

The US values diversity and work-life balance much more than my home country does. I have benefited a lot from these differences in my career and personal developments. I feel extremely lucky to be able to work and study at Stanford.

Can you tell us about your current research and what you hope to achieve with it?

Together with Jonathan [Pritchard] and Emily Glassberg, a grad student in our lab, I’m currently studying the selection pressures on gene expression levels. Expression changes are long hypothesized to drive a great amount of phenotypic differences between species and among individuals, but whether or not and to what extent gene expression is under evolutionary constraints is largely unknown.

We try to tackle this question by utilizing results from recent genome-wide analyses of gene expression. By comparing the joint distribution of allele frequency and effect size of identified expression-altering variants across different groups of genes, we can infer whether the expression levels of these groups are under different levels of evolutionary constraints. We also develop a likelihood-based method to estimate the overall proportion and average effect size of all regulatory sites for any given group of genes. Together, these analyses will bring new insights into the genetic architecture and evolutionary constraints on gene expression in humans.

What first got you interested in genetics and science?

In college, I was fascinated by the rigor of genetic analysis and the rapid development of molecular techniques, and I thought the quantitative nature of genetics would provide me a niche to combine my strength in mathematics and passion for life science.

Prior to joining the University of Chicago, I had never heard of the field “population genetics,” but after taking only two lessons taught by Dr. Dick Hudson, I decided to do a rotation in a population genetics lab. After a rotation in Molly’s lab, I was determined to devote my PhD (and hopefully my career) to research in population genetics.

Were there specific people to whom you would attribute your professional success?

There were, of course, many people that had great impacts on my career decisions, but I would like to especially thank two of them, Dick and Molly, for introducing me to the wonderful world of population genetics.

What is it like working with your current lab advisor and his/her lab? Do you have lab mates you work closely with on projects?

Working with Jonathan is a real pleasure. He is very flexible in terms of his working style— he can be as attentive and as hands-off as you need. This flexibility leads to higher work efficiency and more innovative ideas.

I also really enjoy being surrounded by my lab mates, who have the perfect composition of smartness, nerdiness, and fun. I learned a lot from them, especially from Emily, with whom I am currently working closely on studying selection on gene expression.

What are your professional plans for the next 5-10 years? 

My ambition is to get a position at a university, either in the US or in my home country. I also have passions for forensic science and science fiction, so don’t be surprised if you find me becoming a detective or a sci-fi writer 10 years later.

Do you have advice you would like to offer undergrads, grad students, and postdocs (thinking of) working in your field? 

For grad students, cherish your time in grad school: it is a great time (if not the best time) to learn some theory, build up skill sets, try bold ideas, and not worry much about progress.

Research is not a “linear” process. It is especially slow and challenging at the beginning.

Sometimes we are stuck on a project for months or even years with no good/trustable results, but it doesn’t mean we achieve nothing — we learn a lot from the quests, setbacks and even failures. Grad school is such a rare opportunity when one can focus on learning and the cost of failure is very low.

Can you speak a bit to the role you see CEHG playing on Stanford campus?

The Evolgenome seminar series is one of the great things that CEHG offers. It enables me to learn new knowledge and perspectives from others’ research on a regular basis. The annual CEHG symposium provides further opportunities to interact with speakers and audience members from on and off campus. I can see that these activities will facilitate the exchange of ideas and foster a lot of future collaborations.

Tell us what you do when you aren’t working on research. Do you have hobbies or special talents? Other passions besides science?

I always have huge passions for movies and stage plays, but recently I’ve been spending a lot more time outdoors, training for a half-marathon. Other than the wonderful academic environment and opportunities at Stanford, I feel this new hobby is the best gift that the Bay Area gives to me.


Spanish Translation of PNAS Article: Multidimensional structure-function relationships in human β-cardiac myosin from population-scale genetic variation

Click here for English web-version.

Título: Relaciones entre función y estructura multidimensional en la β-miosina cardíaca humana a partir de variación genética a escala poblacional.

Clasificación: Ciencias Biológicas – Genética.

Autores: Julian R. Homburgera, Eric M. Greenb, Colleen Caleshuc,d, Margaret S. Sunithae, Rebecca E. Taylorf, Kathleen M. Ruppelf,g, Raghu Metpallyh, Steven D. Colani, Michelle Michelsj, Sharlene Dayk, Iacopo Olivottol, Carlos D. Bustamantea,m, Frederick Deweyn, Carolyn Y. Hoo, James A. Spudiche,f,1,2, Euan A. Ashleya,c,1,2


aDepartment of Genetics, Stanford University School of Medicine, Stanford, CA 94305.

bMyoKardia, Inc. South San Francisco, CA 94080.

cStanford Center for Inherited Cardiovascular Disease, Stanford University, Stanford, CA 94305.

dDivision of Medical Genetics, Stanford University, Stanford, CA 94305.

eInstitute for Stem Cell Biology and Regenerative Medicine, Bangalore 560065, India.

fDepartment of Biochemistry, Stanford University School of Medicine, Stanford, CA 94305.

gDepartment of Pediatrics (Cardiology), Stanford University School of Medicine, Stanford, CA 94305.

hGeisinger Health System, Danville, PA.

iDepartment of Cardiology, Boston Children’s Hospital, Boston, MA

jDepartment of Cardiology, Erasmus MC, Rotterdam, the Netherlands.

kCardiovascular Division, Department of Internal Medicine, University of Michigan, Ann Arbor, MI

lReferral Center for Cardiomyopathies, Careggi University Hospital, Florence, Italy

mDepartment of Biomedical Data Sciences, Stanford University, Stanford, CA 94305.

nRegeneron Inc., Tarrytown, NY.

oBrigham and Women’s Hospital, Boston, MA.

1 Dirigir la correspondencia a las siguientes direcciones: euan@stanford.edu; jspudich@stanford.edu

2Estos autores contribuyeron igualmente a este trabajo.


Los motores de miosina son los elementos fundamentales de la generación de fuerza en la contracción muscular. Variaciones en el gen de la cadena pesada de la β-miosina cardíaca (MYH7) pueden conducir a la miocardiopatía hipertrófica (HCM), una enfermedad hereditaria caracterizada por hipertrofia cardíaca, insuficiencia cardíaca y muerte súbita. Cómo variantes específicas de la miosina alteran la función motora o la expresión clínica de la enfermedad son aun entendidas de manera incompleta. Aquí combinamos modelos estructurales de la miosina a partir de múltiples estados de su ciclo quimiomecánico, los datos de secuenciación del exoma de dos cohortes poblacionales de 60.706 y 42.930 individuos, y los datos genéticos y fenotípicos de 2.913 pacientes HCM para identificar regiones de enriquecimiento para la enfermedad dentro de la β-miosina cardíaca. Primero desarrollamos modelos computacionales de la proteína β-miosina cardíaca humana antes y después del golpe de fuerza. Luego, utilizando un estadístico de exploración espacial modificado para analizar las variaciones genéticas en el espacio tridimensional de la proteína encontramos un enriquecimiento significativo de variantes asociadas con enfermedad en el convertidor, un dominio cinético que transduce la fuerza desde el dominio catalítico al brazo de palanca para lograr el golpe de fuerza. Centrando nuestro análisis en los residuos expuestos en la superficie, identificamos una gran región enriquecida significativamente con variantes asociadas a enfermedad que contiene tanto el dominio convertidor como los residuos en una superficie plana sobre la cabeza de la miosina descrita como meseta de miosina. Notablemente, los pacientes HCM con variantes en las regiones enriquecidas tienen una aparición más temprana de la enfermedad que aquellos que tienen variantes en otros lugares. Nuestro estudio proporciona un modelo para la integración de la estructura de proteína, secuenciación genética a gran escala y datos fenotípicos detallados para ayudar a comprender las estructuras de proteínas desplazadas en el tiempo y la enfermedad genética.

Palabras clave: Miosina, Miocardiopatía hipertrófica, variantes genéticas raras, tolerancia genética.

Declaración de importancia: Variantes genéticas en la β-miosina cardíaca humana, responsable de la contracción muscular en el corazón, puede conducir a la miocardiopatía hipertrófica (HCM), una enfermedad cardíaca hereditaria que puede causar la muerte súbita. Nuevas tecnologías han generado datos de secuencias para un gran número de pacientes con HCM y para individuos sanos. En este estudio, comparamos la ubicación en la estructura de la proteína de las variantes genéticas de pacientes HCM y de la población general para identificar las regiones espaciales en la miosina que tienen una mayor proporción que lo esperada de variantes genéticas asociadas a HCM y edades tempranas al momento del diagnóstico. Además, desarrollamos nuevos métodos para determinar la localización de los cambios genéticos en la estructura de proteínas. Nuestro estudio demuestra el poder de combinar los datos clínicos, genéticos y estructurales para comprender mejor la enfermedad Mendeliana.


Los motores de miosina son máquinas moleculares responsables de convertir la energía química en la fuerza mecánica necesaria para la división celular, la migración celular dirigida, el tráfico de vesículas y la contracción muscular (1). Las variantes en el gene MYH7, el cual codifica para la cadena pesada de la β-miosina cardíaca, causa miocardiopatía hipertrófica (HCM), una enfermedad genética del músculo del corazón caracterizada por un engrosamiento asimétrico de las paredes ventriculares y una disminución en el tamaño de la cámara ventricular. HCM es la enfermedad cardíaca hereditaria más común, con una prevalencia de 1 por cada 500 individuos. Clínicamente, el curso de HCM es variable, desde pacientes que experimentan síntomas mínimos hasta otros que desarrollan arritmias, insuficiencia cardíaca o muerte súbita (2). Las relaciones entre el genotipo y la expresión de la enfermedad en HCM han sido difíciles de establecer debido a la ausencia de datos genéticos a gran escala provenientes de poblaciones y la falta de intercambio multicéntrico de datos genéticos y clínicos de los pacientes (4, 5).

El gen MYH7 está extremadamente limitado en su variación genética. Se observan pocas variantes con pérdida de la función en cohortes poblacionales, y las variantes patogénicas identificadas son principalmente mutaciones con cambio de sentido. Sin embargo, aunque muchas variantes genéticas con cambio de sentido en MYH7 causan HCM, no todos los cambios genéticos dentro del gen conducen a la enfermedad. Hay distintas hipótesis con respecto a la localización de las variantes patogénicas de mutaciones con cambio de sentido dentro de MYH7, el análisis de las cuales puede ofrecer información acerca del mecanismo subyacente de HCM. Algunos investigadores han sugerido el enriquecimiento de variantes patogénicas en los dominios funcionales de la β-miosina cardíaca, incluyendo el dominio convertidor, el sitio de unión a actina y el dominio de unión a ATP (7-9). Sin embargo, otros han sugerido que no hay un enriquecimiento regional para las variaciones de HCM dentro de MYH7 (4, 10). Estas inconsistencias podrían ser debido a los tamaños de muestra limitadas o a la falta de cohortes de referencia para la comparación. Sin información sobre la distribución natural de variantes raras dentro de MYH7, es imposible de distinguir las regiones con enriquecimiento de variantes asociadas a la enfermedad de aquellas regiones con una mayor tolerancia genética (11). Además, algunas supuestas variantes patogénicas se encontraron posteriormente en frecuencias alélicas más altas de lo esperado en cohortes de referencia de poblaciones étnicamente diversas (12). El estudio que sugería dominios enriquecidos carecía de cohortes de referencia, cuando una cohorte de referencia fue comparada contra las variantes genéticas de una muestra pequeña de pacientes con HCM, el estudio no pudo detectar ningún enriquecimiento significativo de variantes asociadas a la enfermedad (10). Además, un enfoque en secuencia lineal del gen o en los dominios funcionales descritos previamente podría pasar por alto regiones funcionales novedosas o enriquecimientos que abarcan varios dominios. Estas discrepancias apuntan a la necesidad de evaluar el enriquecimiento de variantes de HCM regionales dentro de MYH7 usando cohortes grandes tanto de pacientes como de referencias, mientras se tiene en cuenta la estructura tridimensional de β-miosina cardíaca.

Avances recientes en tecnologías de secuenciación de última generación han permitido el ensamblaje de grandes conjuntos de datos de variación genética en humanos tanto en poblaciones no seleccionadas como en aquellas afectadas por la enfermedad. El análisis comparativo de estas cohortes permite hacer inferencias intragénicas de la morbilidad de la enfermedad y de limitaciones (a la variación), una medida de la tolerancia de la población a la variación, lo cual puede ayudar a comprender qué residuos de aminoácidos son funcionalmente críticos y la etiología de la enfermedad. El Exome Aggregation Consortium (ExAC ) (13) y la cohorte DiscovEHR (14) son cohortes de secuenciación de exoma de 60.706 y 42.930 individuos, respectivamente, que proporcionan información detallada acerca de las tasas y tipos de variaciones genéticas observadas dentro de los genes asociados a enfermedades. Además, el Registro de Miocardiopatía Sarcoméricas humanas (SHaRe por sus siglas en ingles) fue establecido como un consorcio internacional de investigadores de HCM y actualmente poseen datos clínicos longitudinales detallados de 2.913 pacientes con HCM que se han sometido a pruebas genéticas. A medida que proyectos con una amplia clínica y secuenciación de poblaciones se hagan más frecuentes, métodos estadísticos novedosos para el análisis de la restricción y la carga de las variantes serán esenciales para ampliar la comprensión de la enfermedad e identificar regiones intragénicas enriquecidas con variaciones asociada a la enfermedad.

Nosotros formulamos la hipótesis de que el evaluar la tolerancia genética regional en el contexto de las estructuras tridimensionales desplazadas en el tiempo revelaría nuevas ideas acerca de MYH7 y posibles puntos calientes en la estructura de miosina de las variantes patogénicas en HCM. A continuación, comparamos los datos genéticos de SHaRe, un registro internacional de HCM (15) con variantes identificadas en proyectos de secuenciación de exomas a gran escala (13), con la finalidad de identificar regiones de enriquecimiento para las variaciones asociadas a HCM antes y después del golpe de fuerza de la β-miosina cardíaca. Además, desarrollamos un marco estadístico general basado en una versión modificada de un estadístico de exploración espacial para buscar regiones con incremento en las variaciones asociadas a la enfermedad en la estructura tridimensional y superficies de la proteína. Finalmente, aprovechamos los datos clínicos y fenotípicos disponibles en SHaRe para analizar diferencias clínicas entre los grupos de pacientes basados en la ubicación de la variante en la β-miosina cardíaca. Nosotros demostramos el poder de la combinación de datos clínicos, genéticos, y estructurales para hacer inferencias respecto de la etiología de la enfermedad y a los puntos calientes en la estructura tridimensional de las variantes de HCM.

Resultados y Discusión

Primero comparamos la distribuciones lineales de las variantes con mutaciones con cambio de sentido en pacientes HCM (SHaRe) y en la cohorte de referencia de la población (ExAC). La cohorte ExAC contiene la información de la secuencia de 60.706 individuos que formaron parte de estudios de una enfermedad específica (no HCM) o de estudios de genética de poblaciones, mientras que la base de datos SHaRe contiene 2.913 individuos con HCM que fueron secuenciados para MYH7. Aunque la referencia ExAC contiene algunas variantes del sarcómero patogénicas y probablemente algunas personas con HCM, estos datos no se encuentran enriquecidos con individuos con la enfermedad. Se encontraron 192 variantes por mutaciones con cambio de sentido únicas (en 474 pacientes con variantes MYH7) en la cohorte HCM y 421 variantes por mutaciones con cambio de sentido en la base de datos ExAC (Tabla S1). En ambos casos las variantes con cambio de sentido observadas eran muy raras, y la mayoría de ellas fue observada una sola vez (ver Fig. 1), consistente con los reportes previos de restricción dentro del gen MYH7 (6). Más aún, la gran mayoría de pacientes de SHaRe con alguna variante rara en MYH7 llevaba una sola de estas variantes (457/474 pacientes), mientras que 16 llevaban 2 variantes raras por mutaciones con cambio de sentido y un único paciente portaba tres variantes diferentes.


Fig. 1. Diferencias en la posición  de las variantes por mutaciones con cambio de sentido entre las cohortes poblaciones de HCM y referencia en la β-miosina cardíaca humana. 

Las variantes tanto de la enfermedad (SHaRe) como las de la población/referencia (ExAC) se encuentran distribuidos de manera no uniforme a lo largo del gen, y encontramos una diferencia significativa en la distribución lineal de las variantes raras en estas cohortes (KS p= 5,0×10-11, Fig. 1). Variantes de mutaciones con cambio de sentido asociadas a la enfermedad se encuentran concentradas en el dominio catalítico globular y en la hélice enrollada del dominio S2, consistente con resultados obtenidos previamente (4), pero en contraste con otras comparaciones recientes (10). Sin embargo, incluso dentro de estos dominios, la distribución de las variantes de la enfermedad y la población no son las mismas (KS p = 0,003). Además, las variantes de mutaciones con cambio de sentido en MYH7 tanto para las cohortes SHaRe como ExAC son extremadamente raras; la mayoría de ellas se observa solo una vez en ambas cohortes (Figura 1B-C). Estos resultados sugieren que la probabilidad de que las variantes MYH7 causen la enfermedad se debe en parte a su ubicación adentro del gen.

Ya que los motores moleculares actúan en el espacio tridimensional, buscamos un método para estudiar los patrones de tolerancia genética en la estructura plegada de la β-miosina cardíaca humana. Para ello usamos un modelaje de homología multi-plantilla de otras proteínas de miosina en los estados pre y post golpe de fuerza para construir modelos tridimensional de la β-miosina cardíaca humana que contiene las cadenas ligeras ventriculares humanas (Fig. 2 y Métodos). Estos modelos representan dos fases distintas del ciclo quimiomecánico de la miosina activada por actina. Incluimos cuatro regiones fundamentales del dominio motor de la miosina: sitio de unión a actina (Fig. 2, residuos aminoacídicos verdes), el bolsillo de unión al ATP (rojo), el dominio convertidor (azul) y la región de unión a la cadena ligera o el brazo palanca. En la fase pre golpe de fuerza, el convertidor se alinea con una superficie relativamente plana de la cabeza de la miosina, la cual ha sido descrita como la meseta de la miosina. Basado en su tamaño (>20 nm2), topología plana y el alto grado de conservación evolutiva, esta característica ha sido propuesta como un sitio de interacción de unión inter o intra molecular (16). Después de la producción de fuerza por la cabeza de miosina y el brazo palanca, el motor pasa al estado post golpe de fuerza (Fig. 2A) y el dominio meseta queda desalineado con el dominio convertidor.


Fig. 2. Modelos estructurales de la β-miosina cardíaca humana pre y post golpe de fuerza obtenidos por integración de los datos de estructuras cristalográficas resueltas en modelos homólogos. 

Para identificar las regiones estructurales tridimensionales de interés, aplicamos una versión modificada del test estadístico de escaneo espacial (17, 18) a los modelos de la β-miosina cardíaca S1 pre y post golpe de fuerza. Este estadístico busca regiones esféricas con un incremento en la proporción de variantes genéticas en la enfermedad comparada con las cohortes de referencia. Definimos las variantes raras por mutaciones con cambio sentido observadas en pacientes HCM en la cabeza de MYH7 como asociadas a la enfermedad (n=103), y cualquier variante vista solamente en la cohorte ExAC como variante de referencia (o población) (n=110). 22 variantes observadas tanto en SHaRe como en ExAC fueron clasificadas como asociadas a la enfermedad. En el modelo de la miosina previa al golpe de fuerza, encontramos un sorprendente aumento en la proporción de las variantes por mutaciones con cambio sentido asociadas a la enfermedad en la esfera de 15 Å centrada en el residuo aminoacídico 736 (p= 0,001) (Fig. 3A, Tabla S2). Esta región, que abarca el subconjunto del dominio convertidor, contiene 7 variantes por mutaciones con cambio de sentido observadas en la enfermedad y ninguna variante observada en los datos de referencia (Fig. 3C). Usando el modelo de la β-miosina cardíaca humana posterior al golpe de fuerza, nuevamente observamos un enriquecimiento de variantes asociadas a la enfermedad en la porción del dominio convertidor (p< 0,001) centrado en el residuo aminoacídico 733 (Fig. S1).


Fig. 3. La exploración estadística de escaneo espacial identifica una región esférica en el dominio convertidor con un incremento en la proporción de variantes asociadas a HCM. 

El enriquecimiento de las variantes asociadas a la enfermedad tanto para los estados pre como post al golpe de fuerza persisten cuando son incluidas solo variantes formalmente clasificadas como patogénicas o probablemente patogénicas (26 asociadas con la enfermedad de 103 en SHaRe; ver Texto suplementario). Pruebas de carga también pueden ser sensibles a las diferencias en las prevalencias de la enfermedad en la población o a las diferencias en las frecuencias de las variantes en la población. Para asegurar que nuestros resultados fueron robustos a estos posibles sesgos, se realizó el mismo análisis limitado por personas de ascendencia europea, la población más grande tanto para SHaRe como ExAC (2516 pacientes de un total de 2913 para SHaRe y 89 de las 103 variantes asociadas a la enfermedad; ver Texto suplementario). Identificamos regiones enriquecidas muy similares tanto en los modelos pre y post al golpe de fuerza, lo que indica que nuestro análisis no se ve afectado de forma significativa por la estratificación de la población. Sin embargo, grandes cohortes de otras poblaciones pueden ayudar a identificar otras regiones de la miosina enriquecidas con variaciones asociadas a la enfermedad.

Durante la contracción sistólica del corazón, el dominio convertidor sirve la función crítica de transducción de la fuerza al oscilar alrededor de 70º desde su posición previa al golpe de fuerza (Fig. 3B, el brazo de la palanca que se proyecta hacia el exterior). Se ha demostrado que variantes en el dominio convertidor alteran la intensidad de la potencia del músculo así como la cinética (19, 20), y se asocian con peores resultados en HCM (21, 22). Encontramos que el dominio convertidor es la única región esférica que se encuentra significativamente enriquecida con variantes de la enfermedad, en contraste con reportes previos que conjeturaban que había muchas regiones enriquecidas a lo largo de la cabeza de miosina (7-9) u otros que no encontraron regiones de enriquecimiento significativo (10). Aunque la ubicación en una región enriquecida no es una condición necesaria de la patología, nuevas variantes en regiones fuertemente enriquecidas con variantes de la enfermedad deben ser vistas con mayor sospecha. En regiones cercanas donde las variantes no tienen efectos similares, no habrá un enriquecimiento de variantes asociadas a la enfermedad. Nuestros datos proporcionan una línea complementaria de evidencia de que las variantes del dominio convertidor de la β-miosina cardíaca son muy poco toleradas y que los individuos portadores de variantes en esas regiones son propensos a desarrollar HCM.

Para replicar estos resultados, buscamos una fuente independiente de variación asociada a la enfermedad y a la genética de la población. Seleccionamos y organizamos publicaciones de centros médicos que no están afiliados con el registro SHaRe (Texto suplementario, tabla S3). Comparamos un conjunto de 231 variantes por mutaciones con cambio de sentido con 430 variantes por mutaciones con cambio de sentido que se encuentran en 42.930 exomas de individuos no seleccionados del Sistema de Salud Geisinger y secuenciados por el Centro de Genética Regeneron (cohorte DiscovEHR) (14) (Tabla S4). Las regiones del dominio convertidor identificadas tanto en el estado pre como post al golpe de fuerza para ambos conjuntos mostraron un enriquecimiento de variantes asociadas a la enfermedad en la réplica del conjunto de datos (pre golpe de fuerza = 0,079, post golpe de fuerza p=4,1×10-4).

Se ha sugerido que las regiones superficiales β-miosina cardíaca son dominios funcionales importantes implicados en HCM (16). Hemos ampliado nuestro análisis para analizar regiones de la superficie β-miosina cardíaca y buscar regiones enriquecidas con variantes asociadas a HCM. En primer lugar definimos los aminoácidos expuestos a la superficie por su accesibilidad a la sonda esférica con un radio de 2,5 Å (el tamaño aproximado de una cadena lateral de aminoácido) y aproximamos la distancia a la superficie entre dos residuos aminoacídicos (23) (ver Texto suplementario). Como era de esperar, las distancias en la superficie tienden a ser más cortas entre aminoácidos cercanos en la secuencia primaria (Fig. S2B, diagonal). Además, había muchas regiones donde los aminoácidos distantes en la secuencia primaria estaban juntos en la superficie de la β-miosina cardíaca (como los residuos aminoacídicos 110 y 684).

La superficie de la β-miosina cardíaca contiene 568 de los 765 residuos aminoacídicos en el dominio S1 (74%). De estos, 71 están asociados con HCM (72% de todas las variantes HCM) y 79 fueron encontrados en la población ExAC (71% de todas las variantes de referencia), sugiriendo que las variantes en ambas cohortes están distribuidas de manera pareja entre la superficie y el núcleo de la proteína (chi cuadrado = 0,51). A continuación aplicamos nuestro test estadístico de escaneo espacial a la superficie de β-miosina cardíaca. Utilizando el modelo de miosina previo al golpe de fuerza, identificamos una región de la superficie que cubre 277 de los 568 residuos aminoacídicos de la superficie (p= 0,002, Fig. 4A, B), incluyendo el dominio convertidor y meseta, la cual está altamente enriquecida con variantes asociadas a la enfermedad. Sorprendentemente, la región contiene en la superficie 52 de las 71 variantes de por mutaciones con cambio de sentido asociadas a HCM, y solo 27 de las 79 variantes por mutaciones con cambio de sentido que no están asociadas a la enfermedad (Fig. 4D), mientras que el resto de la superficie de miosina (Fig. 4C) cubre 291 residuos aminoacídicos y contiene solo 19 variantes asociadas con la enfermedad en comparación con 52 variantes no asociadas a la enfermedad (Fig. 4D). La región identificada convertidor/meseta también estaba enriquecida en las replicas (p= 4,3×10-5).


Fig. 4. El análisis de exploración espacial de superficie identifica una región de mayor superficie enriquecida para variaciones por mutaciones con cambio de sentido asociadas a HCM. 

Usando el mismo procedimiento para buscar regiones en la superficie de la estructura de la miosina post golpe de fuerza, detectamos una región enriquecida más pequeña con 122 residuos aminoacídicos que nuevamente cubren el convertidor pero con una reducción en la porción de la meseta de la miosina (Fig. S3) un dominio que se ha propuesto como sitio de unión para otro elemento estructural de la proteína (16). Durante el golpe de fuerza de la miosina, el convertidor se aleja de la meseta (comparar la Fig. 2A y Fig. 2B, y la Fig. 4 y la Fig. 3S), de manera que la región del convertidor/meseta ya no es contigua y no se encuentra disponible para interacciones intra o intermoleculares en el estado post golpe de fuerza (Fig. 2B, Fig. 4A, B). Los residuos aminoacídicos enriquecidos en el modelo post golpe de fuerza se mueven significativamente más en el espacio tridimensional entre los modelos pre y post al golpe de fuerza (Wilcoxon p < 2 x 10-16) que otros residuos aminoacídicos en la superficie de la proteína. Esto sugiere que los cambios conformacionales de la miosina durante el ciclo quimiomecánico activado por actina podrían ser importantes no solamente en la transducción de la fuerza sino también en la modulación del tamaño y la forma de esta región de la superficie, alterando así la disponibilidad de unión con otros elementos estructurales de proteínas. La importancia funcional de la región convertidora y la meseta es también apoyada por la presencia de sitios de unión a omecamtiv mecarbil, descrito recientemente como una pequeña molécula moduladora de la miosina cardíaca usada actualmente en ensayos clínicos como tratamiento a la insuficiencia cardíaca (24, 25).

A continuación evaluamos la existencia de regiones del fragmento S2 de miosina enriquecidas con variantes asociadas a la enfermedad. El análisis de escaneo espacial reveló que la primera mitad del fragmento S2 está enriquecida con variantes asociadas a la enfermedad (p= 0,003, Fig. S4). Se ha mostrado que esa parte proximal de S2 se une al extremo amino terminal de la proteína C de unión a miosina (MyBP-C) (26), una proteína del sarcómero que también esta frecuentemente mutada en pacientes con HCM (27). El enriquecimiento de las variantes asociadas a la enfermedad en esta región sugiere que la unión entre la miosina S2, MyBP-C (y potencialmente otros asociados) es importante para el desarrollo de HCM.

Para estudiar con mayor profundidad la contribución a la enfermedad de las regiones restringidas genéticamente, comparamos las características clínicas de los pacientes con variantes en estas regiones con las de los pacientes con variantes en cualquier otro lugar de MYH7. El perfil clínico de HCM es altamente variable, con algunos pacientes que llevan una vida normal con síntomas mínimos y otros que mueren repentinamente o que requieren un trasplante cardíaco a una edad muy temprana (28). Del mismo modo, la aparición de la enfermedad según la edad varía ampliamente entre pacientes con HCM, estando un inicio temprano de la enfermedad correlacionado con un fenotipo más severo (29). Encontramos que pacientes con HCM con una variante adentro de la región esférica enriquecida son 11,2 años más jóvenes al momento del diagnóstico (24.9 (s.e. 1.0) vs. 36.1 (s.e. 1.2) años de edad, p = 5.6 x 10-5) (Fig. 5A-B) que los pacientes que poseen otras variantes en la cabeza de la miosina. La presencia de las regiones enriquecidas con variantes HCM en la superficie está asociada con pacientes 10 años más jóvenes al momento del diagnóstico (edad 31.5 (s.e. 2.4) vs. edad 41.5 (s.e. 2.6), p = 1.6 x 10-4) que aquellos con otras variantes en la superficie (Fig. 5C-D). Además, encontramos un incremento en el riesgo para los resultados clínicos en las regiones enriquecidas de la superficie después de ajustar las diferencia en la edad al momento del diagnóstico (HR = 1.918, p=0.023), aunque no así en la región enriquecida esférica (Fig. S5, ver Texto suplementario). Estos hallazgos demuestran que el análisis de las restricciones genéticas en el espacio de las proteínas puede revelar dominios que tengan incrementos tanto en la carga de la enfermedad como en la patogenicidad.


Fig. 5. Comparación de los fenotipos clínicos entre las regiones enriquecidas y otras regiones de la β-miosina cardíaca. 

Nuestro estudio demuestra el poder de la integración de la información estructural detallada con grandes bases de datos clínicas y genéticas para identificar regiones asociadas con importancia funcional y gravedad de la enfermedad en las enfermedades Mendelianas. Encontramos un enriquecimiento de variantes asociadas a HCM en el dominio convertidor de la β-miosina cardíaca, donde conducen a resultados más severos. Proporcionamos la primera evidencia (de la que tengamos conocimiento) de que un agrupamiento y patogenicidad similar estén presentes en una superficie que abarca el dominio convertidor y la superficie relativamente plana del dominio catalítico de la miosina llamado meseta de la miosina (16). Debido a que los residuos aminoacídicos que forman la meseta proceden de lugares diferentes en la secuencia nucleotídica, el descubrimiento de esta región depende de la integración de la información estructural de la proteína. El desplazamiento pronunciado en la superficie de la meseta–convertidor durante el golpe de fuerza plantea la hipótesis mecánica de que estas variantes ejercen un efecto perjudicial selectivamente en la fase previa al golpe de fuerza, tal vez mediante la interrupción de las interacciones dinámicas de unión. En resumen, estos resultados resaltan la importancia de considerar los datos de genética humana en el contexto de la estructura dinámica tridimensional de la proteína, e ilustran un nuevo enfoque para el análisis de la estructura–función en enfermedades genéticas.

Materiales y Métodos

Base de datos SHaRe

El Registro de Miocardiopatía Sarcoméricas Humanas (SHaRe por sus siglas en ingles), es una base de datos multicéntrica que contiene un fondo común de datos, no identificables a nivel del paciente, de la información suministrada por instituciones participantes. Al momento del análisis, el registro contenía datos de pruebas clínicas y genéticas de 2.913 pacientes con HCM, de los cuales 514 se encuentran dentro de las variantes MYH7. Esta base de datos contiene individuos de 9 centros de enfermedades hereditarias en todo el mundo e incluye datos demográficos, historia médica, datos de ecocardiograma, resultados de pruebas genéticas, y muchos otros datos relacionados con la salud cardíaca y resultados clínicos.


El Exome Aggregation Consortium (13) dio a conocer los datos de 60.706 exomas de múltiples cohortes secuenciales que no están enriquecidas en enfermedades raras como HCM. Nosotros hemos descargado los datos desde ExAC de la transcripción normal de MYH7 ENST00000355349 el 27 de agosto del 2015.

Filtrado de variantes y criterios de inclusión

Las variantes MYH7 de la base de datos SHaRe fueron filtradas con el propósito de garantizar la calidad. Solo las variantes exónicas de MYH7 con mutaciones con cambio de sentido fueron incluidas en el análisis. Se incluyeron todas las variantes exónicas con mutaciones con cambio de sentido observadas en pacientes HCM durante las pruebas genéticas clínicas. A modo de comparación, hemos descargado los datos del gen MYH7 de Exome Aggregation Consortium (ExAC ) el 27 de agosto de 2015.

Para los análisis de exploración espacial y de superficie, las variantes fueron consideradas en una de las dos categorías: asociadas a la enfermedad y referencia. Cualquier variante rara con mutaciones con cambio de sentido identificada en pacientes HCM en SHaRe fue considerada asociada a la enfermedad, sin importar su presencia en la población ExAC. Las variantes raras con mutaciones con cambio de sentido identificadas en ExAC fueron clasificadas como no asociadas a la enfermedad o referencia. Cualquier variante identificada tanto en la cohorte ExAC como SHaRe fue considerada como asociada a la enfermedad. Dentro de la cabeza S1 de MYH7, identificamos 103 variantes asociadas a la enfermedad (vistas en SHaRe) y 110 referencias (o variantes poblacionales) encontradas solo en ExAC. Identificamos 22 variantes observadas tanto en SHaRe como ExAC y fueron clasificadas como asociadas a la enfermedad.

Las pruebas de enriquecimiento fueron realizadas mediante la búsqueda de regiones en la proteína de miosina que tuvieran una proporción significativamente mayor de variantes asociadas a la enfermedad que de variantes no asociadas. Es probable que la población ExAC contenga algunos individuos con miocardiopatía hipertrófica inducida por cambios en MYH7, por lo tanto no podemos suponer que las variantes identificadas en ExAC no sean patogénicas. Por ejemplo, hay varios individuos portadores de una variante patogénica reportada para HCM en el gen MYBPC3, p.Arg502Trp, en la cohorte ExAC. Sin embargo, no se espera que la incidencia de miocardiopatías en ExAC sea mayor que la incidencia en la población general. Una gran proporción de las variantes raras en MYH7 identificadas en ExAC probablemente no estén asociadas con miocardiopatías. Por el contrario, las variantes raras identificadas en SHaRe para pacientes HCM probablemente estén enriquecidas con variantes causantes de la enfermedad.

Calculamos la máxima frecuencia alélica específica de la población para cada variante en ExAC como la frecuencia máxima de la variante en cualquiera de las poblaciones ExAC (excluyendo a Finlandia). Con la finalidad de comparar la carga genética de las variantes dentro de cada cohorte, hemos eliminado de ambos conjuntos de datos (SHaRe y ExAC) cualquier alelo con una frecuencia alélica específica de la población mayor a 1/2000. Esto eliminó 16 variantes en MYH7 de nuestra lista ExAC (de un total de 421), 6 de los cuales también fueron reportados en SHaRe (de un total de 192). Dentro de la cabeza de MYH7, solo 4 variantes ExAC se encontraron con una frecuencia mayor que 1/2000 (de un total de 136), 2 de las cuales también fueron identificadas en SHaRe (de un total de 105).

Para fines de validación, también se realizó un subconjunto de análisis que incluía las variantes clasificadas como “patogénicas” o “probablemente patogénicas” de acuerdo con las pautas de la American College of Medical Genetics and Genomics ACMG (30), aunque excluyen variantes de significado desconocido, benigno y probablemente benigno (ver Texto suplementario). También se realizó una validación usando variantes encontradas en individuos con ancestros europeos en ExAC e individuos reportados como de raza blanca, con la finalidad de asegurar que la estructura global de la población no estaba confundiendo nuestro análisis (ver Texto suplementario).

Generamos un conjunto de datos de validación independiente combinando análisis publicados previamente para variantes HCM de otros centros médicos con 42.930 exomas del proyecto de secuenciación DiscovEHR (14). Incluimos solo mutaciones con cambio de sentido y quitamos variantes con una frecuencia alélica mayor que 1/2000 en los exomas de DiscovEHR (ver Texto suplementario).

Desarrollo de modelos de proteínas de β-miosina cardíaca humana

En base a los datos estructurales conocidos del dominio motor, desarrollamos modelos de la β-miosina cardíaca humana S1. Recuperamos la secuencia proteica de la β-miosina cardíaca y las cadenas ligeras de la base de datos UNIPROT (31): cadena pesada del dominio motor de la miosina (MYH7) – P12883, cadena ligera esencial de miosina (MLC1) – P08590, y la cadena ligera reguladora de miosina (MLC2) – P10916. Se utilizó un enfoque de modelaje múltiple de homologías para construir las coordenadas estructurales de MYH7 (1-840 residuos aminoacídicos), MLC1 (1-195 residuos aminoacídicos. MLC2 (1-166 residuos aminoacídicos) y S2 (841-1280 residuos aminoacídicos). Obtuvimos el modelo estructural tridimensional de S1 para antes y después del golpe de fuerza mediante la integración de los datos estructurales conocidos obtenidos por cristalografía de proteínas (detalles en Texto suplementario). El modelaje por homología de la estructura previo al golpe de fuerza fue realizado usando como plantilla el dominio motor de la miosina del músculo liso (32) (AP id: 1BR1; conMgADP.A1F4 unido a sitio activo, el cual se cree que es el que mejor imita el estado de unión a ADP.Pi o estado previo al golpe de fuerza de la miosina) y el dominio de cadena ligera de miosina del músculo liso de la vieira (33) (id AP: 3TS5). Las plantillas usada para el modelo de la estructura post golpe de fuerza fueron obtenidos a partir del dominio motor de la β-miosina cardíaca humana (34) (PDB id: 4P7H sin nucleótidos en el sitio activo) y la estructura del dominio motor de la miosina del calamar (35) (PDB id: 3I5G; sin nucleótidos en el sitio activo). El modelaje se realizó utilizando el paquete MODELLER (36). Las visualizaciones se realizaron utilizando la versión 1.7.4 de PyMOL (www.pymol.org).

Métodos estadísticos

Las comparaciones entre las ubicaciones variantes de ExAC y SHaRe en MYH7 fueron realizadas mediante la prueba estadística Kolmogorov-Smirnov. Todos los análisis estadísticos fueron realizados en R versión 3.1.2 (37) y muchos de los gráficos se realizaron utilizando ggplot2 (38).

Estadística de escaneo espacial

Para el análisis de escaneo espacial comparamos las ubicaciones de variantes únicas asociadas a HCM con las ubicaciones de las variantes de referencia. La Estadística de Escaneo Espacial busca exhaustivamente ventanas tridimensionales de un conjunto predefinido de tamaño y formas a lo largo de la molécula de β-miosina cardíaca humana para ubicar regiones con incrementos en la proporción de variantes asociadas a HCM. El análisis identifica las regiones tridimensionales de la proteína con la mayor razón binomial de verosimilitud para el enriquecimiento de variantes asociadas a HCM (17, 18) (ver Texto suplementario). El test estadístico del cociente binomial máximo para un conjunto de ventanas en el modelo fue calculado y la significancia se evaluó a través de la permutación rótulos de variantes usando 1000 permutaciones. Para la validación, realizamos el análisis anterior eliminando todas las variantes de mutaciones con cambio de sentido clasificadas como Variantes con Significado Desconocido, usando solo las mutaciones con cambio de sentido observadas en los individuos europeos (ver Texto Suplementario)

Análisis de superficie

Además de las ventanas esféricas tridimensionales definidas anteriormente, ] definimos ventanas basadas en la superficie expuesta de la molécula β-miosina cardíaca humana. Para este análisis, nosotros estimamos la distancia superficial entre dos aminoácidos cualesquiera basados en la superficie de exclusión de solvente calculado por el programa MSMS (23) (ver Texto suplementario). Sobre la base de este conjunto de distancias calculadas, definimos regiones superficiales planas de la β-miosina cardíaca para el análisis como todos los aminoácidos dentro de una cierta distancia de un dado aminoacídico “centro”. Excluimos todos aquellos aminoácidos que no fueran de superficie basados en su profundidad. Un vez más realizamos la exploración estadística espacial descrita anteriormente para identificar regiones con un incremento en la carga genética.

Análisis de fragmentos S2

Se realizó el test de exploración espacial estadística como se describió anteriormente para evaluar el enriquecimiento en el fragmento S2 de la miosina, incluyendo la región entre los aminoácidos 838 y 1112 (ver Texto suplementario)

Análisis del fenotípico clínico

Para el análisis de la edad de diagnosis solo fueron incluidos probandos conocidos (n= 260 cabeza de miosina, n= 201superficie de la miosina). Los pacientes con múltiples variantes de MYH7 fueron excluidos del análisis de la edad de diagnosis, debido a que la presencia de múltiples variantes es causante del inicio temprano de la enfermedad HCM. Comparamos las edades del diagnóstico primario utilizando el test Wilcoxon. El resultado combinado global combinó los resultados de las arritmias e insuficiencias cardíacas así como también de la fibrilación auricular, accidente cerebro vascular y muerte por cualquier causa (ver Texto suplementario). Los individuos fueron considerados para entrar en el estudio a la edad de su diagnóstico y su última edad conocida fue censurada. Comparamos las proporciones de riesgo para cada región usando el modelo de los riesgos proporcionales de Cox ajustado por género.


Queremos agradecer a los investigadores y participantes en el registro SHaRe por su apoyo en este proyecto. También queremos agradecer al Jonathan Fox por su orientación durante los primeros inicios del registro de SHaRe. J.R.H es apoyado por la beca Stanford Graduate. R.E.T es apoyado por la subvención NIH F32 HL123247. Este trabajo fue apoyado por las subvenciones de NIH U01HG007436 (a C.D.B.), 1U01HG007708 (a E.A.A.), and U01HG006382 (a R.P.R.M.), y una subvención de SAP (a C.D.B.).

  1. Krendel M, Mooseker MS (2005) Myosins: tails (and heads) of functional diversity. Physiology 20:239–251.
  2. Maron BJ, et al. (1995) Prevalence of Hypertrophic Cardiomyopathy in a General Population of Young Adults : Echocardiographic Analysis of 4111 Subjects in the CARDIA Study. Circulation 92(4):785–789.
  3. Maron BJ, Casey SA, Hauser RG, Aeppli DM (2003) Clinical course of hypertrophic cardiomyopathy with survival to advanced age. J Am Coll Cardiol 42(5):882–888.
  4. Walsh R, Rutland C, Thomas R, Loughna S (2010) Cardiomyopathy: a systematic review of disease-causing mutations in myosin heavy chain 7 and their phenotypic manifestations. Cardiology 115(1):49–60.
  5. Jellis CL, Desai MY (2015) Hypertrophic cardiomyopathy: still connecting the dots between genotype and phenotype. Cardiovasc Diagn Ther 5(2):156–159.
  6. Pan S, et al. (2012) Cardiac Structural and Sarcomere Genes Associated with Cardiomyopathy Exhibit Marked Intolerance of Genetic Variation. Circ Cardiovasc Genet:602–610.
  7. Moore JR, Leinwand L, Warshaw DM (2012) Understanding cardiomyopathy phenotypes based on the functional impact of mutations in the myosin motor. Circ Res 111(3):375–385.
  8. Buvoli M, Hamady M, Leinwand LA, Knight R (2008) Bioinformatics assessment of beta-myosin mutations reveals myosin’s high sensitivity to mutations. Trends Cardiovasc Med 18(4):141–149.
  9. Rayment I, Holden HM, Sellers JR, Fananapazir L, Epstein ND (1995) Structural interpretation of the mutations in the beta-cardiac myosin that have been implicated in familial hypertrophic cardiomyopathy. Proceedings of the National Academy of Sciences 92(9):3864–3868.
  10. Kapplinger JD, et al. (2014) Distinguishing hypertrophic cardiomyopathy-associated mutations from background genetic noise. J Cardiovasc Transl Res 7(3):347–361.
  11. Minikel EV, et al. (2016) Quantifying prion disease penetrance using large population control cohorts. Sci Transl Med 8(322):322ra9–322ra9.
  12. Golbus JR, et al. (2012) Population-based variation in cardiomyopathy genes. Circ Cardiovasc Genet 5(4):391–399.
  13. Lek M, et al. (2015) Analysis of protein-coding genetic variation in 60,706 humans. bioRxiv. doi:10.1101/030338.
  14. Dewey FE, et al. (2016) Inactivating Variants in ANGPTL4 and Risk of Coronary Artery Disease. N Engl J Med. doi:10.1056/NEJMoa1510926.
  15. Examining Prevailing Genotype-Phenotype Correlations in Hypertrophic Cardiomyopathy: Findings From The Sarcomeric Human Cardiomyopathy Registry (SHaRe) (2015) Circulation 132:2267–2285.
  16. Spudich JA (2015) The myosin mesa and a possible unifying hypothesis for the molecular basis of human hypertrophic cardiomyopathy. Biochemical Society Transactions 43:64–72.
  17. Kulldorff M, Martin K (1997) A spatial scan statistic. Communications in Statistics – Theory and Methods 26(6):1481–1496.
  18. Ionita-Laza I, Makarov V, ARRA Autism Sequencing Consortium, Buxbaum JD (2012) Scan-statistic approach identifies clusters of rare disease variants in LRP2, a gene linked and associated with autism spectrum disorders, in three datasets. Am J Hum Genet 90(6):1002–1013.
  19. Seebohm B, et al. (2009) Cardiomyopathy mutations reveal variable region of myosin converter as major element of cross-bridge compliance. Biophys J 97(3):806–824.
  20. Köhler J, et al. (2002) Mutation of the myosin converter domain alters cross-bridge elasticity. Proc Natl Acad Sci U S A 99(6):3557–3562.
  21. Garcia-Giustiniani D, et al. (2015) Phenotype and prognostic correlations of the converter region mutations affecting the myosin heavy chain. Heart 101(13):1047–1053.
  22. Woo A (2003) Mutations of the myosin heavy chain gene in hypertrophic cardiomyopathy: critical functional sites determine prognosis. Heart 89(10):1179–1185.
  23. Sanner MF, Olson AJ, Spehner JC (1996) Reduced surface: an efficient way to compute molecular surfaces. Biopolymers 38(3):305–320.
  24. Malik FI, et al. (2011) Cardiac myosin activation: a potential therapeutic approach for systolic heart failure. Science 331(6023):1439–1443.
  25. Winkelmann DA, Forgacs E, Miller MT, Stock AM (2015) Structural basis for drug-induced allosteric changes to human β-cardiac myosin motor activity. Nat Commun 6:7974.
  26. Starr R, Offer G (1978) The interaction of C-protein with heavy meromyosin and subfragment-2. Biochem J 171(3):813–816.
  27. Alfares AA, et al. (2015) Results of clinical genetic testing of 2 , 912 probands with hypertrophic cardiomyopathy : expanded panels offer limited additional sensitivity. (January). doi:10.1038/gim.2014.205.
  28. Maron BJ, et al. (1999) Clinical Course of Hypertrophic Cardiomyopathy in a Regional United States Cohort. JAMA 281(7):650.
  29. Maron BJ, et al. (2015) Hypertrophic Cardiomyopathy in Children, Adolescents and Young Adults Associated With Low Cardiovascular Mortality With Contemporary Management Strategies. Circulation. doi:10.1161/CIRCULATIONAHA.115.017633.
  30. Richards S, et al. (2015) Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med 17(5):405–424.
  31. UniProt Consortium (2013) Update on activities at the Universal Protein Resource (UniProt) in 2013. Nucleic Acids Res 41(Database issue):D43–7.
  32. Dominguez R, Freyzon Y, Trybus KM, Cohen C (1998) Crystal structure of a vertebrate smooth muscle myosin motor domain and its complex with the essential light chain: visualization of the pre-power stroke state. Cell 94(5):559–571.
  33. Kumar VSS, et al. (2011) Crystal structure of a phosphorylated light chain domain of scallop smooth-muscle myosin. Biophys J 101(9):2185–2189.
  34. Winkelmann DA, Miller MT, Stock AM, Liu L (2011) Structure of Human beta-Cardiac Myosin Motor Domain at 3.2 A. Mol Biol Cell:4705.
  35. Yang Y, et al. (2007) Rigor-like structures from muscle myosins reveal key mechanical elements in the transduction pathways of this allosteric motor. Structure 15(5):553–564.
  36. Sali A, Blundell TL (1993) Comparative protein modelling by satisfaction of spatial restraints. J Mol Biol 234(3):779–815.
  37. R Core Team (2014) R: A Language and Environment for Statistical Computing Available at: http://www.R-project.org/.
  38. Wickham H (2009) ggplot2: Elegant Graphics for Data Analysis (Springer Science & Business Media).
  39. Fiser A, Sali A (2003) ModLoop: automated modeling of loops in protein structures. Bioinformatics 19(18):2500–2501.
  40. Yang J, et al. (2015) The I-TASSER Suite: protein structure and function prediction. Nat Methods 12(1):7–8.
  41. Lovell SC, et al. (2003) Structure validation by Cα geometry: ϕ,ψ and Cβ deviation. Proteins: Struct Funct Bioinf 50(3):437–450.
  42. Syamaladevi DP, et al. (2012) Myosinome: a database of myosins from select eukaryotic genomes to facilitate analysis of sequence-structure-function relationships. Bioinform Biol Insights 6:247–254.
  43. Bos JM, et al. (2014) Characterization of a phenotype-based genetic test prediction score for unrelated patients with hypertrophic cardiomyopathy. Mayo Clin Proc 89(6):727–737.
  44. Ingles J, et al. (2005) Compound and double mutations in patients with hypertrophic cardiomyopathy: implications for genetic testing and counselling. J Med Genet 42(10):e59.
  45. Kubo T, et al. (2007) Prevalence, clinical significance, and genetic basis of hypertrophic cardiomyopathy with restrictive phenotype. J Am Coll Cardiol 49(25):2419–2426.
  46. Millat G, Gilles M, Valérie C, Hervé C, Robert R (2010) Development of a high resolution melting method for the detection of genetic variations in hypertrophic cardiomyopathy. Clin Chim Acta 411(23-24):1983–1991.
  47. Otsuka H, et al. (2012) Prevalence and distribution of sarcomeric gene mutations in Japanese patients with familial hypertrophic cardiomyopathy. Circ J 76(2):453–461.
  48. Roncarati R, et al. (2011) Unexpectedly low mutation rates in beta-myosin heavy chain and cardiac myosin binding protein genes in Italian patients with hypertrophic cardiomyopathy. J Cell Physiol 226(11):2894–2900.
  49. Richard P, et al. (2003) Hypertrophic cardiomyopathy: Distribution of disease genes, spectrum of mutations, and implications for a molecular diagnosis strategy. Circulation 107(17):2227–2232.
  50. Song L, et al. (2005) Mutations profile in Chinese patients with hypertrophic cardiomyopathy. Clin Chim Acta 351(1-2):209–216.
  51. Wang J, et al. (2014) Malignant effects of multiple rare variants in sarcomere genes on the prognosis of patients with hypertrophic cardiomyopathy. Eur J Heart Fail 16(9):950–957.
  52. Yu B, et al. (2005) Denaturing high performance liquid chromatography: high throughput mutation screening in familial hypertrophic cardiomyopathy and SNP genotyping in motor neurone disease. J Clin Pathol 58(5):479–485.


Leyendas de las figures

Fig. 1. Diferencias en la posición de las variantes por mutaciones con cambio de sentido entre las cohortes poblacionales de HCM y referencia en la β- miosina cardíaca humana. (A) Se muestran las variantes con cambio de sentido identificadas en pacientes HCM de SHaRe en rojo y aquellas identificadas en individuos de ExAC en azul. La altura de cada punto se compensa para la visibilidad. (B) Recuento de alelo menos común de las variantes con cambio de sentido de MYH7 observadas en probandos HCM de SHaRe. (C) Recuento del alelo menos común de las variantes con cambio de sentido de MYH7 en la base de datos ExAC. No se muestran 15 variantes con cambio de sentido con una frecuencia menor a 0,005.

Fig. 2. Modelos estructurales de la β-miosina cardíaca humana pre y post golpe de fuerza obtenidos por integración de los datos de estructuras cristalográficas resueltas en modelos homólogos. (A) vista lateral de la miosina S1, con meseta relativamente plana en la parte superior, en el estado post golpe de fuerza con los dominios funcionales importantes destacados: el sitio de unión a actina (residuo aminoacídico color verde), bolsillo de unión a ATP (rojo), el convertidor (azul), y la región de unión a la cadena ligera o brazo palanca. El convertidor y su brazo palanca asociado se encuentran por detrás del plano de la figura y por debajo de la meseta. (B) La miosina S1 en el estado pre golpe de fuerza. Pequeños cambios dentro de la región de la cabeza globular con ADP y Pi en el bolsillo de nucleótido resultan en una gran rotación de 70º del convertidor y del brazo palanca. El convertidor se mueve hacia adelante y hacia arriba en comparación con la estructura post al golpe de fuerza, y el brazo de la palanca se proyecta hacia delante, fuera del plano de la imagen. La distancia recorrida por el extremo C-terminal del brazo de palanca es de ~10 nm, el tamaño del golpe del motor.

Fig. 3. La exploración estadística de escaneo espacial identifica una región esférica en el dominio convertidor con un incremento en la proporción de variantes asociadas a HCM. (A) La misma vista lateral del motor S1 previo al golpe de fuerza, como se muestra en la Figura 1B, sin las cadenas ligeras unidas a la región de unión de la cadena ligera α- hélice de S1. Los residuos aminoacídicos color naranja definen una esfera de residuos en el dominio motor que es la única región significativamente enriquecida con las variantes de HCM. Los residuos aminoacídicos de S1 fueron coloreados como se describen a continuación: naranja – región enriquecida con variantes para HCM, azul – variantes por mutaciones con cambio de sentido vistas solo en ExAC, rojo – variantes por mutaciones con cambio de sentido vistas solo en SHaRe, gris claro – otros residuos aminoacídicos. (B) Región enriquecida en el modelo de miosina previo al golpe de fuerza, desde una perspectiva diferente. La vista es directamente hacia abajo sobre la superficie. Los colores son los mismos que en (A). (C) El número de variantes de HCM (SHaRe) y las variantes no asociadas a la enfermedad (ExAC) identificadas en la región esférica enriquecida (izquierda) y en la suma de todas las partes de la miosina (derecha).

Fig. 4. El análisis de exploración espacial de superficie identifica una región de mayor superficie enriquecida para variaciones por mutaciones con cambio de sentido asociadas a HCM. (A) Una visión similar al modelo previo al golpe de fuerza de la Figura 2B, mirando directamente hacia abajo sobre la meseta. Los residuos aminoacídicos fueron coloreados como se describe a continuación: naranja – región de la superficie enriquecida para variantes de HCM, azul variantes por mutaciones con cambio de sentido vistas solo en ExAC, rojo – variantes por mutaciones con cambio de sentido vistas en SHaRe, gris claro –residuos aminoacídicos que se consideran de la superficie, gris oscuro – residuos aminoacídicos que se consideran que no deberían estar en la superficie. La región de la superficie enriquecida en HCM cubre toda la meseta más el dominio convertidor contiguo. (B) La misma vista lateral del modelo previo al golpe de fuerza del dominio motor S1 como se muestra en la Figura 1 y 2A. (C) Vista del modelo previo al golpe de fuerza vista desde el lado opuesto de la meseta. Esta superficie no está enriquecida por variantes HCM. (D) El número de variantes HCM (SHaRe) y de variantes no asociadas a la enfermedad (ExAC) identificadas en la región de la superficie (izquierda) y la suma de todas las demás partes de la superficie de la miosina (derecha).

Fig. 5. Comparación de los fenotipos clínicos entre las regiones enriquecidas y otras regiones de la β-miosina cardíaca. (A) Edad de diagnosis de los pacientes con variantes de HCM enriquecidas en la región esférica del convertido (naranja, n=45) en comparación con otras partes de la cabeza de la miosina (azul, n=201), Wilcoxon p = 6,7 x 10-5. Las gráficas muestran las medianas flanqueadas por el rango intercuartílico (IQR), con los bigotes que se extienden 1,5 veces del rango IQR. (B) Las curvas Kaplan–Meier de edad al momento del diagnóstico comparadas entre variantes HCM en la región esférica enriquecida del convertidor (naranja) y pacientes con variantes en otras partes de la cabeza de miosina (azul). El sombreado indica los intervalos de confianza del 95% para la curva de supervivencia. (C) Edad de diagnosis de pacientes con variantes HCM en la región enriquecida de la superficie (naranja, n=145) en comparación con otras partes de la cabeza de la miosina (azul, n=46), Wilcoxon p = 1.6 x 10-4. Las gráficas muestran y el IQR, con bigotes que se extienden 1,5 veces el rango IQR. (B) Las curvas Kaplan–Meier de edad al momento del diagnóstico se comparadas entre variantes HCM en la región enriquecida de la superficie (naranja) con la de pacientes con variantes en otras partes de la superficie de la cabeza de miosina (azul). El sombreado indica los intervalos de confianza del 95% para la curva de supervivencia.



Fellows Feature: Hilla Behar

hilla2Hilla Behar is a postdoctoral research fellow in the lab of Dr. Marcus Feldman. She received a Master’s Degree at Bar Ilan University in Israel and a PhD at Bar Ilab University, also in Israel. Her research focuses on recombination in infected populations. 

This content has been transcribed from an interview that took place on Stanford campus Wednesday, November 11, 2015 with CEHG’s Director of Programs, Cody Montana Sam and Communications and Outreach Manager, Katie M. Kanagawa.

Can you tell us a bit about yourself, personally and professionally?

My name is Hilla. I did my PhD in the department of Mathematics in Bar Ilan University, Israel. I started my postdoc six months ago at Stanford University. My supervisor is Prof. Marc Feldman.

A little bit of background about myself: I was born in Israel and started my Bachelor’s when I was sixteen years old in Bar Ilan University in the Department of Applied Mathematics. I did my Master’s and PhD in this department as well. My advisor was Prof. Yoram Louzoun. We studied biological and ecological questions using mathematical models.

Can you tell us about your current research?


Drosophila melanogaster, image courtesy of wikipedia.org

Together with my mentor, Prof. Marc Feldman, we are working to understand the dynamics of recombination in infected populations. It is known that Drosophila melanogaster plastically increase the production of recombinant offspring after infection. We built a model that describes this situation and we are trying to understand the dynamics of the model.

How did you first become interested in science and genetics? Were you interested in science as a child?

As a child, I was very interested in all the fields of science. I liked mathematics, physics, biology and computers. At the end of tenth grade, I was accepted to a special program in Bar Ilan University that allows high school students to study for their Bachelor’s in Mathematics. In this program, I finished my Bachelor’s in the Department of Applied Mathematics (magna cum laude). I also finished my Master’s (cum laude) and my PhD in this department. In Louzoun’s lab, I was exposed to different fields of research. The most interesting field in my opinion was Biology, especially Genetics. I decided to research genetic questions during my Post-Doc using the mathematical and physical knowledge that I acquired during my studies.

What are your future plans? Where do you see yourself professionally in the next 5 or 10 years?

My aspiration is to get a research position in a University. I hope that I’ll gain significant expertise in biology and genetics during my Postdoc. In the future, I want to do diverse research.

I think that one of the most beautiful and interesting things in my field, population dynamics and mathematical modeling, is the diversity. We can use models to answer very intricate questions from entirely different fields.

In the future, I want to run my own lab and guide students at the beginning of their research.

Were there people in particular to whom you would attribute your professional success?

The most important people to whom I would attribute my professional success are my parents. They believed in me all along. They knew to listen to me and encourage me. I remember my mother sitting with me in eighth grade and solving equations with me and teaching me the foundation of mathematics. My parents encourage me and believe in me all the way.

What is it like working with Marc Feldman and the Feldman Lab? Do you have labmates you work closely with on projects?

It is a pleasure to work with Marc and with Feldman labmates. I just arrived so I don’t have any collaborations yet, but I hope that, during my postdoc, I’ll have some collaborations with labmates and with other postdocs at Stanford.

What are the differences between the US and Israel? Have you enjoyed your time at Stanford so far?

I really like this University. I think Stanford is beautiful. I like the weather here, the students and the academic environment. I miss Israel very much. I especially miss my family and friends.

Do you have advice you would offer to undergrads, grad students, and postdocs working in your field (or thinking of working in your field)? 

Believe in yourself. You can do whatever you dream.

A brief message from CEHG: This post wraps up CEHG’s 2015-16 Fellows Feature series. It has been a true honor and pleasure to get to know our fellows in interviews and throughout the editing process. As you have seen, our fellows are extremely talented and inspiring people. We hope you have enjoyed reading about their histories, research, and aspirations, as much as we have enjoyed writing about them. 

Coming up: CEHG will be issuing an announcement, congratulating our 2016-17 postdoctoral and graduate student fellows via e-blast shortly. And a new series of features will begin in Summer 2016. Stay tuned.



Fellows Feature: Param Priya Singh

thumbnail_paramParam Priya Singh is a CEHG postdoctoral fellow in the lab of Anne Brunet. He is a graduate of the University of Pune (MS, Bioinformatics) and the Institute Curie, University Pierre et Marie Curie (PhD, Computational Biology). His research focuses on the evolution of lifespan differences and aging, using a short-lived vertebrate, the African turquoise killifish, as a model organism.

This content has been transcribed from an interview that took place on Stanford campus Monday, November 9, 2015 with CEHG’s Director of Programs, Cody Montana Sam and Communications and Outreach Manager, Katie M. Kanagawa.

Can you tell us a bit about yourself?

My name is Param and I’m a postdoc in Anne Brunet’s lab. I did my PhD in Paris in evolutionary genomics. And for my postdoc, I am studying the evolutionary constraints leading to lifespan differences in vertebrates. There is not much known about molecular or genomic determinants of the evolution of lifespan differences, and the diversity of lifespan in nature really fascinates me.

So how did you first get interested in aging?

I’ve a deep-rooted interest in evolutionary biology. For my PhD, I studied the evolution of genes related to cancer and complex diseases in vertebrates. Just like many of the diseases, aging is also a complex phenotype. The evolutionary aspect of aging is particularly interesting because in nature, lifespan ranges from very short (about half a year) to almost 200 years in vertebrates with the same body plan and same set of “core” genes. I wondered, what are the factors that underlie this diversity? Very little is known about the molecular or genomic basis of evolution of these traits, and I thought, with my expertise and background, I could really contribute something to solve this problem.

What mechanisms of aging are you currently studying and in which model organisms?

African killifish pic

The African turquoise killifish, courtesy of molecularecologist.com

We are using a short-lived fish, specifically the African turquoise killifish. It lives in small seasonal ponds in Africa. These small ponds only fill up during the rainy season. The fish grow in them and then the ponds completely dry up when the rainy season is over. The eggs arrest their development and remain in the pond, and then, in the next rainy season, resume and complete their development. So there are very strong evolutionary constraints on this fish to complete its life cycle during the 3-4 months of rainy season. Even if it is brought to the lab and held in captivity, its maximum lifespan is 6-9 months.

The second interesting aspect is that different strains of turquoise killifish from different parts of Africa show considerable variation in their lifespan. So I think this model provides a very interesting framework, because we know the evolutionary constraint and we have an animal we can breed in the lab and work with.

To use the full potential of this model, we have sequenced the genome of this fish. But there is still a lot to learn about the molecular mechanisms of lifespan differences, between strains of this fish and other species. So I am comparing its genome and other functional genomic information with longer-lived fish species to identify candidate genes that may underlie the lifespan or health-span differences.

Is one purpose of this research on killifish aging and longevity to uncover factors in human lifespan and longevity? Or is that completely beside the point?

I think that the knowledge that we gain from the evolutionary studies on turquoise killifish would also be relevant for human longevity. For example, the pathways and genes that underlie the evolution of a short lifespan in the African turquoise killifish may give us some clues about the molecular basis of lifespan plasticity in other species, including human.

What is it like working with Anne [Brunet]?

It is great! She always encourages us to develop our own ideas, and facilitates a very collaborative environment in the lab where we exchange data, ideas, expertise, etc. And most importantly, I think her focus is always to prepare us for our future career as independent researchers. So, for me, it has been a great learning experience so far.

Where do you see your career taking you in the next 5 or 10 years?

After my postdoc, I would like to find a PI position at a leading university and lead a lab in exploring a range of questions related to evolutionary genomics, epigenomics, and aging.

I hope that in 5 years, the African turquoise killifish will be among the established model organisms, and I would like to be able to dissect the molecular basis of its short lifespan and other interesting traits and hopefully extend this knowledge to other species and humans.

Fellows Feature: Siddharth Krishna Kumar


Siddharth Krishna Kumar (Sid) is a Ph.D student in the lab of Dr. Shripad Tuljapurkar. He has received two Master’s degrees, one in Civil Engineering, and one in Statistics, both from Stanford University. Before coming to Stanford, Sid did his undergraduate studies in Civil Engineering at the Indian Institute of Technology, Guwahati. His research focuses on various aspects of demography and population biology.  

This content has been transcribed from an interview that took place on Stanford campus Tuesday, November 3, 2015 with CEHG’s Director of Programs, Cody Montana Sam and Communications and Outreach Manager, Katie M. Kanagawa.

Can you start by telling us a bit about yourself?

I’m Sid, and I’m a fifth-year PhD student in the Department of Biology. I work primarily for Dr. Shripad Tuljapurkar (Tulja), but most of my projects have been joined with Dr. Marc Feldman.

What first brought you to science and biology?

It was kind of odd. I was a poor student with a destructive personality and then suddenly in the 11th grade, I got interested in math and everything changed almost overnight. I was drawn to mathematical applications in physics, and so that became my focus. I did my undergraduate studies in civil engineering and came to Stanford to pursue a Master’s in Environmental Fluid Mechanics.

When I first came here, I couldn’t have dreamed that I would study biology. I hadn’t taken a biology course since the 8th grade. In the spring quarter of my first year here, I did a research assistantship with Tulja. The experience was amazing. I learnt a lot, and ended up working for him for about 9 months. At the end of it, he came up to me and said “Sid, would you consider doing a Ph.D?” and this was too good an opportunity to pass up, so I said yes. That’s how my journey began.

Can you describe some of your current research?

Recently, I have been analyzing a model called GCTA, which is commonly used in heritability estimation. Heritability is defined as the percentage of variation in a trait (say height or blood pressure) that can be explained by additive genetic variation. GCTA produces a near ten-fold improvement in the heritability estimates over its predecessors, and is therefore widely popular. It has been cited more than a thousand times.

I found it odd that although the model uses an overly simplistic description of the genetic architecture, it produces near perfect estimates of heritability. I have analyzed the mathematical properties of this model and have shown that the estimates it produces are unstable and unreliable. We have sent the draft of our paper around and people seem very excited. I have my fingers crossed; I hope it gets published.

UPDATE: Since this interview in November 2015, Sid’s paper was published in PNAS and has caused quite a stir. Click here to read the whole story. 

Is there one person in particular who has had the biggest impact on your career?

Tulja has had a profound influence. My views on everything ranging from science to time management have been strongly influenced by the innumerable coffee trips we have had together.

For my last 2 projects, I worked very closely with Marc [Feldman] and I’ve gotten a lot of invaluable guidance from him too.

Can you speak a bit to the role you see CEHG playing on Stanford campus?

The conferences and talks held by CEHG have broadened my network in the community. They have been a big part of my learning and scientific growth.

I know that CEHG does a lot for science outreach and I think this is extremely important. During my stint as a volunteer teacher, I noticed that a lot of grad students and post-docs are eager to volunteer, and the schools in underprivileged communities desperately need these volunteers, but there are few ways of making these groups connect. I think CEHG is playing the important role of mediator.

You’re planning to graduate this Winter (2016). What is next for you?

I will be working for a company called Upwork in Mountain View. I had interned there last summer and had a wonderful time. I am looking forward to this new phase of my life.

Do you have any advice for other grad students or scholars as they are navigating their careers?

Try and do one course every quarter. That way, you won’t feel like you didn’t accomplish anything for a long period of time, even if your experiments end up failing. A lot of the coursework I had done in completely unrelated subjects (numerical algebra, for instance) ended up being extremely important in the last project I worked on. Learning never goes to waste.


CEHG16 Event Report

The Fourth Annual CEHG Symposium (aka CEHG16) was held on February 29th and March 1st in Paul Brest Hall on Stanford campus. With 260 people registered on Eventbrite and 220 attendees, this event marked significant growth from last year’s event. That increased interest in CEHG’s annual flagship event expanded beyond Stanford’s hallowed halls to Silicon Valley’s biotech industry. Representatives from CEHG16 partners Agena Bioscience , Etalon Diagnostics, and SAP Foundation for Health participated in the festivities and were on-hand to answer questions about their research and services.

25507625061_57e55294e8_o (1)

Etalon Dx mascots were on hand to greet CEHG16 attendees and inform us about miniature horse genomics.

Major attractions included our keynote speaker, award-winning journalist and author Christine Kenneally, our stellar line-up of guest and CEHG speakers who came from near and far to present, and Etalon’s miniature horses who grazed peacefully just outside the hall and greeted people as they drank their morning coffees and ate their delicious Munger-catered lunches. The organizers couldn’t have asked for two more beautiful days (with fog in the early mornings and sun shining the rest of the time) and the overall energy of the crowd was fun, easygoing, and appreciative. Truly, this event was a pleasure for organizers, contributors, and attendees alike. With post-event survey scores averaging 4.8 out of 5, it will undoubtedly serve as a measure for future CEHG symposia success.

The Mission

Stanford’s Center for Computational, Evolutionary and Human Genomics (CEHG) is an interdisciplinary research program that is an intellectual home for 40 faculty and over 200 trainees including postdoctoral scholars and graduate students. Our biggest event of the year, the annual symposium embodies CEHG’s spirit of interdisciplinary collaboration by highlighting research from our labs and fostering interactions with the global scientific community at large.

The Organizers


CEHG16 Organizing Committee

This mission—to enable conversations across disciplinary divides—remained at the forefront of event organizers’ minds as they planned CEHG16 and laid out the meeting agenda, which consisted of individual talks and two group panel discussions. Organizers included: Laura Dunkin-Hubby, CEHG’s Administrative Associate; Katie M. Kanagawa, CEHG’s Communications and Outreach Manager; Yang Li, Postdoctoral Scholar in the Pritchard Lab and member of CEHG16 organizing committee, and Cody Montana Sam, CEHG’s Director of Programs.

The Program

25600300935_f7acec72a3_o (1)

CEHG member Fernando Mendez and other attendees chat during a break.

Feedback from CEHG15 had indicated the importance of carving out more social networking time between, and within, talk sessions, so organizers worked closely with CEHG’s Directors and Executive Committee to design a program with plenty of coffee breaks and networking opportunities (including the reception and poster session at the end of day one and the presenter dinner at the end of day two).

Organizers and Executive Committee members also collaborated on inviting potential speakers whose research spans computational, evolutionary and human genomics and who come from diverse fields such as medicine, genetics, biology, data science, marine science, bioengineering, population studies, computer science, statistics, and the humanities.


CEHG16 Keynote Speaker and award-winning journalist, Christine Kenneally

No one embodied CEHG16’s interdisciplinary mission more fully than our keynote speaker, Christine Kenneally. As the judges of the 2015 Stella Prize said about her 2014 book, The Invisible History of the Human Race (which was also the subject of her keynote presentation):

The sciences and the humanities are traditionally thought of as separate, or even as opposite, fields of study and endeavour, but Christine Kenneally moves on from this kind of thinking in her fascinating exploration of DNA and what it tells us about our individual, social, and anthropological pasts, bringing genetics and history together via the concepts of ancestry and inheritance. At every stage of this book, the data, the facts and the ideas are illustrated and enlivened by personal stories of individual lives and discoveries [christinekenneally.com].

Audience members were fascinated by Kenneally’s literary approach to genetic history and science and they left the symposium curious about work that can be produced at the intersections of the humanities and the sciences. For CEHG’s in-depth pre-event interview with Dr. Kenneally, check out our blog.

The program (which can be downloaded from the Program page on our event website) was divided into six sessions over two days. In order to encourage conversation and (potentially) new research partnerships between CEHG community members and guest scholars, each session was carefully composed of 4-5 CEHG and guest faculty and CEHG trainee presenters. Attendees expressed their admiration of the speaker list, stating that they had never before attended a conference where they were simply not able to leave between sessions because every talk was unmissable.

Guest (non-CEHG) speakers included Michael Eisen (UC Berkeley), Yaniv Erlich (Columbia University), Ryan Haasl (UW Platteville), Mattias Jakobsson (Uppsala University, Sweden), Nicolas Katsanis (Duke University), Nicole King (UC Berkeley), Rasmus Nielsen (UC Berkeley), John Novembre (University of Chicago), Dana Pe’er (Columbia University), Molly Pzreworski (Columbia University), Uma Ramakrishnan (National Centre for Biological Sciences, India), and Tandy Warnow (University of Illinois).


Academia Panelists John Novembre, Tandy Warnow, and Martin Blaser

As mentioned briefly before, the organizers also decided to do something different at this year’s event and organize two discussion panels that would initiate conversation between scholars working in different STEM fields. One panel focused on “Building a Career in Academia” and the other on “Opportunities and Challenges Starting a Genomics Company.” These panels also turned out to be popular attractions, and trainees particularly expressed appreciation for the relevant profession-based advice panelists offered on pursuing careers in academia and industry. For a full listing of our speakers, abstracts, and brief bios, visit our event website and check out the Speakers page).

The Venue

25574234576_43e4935827_o (2).jpg

CEHG16 in Paul Brest Hall

Post-event feedback from the 2015 CEHG Symposium indicated high satisfaction with Paul Brest Hall in Stanford’s Munger Complex, so organizers decided to hold CEHG16 at the same location. And once again, post-event feedback indicates that attendees felt very much at home in the hall, which comfortably seats 200 with long tables (as you see in the picture above).

As with CEHG15, Munger staff were also on-hand to provide logistical support as CEHG16 organizers set up, transitioned between presentations and breaks or networking events, and broke down the stage at event’s end. The venue also features a large patio area just outside the hall, so attendees have a chance to enjoy the California sun and the beauty of Stanford campus during recesses. CEHG organizers would certainly recommend the venue and the Munger staff to other conference organizers planning events on Stanford campus.

Social Media

A team of volunteer designated tweeters covered both days of the event and shared highlights from each individual talk and panel discussion, as well as their thoughts on the event in general. Click here to see a curated list of all #CEHG16 tweets and catch up on event highlights and talk takeaways!

The Workshop


Peter Carbonetto (left) discusses AncestryDNA software with workshop attendees.

CEHG16 talks ended on Tuesday, March 1st, but the event wouldn’t have been complete without the AncestryDNA-hosted “Genomics at Scale” workshop, held the morning of Wednesday, March 2nd and facilitated by Senior Staff Scientist Peter Carbonetto and Senior Genomics Data Scientist Amir Kermany. Twenty CEHG trainees attended and practiced using Ancestry’s new big data analytical methods and tools. Check out our workshop photo album on Flickr.

Special Thanks

CEHG16 organizers would like to express our heartfelt appreciation for the volunteers who made this event happen. CEHG16 took a community of 20 volunteers to pull off, including everyone from registration table operators, mic runners in the hall, volunteer emcees who introduced our esteemed speakers and kept the event running smoothly, timekeepers, designated tweeters, and other day-of volunteers. We are eternally grateful for the dedication and loving care demonstrated by our dedicated CEHG trainees and the annual symposium has a way of bringing out the best in all of us.

25600289805_5a1246a5a1_o (1)

Guest speaker Uma Ramakrishnan

Also, we would be remiss if we didn’t acknowledge the valiant (and successful!) efforts of our event photographer, Saul Bromberger, to capture the day’s very special, joyful quality. Aside from the workshop image and the program download shot, the photos featured throughout this report were produced by Saul. We absolutely recommend Saul Bromberger and Sandra Hoover Photography to anyone who is organizing events on Stanford campus or in the Bay Area. He was a pleasure to work with: gentle, kind, unobtrusive, creative, and capable. For access to our “Best of CEHG16” photo gallery, visit CEHG’s Flickr albums page.

Want to read more about CEHG? 

If you would like to learn more about CEHG’s mission, faculty, blog, and programs, explore our Center website and, if you have any questions, feel free to contact us at stanfordcehg@stanford.edu.

Can’t get enough of our CEHG16 talks or did you have to miss our event? Please note: videos of select CEHG16 talks, recorded and curated by Stanford Video, will be made available on Stanford’s popular youtube channel as soon as possible. Check the CEHG website regularly for links as they become available.


New CEHG Publication: RNA splicing is a primary link between genetic variation and disease

Science Mag Big Logo
Read the article!

Congratulations to CEHG community members Yang Li and Jonathan Pritchard, along with Bryce can de Geijn, Anil Raj, Allegra Petti, David Golan, Yoav Gilad, and David Knowles, for the publication of their study, “RNA splicing is a primary link between genetic variation and disease” in Science on April 29, 2016!


Noncoding variants play a central role in the genetics of complex traits, but we still lack a full understanding of the molecular pathways through which they act. We quantified the contribution of cis-acting genetic effects at all major stages of gene regulation from chromatin to proteins, in Yoruba lymphoblastoid cell lines (LCLs). About ~65% of expression quantitative trait loci (eQTLs) have primary effects on chromatin, whereas the remaining eQTLs are enriched in transcribed regions. Using a novel method, we also detected 2893 splicing QTLs, most of which have little or no effect on gene-level expression. These splicing QTLs are major contributors to complex traits, roughly on a par with variants that affect gene expression levels. Our study provides a comprehensive view of the mechanisms linking genetic variation to variation in human gene regulation.

Read the article!

For further reading: 

University of Chicago Medical Center. “RNA splicing mutations play major role in genetic variation and disease.” Science Daily. April 18, 2016.