Fellows Feature: Yoav Ram

preview-full-yoavram23-2-2016-large-2

Yoav Ram (http://www.yoavram.com) is a CEHG postdoctoral fellow in the lab of Marcus W. Feldman. He is a graduate of Tel-Aviv University (PhD, Theoretical & Computational Biology). His research uses mathematical models and computer simulations to study the evolution of the genetic system, including the evolution of the rates of mutation, recombination, and mis-segregation and their dependence on stress and fitness.

Can you tell us a bit about yourself, personally and professionally? 

I grew up in Herzliya, a suburb of Tel-Aviv, and lived most of my life in the Israeli coastal plain between Tel-Aviv and Haifa, except for a couple of years I lived in Kibbutz Lotan, the southern Arava Valley, working in permaculture. I have three kids, ages 6, 3 and 6 months: my first son was born when I finished my undergraduate degree in Math and Biology; my baby daughter was born on my 33rd birthday, a couple of months after submitting my PhD thesis.

Why did you become a scientist? Did you want to be a scientist as a child?

I wanted to be a scientist since I was very young: I remember reading encyclopedias, and trying to figure if the horizon was straight or curved when I was 7 or 8. My grandfather was a chemical engineer (he even published in Nature in 1944!!) and a huge influence. In middle school, I was interested in astronomy and astrophysics after reading Hawking’s “A Brief History of Time.” In the army, I learned math, stats, and programming, and afterwards it was clear to me that I wanted to do quantitative research. I gravitated towards studying Biology while experiencing nature in Nepal and reading Dawkins’ “The Selfish Gene.” I took an “Intro to Evolution” course in my first year as an undergrad (taught by Prof. Lotem), and my mind was blown. The day after the final exam, I started a research project with Prof. Lilach Hadany. That was almost nine years ago…

Can you tell us about your current research and what you hope to achieve with it? Why is your research important? 

During my PhD, I used mathematical models and computer simulations to study the evolution of stress-induced mutagenesis – when individuals under stress increase their mutation rates. This is a common phenomenon in bacteria, and evidence suggests that it is also common in many eukaryote species, from yeast to human cancer cells. I was able to show that stress-induced mutagenesis can be favored by natural selection due to the beneficial mutations it generates, both in changing and constant environments, and that it increases the rate of complex adaptation without jeopardizing the population mean fitness – therefore breaking the evolutionary trade-off between adaptability and adaptedness. These results have important consequences for various aspects of biology, because mutation is such a fundamental force in evolution. But ultimately, I think that my research contributes to our changing understanding of mutation, and specifically, that mutation is more likely to occur in maladapted individuals – exactly the individuals that stand the most to gain from mutating.

Over the past two years, I focused on a different project, which gave me an opportunity to do experiments and learn new technical skills. Many microbiologists find that measuring microbial growth in a mixed culture is laborious and expensive, and even more so in non-model organisms. To mitigate this problem, I developed Curveball, a new method for predicting microbial growth in a mixed culture solely from growth curve data. I also validated this new method using experiments with bacteria. I hope that Curveball will be used by microbiologists and evolutionary biologists and that it will help bridge the gap between theoretical and experimental evolutionary biology.

Were there people (or one person) in particular to whom you would attribute your professional success? 

I worked for almost nine years at the Hadany Lab in Tel-Aviv University. Prof. Lilach Hadany is an amazing advisor and an inspiring researcher. It has been a daily privilege to study and work in the supportive and challenging environment she provided. The lab is very diverse, combining both experimentalists and theoreticians with different skill sets, working on a large variety of problems. A good example is the set of organisms being studied in the lab: bacteria, yeast, ants, plants – including cacti, tomatoes, and flowers – and digital organisms.

What are your future plans? Where do you see yourself professionally in the next 5 or 10 years?

My main scientific interest is developing models for describing and predicting evolutionary dynamics. My goal is to have my own lab in Israel, combining mathematical and computer modeling with microbial experimental evolution. I want to continue studying the evolution of the processes that generate genetic variance. In addition, I want to better understand the relationships between ecology and evolution.

CEHG’s core values include “interdisciplinary research” and “collaboration.” Can you speak to the ways your work has embodied these values? How do these values align with your own approach to science?

I’m an interdisciplinary and DIY type of person, in both my personal and work life. I am interested in the integration between theoretical and experimental evolutionary biology and I believe that such integration requires interdisciplinary research and collaboration between “wet” and “dry” biology.

The Hadany Lab is a good environment for collaborations between “dry” and “wet” biologists. I had the chance to sit through many “wet biology” seminars and helped on several “wet” projects by doing statistical analysis, dynamic modeling, and image analysis. In addition, my main research project during the past two years – on predicting results of competition experiments – was an opportunity to combine math, stats, programming, and microbiology, and to “get my hands dirty” doing experiments with bacteria and yeast.

What advice would you offer to other grad students or postdocs who are considering pursuing a similar educational and career path as you? 

  1. “Don’t ever let somebody tell you you can’t do something” (The Pursuit of Happyness, 2006).

  2. Work-life balance is important: most people can’t work 24/7 (but see (1)), and reading fiction when you should be reading papers or taking a walk when you should be in front of a computer is OK.

  3. If you don’t know what Impostor syndrome is, then read about it.

  4. If you see a mathematical result that you don’t understand, try to derive it on your own before looking for the original derivation. It builds intuition and skill and sometimes can lead to new findings.

Tell us what you do when you aren’t working on research and why. Do you have hobbies? Special talents? Other passions besides science?

I like cooking, hiking, home-improvement (I used to build mud huts and I like working with wood), playing with my kids, and watching NBA (I’m a Lakers fan). 

 

Fellows Feature: Sharon Greenblum

sharon-greenblum_forweb

Sharon Greenblum is a CEHG postdoctoral fellow in the lab of Dmitri Petrov. She is a graduate of Northwestern University (BS, Biomedical Engineering) and the University of Washington (PhD, Genome Sciences). Her research focuses on studying rapid adaptation in response to natural environmental and ecological change, primarily using Drosophila melanogaster as a model organism.

Can you tell us a bit about yourself, personally and professionally? 

I am a postdoc in Dmitri Petrov’s lab, currently studying the dynamics of rapid adaptation. I grew up in Maryland, but have lived in quite a few places since then, including Chicago, Copenhagen, Washington DC, Tel Aviv, and Seattle.

My path through science has been a bit all over the map as well. I started out studying biomedical engineering as an undergrad at Northwestern University, interested especially in the mechanics of the human body, and what a model of how a knee bends or how a lung inflates can tell us about the course of human history and the challenges our species has found solutions to over time.

My junior year of college, eager to escape another brutal Chicago winter, I decided to study abroad. Though the basis of that plan backfired slightly – Copenhagen in January is no springtime in Paris – academically, it was a real turning point. I completed a course in Bioinformatics, which got me started on the more molecular track I’ve followed ever since. After college, I did a two-year fellowship at the National Institutes of Health, working in a bioinformatics lab studying the molecular pathways implicated in different cancer subtypes. I decided then that I would really benefit from a solid foundation in genetics, so I joined the Genome Sciences Dept. at the University of Washington for my PhD. There too, I took a leap into something new; I joined the lab of a brand new professor studying something I’d never heard of – the human microbiome. It was really exciting being part of such a fledgling field, especially one that allowed me to combine my interest in coming up with new bioinformatic techniques with my passion for understanding the complex forces that have shaped human health and history.

Why did you become a scientist? Did you want to be a scientist as a child? (tell a story)

I didn’t always want to be a scientist. When I was little (and I have the big scrawly handwritten essays to prove it), I wanted to be a librarian. At the ripe old age of eight, I was picturing myself with little pince-nez glasses and pearls. Then it was a journalist, a reporter on the front lines. Then a CIA agent. Then a National Geographic Explorer-in-Residence. Truth be told, I still want to be all of these things. Very much so. Science is the best way I know of to combine these dreams. The common thread through all of these is a desire to get beneath the surface, to understand why things work, to explore, and to ask instead of accept.

Can you tell us about your current research and what you want to achieve with it? Why is your research important? 

In Dmitri’s lab, I’m focusing on developing bioinformatics frameworks for a new way of studying evolution – one that lets us measure adaptation in real time, in real conditions, with realistic metazoan populations. The approach has been termed ‘evolve and resequence,’ and it’s an incredibly exciting step for the field of evolutionary biology. To make the most of it though, we still need to figure out the best ways to obtain the most accurate measurements, and identify meaningful and robust adaptive signatures from large-scale pooled genomic samples taken at multiple timepoints.

More specifically, we’re trying to understand how populations of fruit flies respond to changing environmental conditions over the course of a single summer. From collecting samples of wild fruit fly populations at different timepoints, Dmitri and his colleagues have found evidence that an impressive amount of genomic adaptation may be occurring within populations even at these short timescales, enabling successive fruit fly generations to become better at metabolizing resources quickly when food is abundant, for example, or surviving longer in times of food scarcity. Much of this adaptation appears to be from standing variation – alleles already found in the population that rise and fall in frequency over time.

In general, I’m really excited by the idea that experiments can move beyond the laboratory, and that we can incorporate the tempo of real life. My interest is in developing experimental and bioinformatic frameworks for modeling evolutionary dynamics derived from real biological data. I think that a deeper understanding of how populations adapt may fundamentally change our view of way evolution proceeds, and our assumptions about the timescales that are most influential.

What are your future plans?

I’d love to continue understanding evolution and the processes that govern adaptation at the molecular scale, in whatever capacity I can. More specifically, I’m hoping to spend the next few years gaining a clearer picture of evolutionary dynamics in both host and microbial contexts, so that I will be well-positioned to begin incorporating these processes into a predictive model of host-microbiome co-evolution.

This could mean running my own academic lab, but I also think that the traditional divides between academia, industry, and even the arts may continue to blur. At some point in the future, I’d love to be part of an inter-disciplinary team focused on putting the pieces together.

Were there people in particular to whom you would attribute your professional success? What is it like working with your current lab advisor and his lab?  

I owe a lot of my current research perspective to my PhD adviser, Elhanan Borenstein. When I started grad school, I was almost exclusively interested in human genetics, but had only very vague ideas about what part I wanted to study. I definitely never expected to end up studying bacteria. But when I heard Elhanan present his research ideas to the department for the first time, I was really inspired by how he was thinking outside the box, trying to tackle really ambitious questions with unique data analysis approaches, and borrowing tried and true systems biology tools but applying them in a completely new realm. A colleague and I were the very first students to join the lab, and we got invaluable training in how to think critically and creatively. I think that really shaped how I saw science – that it’s not just about what you know, or what you can measure, but the context you use to interpret it.

I’ve been at Stanford for almost a year, and working with Dmitri has definitely inspired me as well, in complementary ways. Dmitri embodies an enthusiasm for science and academic inquiry that I have yet to see matched in anyone else. He is sharp, forward-thinking, and importantly, has a never-ending drive to share the ideas that inspire him, and turn them into reality. It’s abundantly clear that Dmitri loves what he does. The ‘fun’ part of science is what keeps me going, and Dmitri provides an admirable model of how keep this at the forefront while maintaining exceptional scientific rigor and integrity.

Can you speak a bit to the role you see CEHG playing on Stanford campus?

I think CEHG is a wonderful and important organization to have on campus. I’m a big believer in the power of being able to tackle a problem from multiple perspectives, and I think CEHG offers a means to gain deeper insight into fundamental evolutionary questions by uniting labs with disparate approaches but the same goals at heart. I think one of the biggest challenges is finding ways to facilitate communication between fields with very different vocabularies (both literally and conceptually), and CEHG may provide a training ground for scientists who are better prepared in this regard going forward.

I also think that forming an umbrella organization focused on big-picture questions (rather than specific approaches) opens the door for less traditional perspectives as well. I’ve been working with CEHG to form an Arts interest group to try to look at how the questions CEHG labs focus on are reflected in and informed by art and design. It’s been really fun and fascinating so far, and I don’t think I would have had the opportunity to do this at most other institutions!

What advice would you offer to other grad students or postdocs who are considering pursuing a similar educational and career path as you? 

I’d advise other grad students to listen closely to their instincts, and be open to new possibilities. The field of genetics is so broad, and is changing so rapidly, that what seems important one day may change by the next, so concentrating too narrowly may mean you miss out on the more exciting developments. I’d advise students to try not to be intimidated by how much there is to know and keep up with though, but trust their capacity to learn and synthesize.

Trust also that every experience can be beneficial – a background made up of what interests you will give you a unique perspective going forward. Mostly, I’d advise students to just keep on going, to take opportunities to learn something new and have fun with it.

Fellows Feature: Zach Zappala

zach-zappala_forweb

Zach Zappala is a CEHG graduate fellow in the lab of Stephen Montgomery. He is a graduate of The College of New Jersey (BS, Biology and Computer Science). His research focuses on statistical methods for identifying the genetic basis of rare complex traits.

Can you tell us a bit about yourself, personally and professionally?

I’m a 5th year PhD student in Genetics. I grew up (and went to college) in New Jersey before moving to California. When I was an undergraduate, I majored in biology and computer science; I have been interested in using computational methods to solve biological problems ever since I was 17 and first started working in a research lab. During college, I spent a summer living in Tokyo while taking Japanese language classes.

I came to Stanford straight after I completed my undergraduate degree, and have really enjoyed living in northern California. I like to travel and enjoy hiking around the Bay Area. I especially like skiing in Tahoe during the winter, and try to get outdoors as much as possible.

How did you end up here? What got you interested in genetics and science?

When I was in high school, I really liked working with computers, writing code, and coming up with novel solutions for problems I encountered. I was obligated to do a scientific internship when I was 17, and I enjoyed applying all of my computational skills to the genetics problems I was working on. As an undergrad, I decided that I would like to continue on and get a PhD and I continued doing research (although most of my work was at the bench!).

Can you tell us about your current research and what you want to achieve with it?

My current research has been focused on developing methods that can identify the genetic basis of extreme traits (either disease status or some other human trait). I have been trying to do this for mutations that impact gene regulation, which is generally pretty difficult for rare mutations. I’ve spent a lot of time studying a cohort of families from Sardinia, Italy, where my closest collaborators are from.

The island of Sardinia is particularly interesting for genetic studies because, while it was first inhabited thousands of years ago, it has remained relatively genetically isolated. As a result, the distribution of mutations on the island is unique relative to geographically close regions due to drift and selection. Additionally, Sardinians have elevated risks for autoimmune disorders like type 1 diabetes and multiple sclerosis, and they have historically experienced significant exposure to malaria until its rather recent eradication. By looking at families, we are better able to capture the effect of rare mutations that are transmitted from parents to children, and can use these events to understand the genetic mechanisms underlying gene regulation and disease risk in these individuals.

Additionally, we are now working to bring these methods into the clinic in order to understand Mendelian diseases that result from non-coding variation. Such scenarios are difficult to approach with exome and whole genome sequencing. As a result, only about 30% of rare disorders are “diagnosed” – meaning that the causal mutation (or affected gene) has been successfully identified. By studying gene expression in rare disease patients, we are hoping to increase the diagnostic success rate for clinical genome centers and improve the care and treatment of these patients.

Were there people in particular to whom you would attribute your professional success?

There are so many people that have been a huge part of any successes I’ve achieved – all of my mentors and advisors, collaborators, and lab mates have played an integral role. In our current lab, several of us often work very closely together on a few projects, helping out where our own particular expertise applies.

Can you speak a bit to the role you see CEHG playing on Stanford campus?

I think that CEHG plays a unique role for the scientific community here at Stanford – for one, it brings together labs in different departments that, while separated on paper (and on campus), work and think about the same kinds of things all the time. Having a formal Center through which these labs can interact loops these people together, and is better for everyone.

What advice would you offer to other grad students or postdocs who are considering pursuing a similar educational and career path as you? 

Looking back, I think I would have benefited from taking some time off between my undergraduate degree and graduate school – while this isn’t necessarily true for everyone, I had trouble adjusting to the different kinds of academic pressures that exist in graduate school. However, I have no regrets – doing a PhD has been an incredibly fun and rewarding experience, and I have met some of the most incredibly interesting people I know here at Stanford and at conferences I’ve traveled to.

 

Fellows Feature: Katie Solari

katie-solari_forweb

Katie Solari is a CEHG predoctoral fellow in the lab of Elizabeth Hadly. She is a graduate of UC Berkeley (BA, Integrative Biology). Katie’s research investigates the mechanisms underlying high-altitude hypoxia tolerance, focusing on Asian pika species (small mammals related to rabbits, who serve as the inspiration for pikachu). 

Can you tell us a bit about yourself, personally and professionally?

I grew up less than 10 miles from Stanford campus, in Redwood City. I went to Berkeley for my undergrad, but I didn’t go straight into graduate school. I spent one year working for AmeriCorps NCCC, where I mainly did construction in New Orleans, rebuilding after Hurricane Katrina – this was one of the best experiences of my life. I also taught students with learning differences at a Bay Area high school for two years, and really enjoyed that teaching experience.

Why did you become a scientist? Did you want to be a scientist as a child?

As a kid I was obsessed with animals, every story I wrote or picture I drew was of one of my pets (we had a dog, cat, and a tortoise). My Dad is a high school biology teacher, so growing up we always had a microscope at home that I loved to play with and look at microorganisms in pond water or insects from the backyard.

After undergrad, I was given the opportunity to travel to Tanzania for a summer to teach English and Biology. While I was there, I was able to go to Serengeti National Park and the Ngorongoro Conservation area for three days. The wildlife was unlike anything I had ever imagined. Witnessing the beauty of these animals in their natural habitat and thinking about all of the Anthropogenic pressures threatening their existence, and all that we still have to learn from them, sealed the deal for me. I knew I wanted to do research to learn more about the wildlife around us and to hopefully play a role in its maintenance.

Can you tell us about your current research and why your research is important?

Specifically, my dissertation work has been focused on investigating the mechanisms underlying high-altitude hypoxia-tolerance in pikas (small mammals related to rabbits). However, at the heart of this work is a desire to better understand how our world will change with continued climate change and how we might be able to mitigate these impacts in some way.

dscn1545-1

Ochotona roylei in Spiti Valley, Himachal Pradesh, India. 2013 photo courtesy of Katie Solari.

There are about 30 pika species, two are found in North American and the others are all in Asia. Pikas are extremely heat-intolerant and, as such, are generally isolated in cool habitats at high elevations or high latitudes. In response to climate change, pikas in parts of the US and the Himalayas have been moving to higher elevations to escape the heat. Due to their thermal sensitivity and their relatively rapid range retraction, pikas have become an icon of climate change.

By assessing what mechanism pikas have at their disposal to deal with high-elevation hypoxia, I hope that we will be able to better assess which species and populations will be capable of living in the high elevation refugia that they are being forced into. Our findings so far indicate that high elevation pika species (such as those living in the Himalayas) have genetic adaptions to help them deal with hypoxic stress that are not present in lower elevation species. These findings suggest an elevational specialization of pika species, indicating that it may be hard for species to shift elevational ranges quickly in response to climate change. However, a study I conducted on a single population of pikas in the Indian Himalayas, along an elevation gradient (3600-5000m), indicates that plasticity in gene expression may also play a role in allowing pikas to shift elevations. This suggests that even though there are genetic adaptations playing a role in hypoxia-tolerance at the species level, plasticity in gene expression may also facilitate range movement at a finer scale.

Pikas are extremely important to their ecosystems, acting as both ecosystem engineers and keystone species. I hope that the more we learn about their ability to respond to climate change, the more likely it will be that we will be able to preserve them, and the services they provide their ecosystems, into the future.

Were there people (or one person) in particular to whom you would attribute your professional success? What is it like working with your current lab advisor and her lab?

Liz has been an amazing mentor to me over the past five years. She has helped me mature as a scientist, critical thinker, and collaborator. More than anything, she has shown amazing confidence in me and has given me the room to try to rise to every new challenge. Something I’m particularly grateful for is the incredible example Liz has set for how to take research out of academia and into the real world, in order to get closer to affecting real change. I believe that the current state of the world demands that researchers cross over into policy and action, and Liz has done an incredible job at exemplifying how to do that.

I have also had the privilege to work extensively with Dr. Uma Ramakrishnan, from the National Center for Biological Sciences in Bangalore, both here and in her lab in India. Uma has also set a great example for how to work toward merging science and policy so that what we learn can be translated into real world changes on a timescale that will keep pace with the rapidly progressing challenges that our world is facing. The way that both Liz and Uma think about environmental issues and the role that scientists can play in solving them have greatly impacted me and what I aspire to do after my PhD.

Courtney Wilson also had a pivotal impact on my decision to go to grad school to begin with. Courtney and I, best friends since preschool, both had similar aspirations after undergrad to work towards environmental betterment. After leaving undergrad, I didn’t know anyone in the academic world – Courtney was it. She was working at a lab in Cornell and was my vital connection to academia. She helped me get access to the scientific literature for my applications, introduced me to graduate students doing conservation research, and, more than anything, was having all of the same concerns about biting off grad school and was the exact sounding board that I needed to decide that grad school was the right choice for me. When I started my PhD at Stanford, Courtney started her Master’s at the School of Natural Resource and the Environment at the University of Michigan and went on to begin her PhD there. The world was robbed of what Courtney had to offer when she tragically passed away in the first month of her PhD program, but her contagious drive and passion is still helping me, along with many others, work towards a shared goal of environmental improvement.

img_0726

Katie Solari conducting fieldwork in Spiti Valley, Himachal Pradesh, India. 2013 photo courtesy of Ania Wrona. 

What are your future plans? Where do you see yourself professionally in the next 5 or 10 years? 

I mainly just want to do something that will move us, however little, towards responding to the challenges of our time in an effective way. I’m open to any opportunity to work towards preserving the organisms and ecosystems that we have and/or mitigating climate change and its impacts.

What advice would you offer to other grad students or postdocs who are considering pursuing a similar educational and career path as you?

Be prepared to experience 10 times as many failures as successes. Research always feels like an uphill battle. You can’t let rejections or failures get you down. You need to keep moving forward and see everything as a learning experience.

Can you speak a bit to the role you see CEHG playing on Stanford campus?

CEHG exemplifies the best parts of Stanford in that it facilitates innovative thinking in order to move science into new and exciting directions. CEHG funding opportunities allow students to use their imagination and take risks – a CEHG trainee research grant allowed me to initiate collaboration with the Minnesota Zoo in order to work with the only captive population of pikas in the world (held there).

Through the outreach group, CEHG also makes it a priority to reach out to the local community to share the love of science with local middle school and high school students. The types of opportunities that CEHG offers its students, as well as students in the local community, is what makes Stanford a place that fosters novel research and a general love for science.

Fellows Feature: Sebastien Boyer

sebastien-boyer_forweb

Sebastien Boyer is a CEHG postdoctoral fellow in the lab of Gavin Sherlock. He is a graduate of the University of Grenoble (MS, Physics) and earned his PhD  in the Laboratory for Interdisciplinary Physics at the University Grenoble (Physics for Life Sciences). His research focuses on yeast population (as a model organism) evolving in changing environments and, more particularly, on the effect of time scale and the randomness of those changes on adaptation. 

Can you tell us a bit about yourself, personally and professionally? 

I am a French physicist interested in various problems found in biology and, more particularly these days, evolution. I was born and raised on a French island, named Reunion Island. It’s a tropical island in the middle of the Indian Ocean, known for it’s multi-ethnicity, world class waves, volcano and unique landscape. I spent most of my college time in Grenoble (Mainland France), and did a year exchange in Hong Kong.

I used to swim on a team for 17 years, but nowadays I am swimming and playing Water Polo for fun, here at Stanford. I used to travel a lot, from Mongolia to Tanzania through Norway (for example), and I am now very eager to discover California and the U.S., generally speaking.

Why did you become a scientist? Did you want to be a scientist as a child? 

I am a big fan of science fiction and have been since I was a child. As a child, I wanted to be an explorer, crossing the galaxies in fancy spaceships to discover new planets and life forms. This somehow led me to physics: quantum mechanics and relativity were, for me, real world science fiction.

In Hong Kong, I had the chance to attend a talk of Bob Austin’s about antibiotics resistance, and he was talking like a physicist: individuals were hopping from one point to another in a more or less rugged fitness landscape. Sometimes they were randomly diffusing, and other times, they were driven toward an optimal. I realized that physicists might have relevant things to say about biology and evolution.

From there, I did a PhD in the field of protein evolution and, to some extant, immunology. For a postdoc, I wanted to go from the bottom up and work with eukaryote to get into the genetics of evolution and not only its statistics. I got interested in the work of the Sherlock lab because the barcoding technology they developed actually allows you to have access to the statistics and genetics of evolving yeast populations.

Can you tell us about your current research and what you want to achieve with it? You could start by listing 3 words you think best represent or embody your research.

Evolution, changing environments, yeast.

I am interested in the influence of changes in the selective environment that a population (of yeast, as a model organism) can encounter. More specifically, I am interested in the influence of the time scales on those changes (long enough to trigger adaptation in the different environments or shorter than that).

Similarly, I also look at the effects of predictable changes vs random changes on the evolution of those populations. I want to see the effects of those changes in terms of dynamics, statistics and genetics. For example, I would like to see the emergence of different genetic strategies from different types of environmental changes. My work is mainly experimental, even though I have been coding (python) quite a lot so far, for future sequencing analysis. I also coded an algorithm reproducing in silico the experiment I had in mind; it helped me a lot to design it actually.

In nature, environments are changing and populations have to cope with that. Understanding to what extent a population adapted to one environment can adapt to another one is crucial. Questions about a changing environment, the time scale of the changes or its degree of randomness are, for example, directly linked to antibiotic resistance for bacteria or drug resistance in cancer.

Were there people (or one person) in particular to whom you would attribute your professional success? What is it like working with your current lab advisor and his/her lab? 

My mother for teaching me how to read, and my father for introducing me to science fiction. My math teacher in “prepa” (cram school for engineering school) for teaching me, the hard way, two really important life/academic lessons : 1) You can and will fail and there is nothing to be afraid of there; 2) When faced with a difficult problem, think hard but don’t get stuck. Instead, get started, even if your first action seems useless; for example, just rewrite what is known about the problem. A journey of a thousand miles begins with a single step.

The lab is used to working with physicists through collaboration with the Fisher and Petrov labs. I took some time to actually build this project. Gavin gave me this time and was really enthusiastic about the ideas I was bringing. It’s really nice to be trusted that way in the development of a new project. Even though I am alone in this project, I have the help of Lucas Herissant for experimental expertise and Jamie Blundell and Atish Agarwala for the theoretical counterpart.

What are your future plans? 

I would like to get a tenure position in a university somewhere in Asia or Oceania, still working in evolution and probably expanding my research horizons into other fields of biophysics, like neuroscience for example.

Can you speak a bit to the role you see CEHG playing on Stanford campus? CEHG’s core values include “interdisciplinary research” and “collaboration.” How do these values align with your own approach to science?

CEHG is one of the main promotors of interdisciplinarity in the field of genetics and genomics on Stanford campus. It acts like a hub, giving the opportunity for experts from different fields to interact.

Often, during my PhD, we ended up talking about our research with the same small group of people, all physicists, although our research could influence or be influenced by other fields like immunology, protein design etc… We were lacking a community that would bring us together, and that is really what CEHG does I think.

As a physicist and evolutionary biologist who wants to explore evolution in the framework of genetics, it is obvious how my values align with those of CEHG.

What advice would you offer to other grad students or postdocs who are considering pursuing a similar educational and career path as you? 

Just go for it. By working in an interdisciplinary environment, you never stop to learn and can get introduced to problems and experiments you never though of. One week, I learn in a journal club that some neurons are activated into a spatial pattern, and the week after, I am listening to an awesome talk about multicellular emergence. Science needs more and more interactions between specialists from different fields and people who can actually make the links between those different communities.

 

 

Fellows Feature: Ziyue Gao

ziyue-gao_forweb

Ziyue Gao is a CEHG postdoctoral fellow in the lab of Dr. Jonathan Pritchard. She received her Bachelor’s Degree in Biological Sciences and a second degree in Economics from Tsinghua University in China. She then did her Ph.D study in genetics at the University of Chicago, working with Dr. Molly Przeworski. Her research focuses on understanding the roles of mutation and natural selection in shaping the genetic variation pattern in human populations, particularly their impact on the prevalence and distribution of disease-associated mutations.

Can you tell us a bit about yourself, personally and professionally?

I started my postdoc in Jonathan Pritchard’s lab in September 2015, after finishing a PhD in genetics at the University of Chicago. I was a graduate student in Molly Przeworski’s lab, and we studied the impact of balancing selection on maintaining genetic diversity in primates and the burden of recessive lethal mutations in human.

A bit of background about myself: I was born and raised in Beijing, China. My childhood and teenage years were pretty boring: the kindergarten, elementary school, middle school, and high school I went to were all within a 5km radius circle around home, and I attended a university where my grandfather and my mother worked. I was so glad that this routine finally ended with my journey to Chicago for graduate study.

What have you perceived to be the differences between the US and your home country? Have you enjoyed your time at Stanford?

The US values diversity and work-life balance much more than my home country does. I have benefited a lot from these differences in my career and personal developments. I feel extremely lucky to be able to work and study at Stanford.

Can you tell us about your current research and what you hope to achieve with it?

Together with Jonathan [Pritchard] and Emily Glassberg, a grad student in our lab, I’m currently studying the selection pressures on gene expression levels. Expression changes are long hypothesized to drive a great amount of phenotypic differences between species and among individuals, but whether or not and to what extent gene expression is under evolutionary constraints is largely unknown.

We try to tackle this question by utilizing results from recent genome-wide analyses of gene expression. By comparing the joint distribution of allele frequency and effect size of identified expression-altering variants across different groups of genes, we can infer whether the expression levels of these groups are under different levels of evolutionary constraints. We also develop a likelihood-based method to estimate the overall proportion and average effect size of all regulatory sites for any given group of genes. Together, these analyses will bring new insights into the genetic architecture and evolutionary constraints on gene expression in humans.

What first got you interested in genetics and science?

In college, I was fascinated by the rigor of genetic analysis and the rapid development of molecular techniques, and I thought the quantitative nature of genetics would provide me a niche to combine my strength in mathematics and passion for life science.

Prior to joining the University of Chicago, I had never heard of the field “population genetics,” but after taking only two lessons taught by Dr. Dick Hudson, I decided to do a rotation in a population genetics lab. After a rotation in Molly’s lab, I was determined to devote my PhD (and hopefully my career) to research in population genetics.

Were there specific people to whom you would attribute your professional success?

There were, of course, many people that had great impacts on my career decisions, but I would like to especially thank two of them, Dick and Molly, for introducing me to the wonderful world of population genetics.

What is it like working with your current lab advisor and his/her lab? Do you have lab mates you work closely with on projects?

Working with Jonathan is a real pleasure. He is very flexible in terms of his working style— he can be as attentive and as hands-off as you need. This flexibility leads to higher work efficiency and more innovative ideas.

I also really enjoy being surrounded by my lab mates, who have the perfect composition of smartness, nerdiness, and fun. I learned a lot from them, especially from Emily, with whom I am currently working closely on studying selection on gene expression.

What are your professional plans for the next 5-10 years? 

My ambition is to get a position at a university, either in the US or in my home country. I also have passions for forensic science and science fiction, so don’t be surprised if you find me becoming a detective or a sci-fi writer 10 years later.

Do you have advice you would like to offer undergrads, grad students, and postdocs (thinking of) working in your field? 

For grad students, cherish your time in grad school: it is a great time (if not the best time) to learn some theory, build up skill sets, try bold ideas, and not worry much about progress.

Research is not a “linear” process. It is especially slow and challenging at the beginning.

Sometimes we are stuck on a project for months or even years with no good/trustable results, but it doesn’t mean we achieve nothing — we learn a lot from the quests, setbacks and even failures. Grad school is such a rare opportunity when one can focus on learning and the cost of failure is very low.

Can you speak a bit to the role you see CEHG playing on Stanford campus?

The Evolgenome seminar series is one of the great things that CEHG offers. It enables me to learn new knowledge and perspectives from others’ research on a regular basis. The annual CEHG symposium provides further opportunities to interact with speakers and audience members from on and off campus. I can see that these activities will facilitate the exchange of ideas and foster a lot of future collaborations.

Tell us what you do when you aren’t working on research. Do you have hobbies or special talents? Other passions besides science?

I always have huge passions for movies and stage plays, but recently I’ve been spending a lot more time outdoors, training for a half-marathon. Other than the wonderful academic environment and opportunities at Stanford, I feel this new hobby is the best gift that the Bay Area gives to me.

 

Spanish Translation of PNAS Article: Multidimensional structure-function relationships in human β-cardiac myosin from population-scale genetic variation

Click here for English web-version.

Título: Relaciones entre función y estructura multidimensional en la β-miosina cardíaca humana a partir de variación genética a escala poblacional.

Clasificación: Ciencias Biológicas – Genética.

Autores: Julian R. Homburgera, Eric M. Greenb, Colleen Caleshuc,d, Margaret S. Sunithae, Rebecca E. Taylorf, Kathleen M. Ruppelf,g, Raghu Metpallyh, Steven D. Colani, Michelle Michelsj, Sharlene Dayk, Iacopo Olivottol, Carlos D. Bustamantea,m, Frederick Deweyn, Carolyn Y. Hoo, James A. Spudiche,f,1,2, Euan A. Ashleya,c,1,2

Afiliaciones:

aDepartment of Genetics, Stanford University School of Medicine, Stanford, CA 94305.

bMyoKardia, Inc. South San Francisco, CA 94080.

cStanford Center for Inherited Cardiovascular Disease, Stanford University, Stanford, CA 94305.

dDivision of Medical Genetics, Stanford University, Stanford, CA 94305.

eInstitute for Stem Cell Biology and Regenerative Medicine, Bangalore 560065, India.

fDepartment of Biochemistry, Stanford University School of Medicine, Stanford, CA 94305.

gDepartment of Pediatrics (Cardiology), Stanford University School of Medicine, Stanford, CA 94305.

hGeisinger Health System, Danville, PA.

iDepartment of Cardiology, Boston Children’s Hospital, Boston, MA

jDepartment of Cardiology, Erasmus MC, Rotterdam, the Netherlands.

kCardiovascular Division, Department of Internal Medicine, University of Michigan, Ann Arbor, MI

lReferral Center for Cardiomyopathies, Careggi University Hospital, Florence, Italy

mDepartment of Biomedical Data Sciences, Stanford University, Stanford, CA 94305.

nRegeneron Inc., Tarrytown, NY.

oBrigham and Women’s Hospital, Boston, MA.

1 Dirigir la correspondencia a las siguientes direcciones: euan@stanford.edu; jspudich@stanford.edu

2Estos autores contribuyeron igualmente a este trabajo.

Resumen

Los motores de miosina son los elementos fundamentales de la generación de fuerza en la contracción muscular. Variaciones en el gen de la cadena pesada de la β-miosina cardíaca (MYH7) pueden conducir a la miocardiopatía hipertrófica (HCM), una enfermedad hereditaria caracterizada por hipertrofia cardíaca, insuficiencia cardíaca y muerte súbita. Cómo variantes específicas de la miosina alteran la función motora o la expresión clínica de la enfermedad son aun entendidas de manera incompleta. Aquí combinamos modelos estructurales de la miosina a partir de múltiples estados de su ciclo quimiomecánico, los datos de secuenciación del exoma de dos cohortes poblacionales de 60.706 y 42.930 individuos, y los datos genéticos y fenotípicos de 2.913 pacientes HCM para identificar regiones de enriquecimiento para la enfermedad dentro de la β-miosina cardíaca. Primero desarrollamos modelos computacionales de la proteína β-miosina cardíaca humana antes y después del golpe de fuerza. Luego, utilizando un estadístico de exploración espacial modificado para analizar las variaciones genéticas en el espacio tridimensional de la proteína encontramos un enriquecimiento significativo de variantes asociadas con enfermedad en el convertidor, un dominio cinético que transduce la fuerza desde el dominio catalítico al brazo de palanca para lograr el golpe de fuerza. Centrando nuestro análisis en los residuos expuestos en la superficie, identificamos una gran región enriquecida significativamente con variantes asociadas a enfermedad que contiene tanto el dominio convertidor como los residuos en una superficie plana sobre la cabeza de la miosina descrita como meseta de miosina. Notablemente, los pacientes HCM con variantes en las regiones enriquecidas tienen una aparición más temprana de la enfermedad que aquellos que tienen variantes en otros lugares. Nuestro estudio proporciona un modelo para la integración de la estructura de proteína, secuenciación genética a gran escala y datos fenotípicos detallados para ayudar a comprender las estructuras de proteínas desplazadas en el tiempo y la enfermedad genética.

Palabras clave: Miosina, Miocardiopatía hipertrófica, variantes genéticas raras, tolerancia genética.

Declaración de importancia: Variantes genéticas en la β-miosina cardíaca humana, responsable de la contracción muscular en el corazón, puede conducir a la miocardiopatía hipertrófica (HCM), una enfermedad cardíaca hereditaria que puede causar la muerte súbita. Nuevas tecnologías han generado datos de secuencias para un gran número de pacientes con HCM y para individuos sanos. En este estudio, comparamos la ubicación en la estructura de la proteína de las variantes genéticas de pacientes HCM y de la población general para identificar las regiones espaciales en la miosina que tienen una mayor proporción que lo esperada de variantes genéticas asociadas a HCM y edades tempranas al momento del diagnóstico. Además, desarrollamos nuevos métodos para determinar la localización de los cambios genéticos en la estructura de proteínas. Nuestro estudio demuestra el poder de combinar los datos clínicos, genéticos y estructurales para comprender mejor la enfermedad Mendeliana.


Introducción

Los motores de miosina son máquinas moleculares responsables de convertir la energía química en la fuerza mecánica necesaria para la división celular, la migración celular dirigida, el tráfico de vesículas y la contracción muscular (1). Las variantes en el gene MYH7, el cual codifica para la cadena pesada de la β-miosina cardíaca, causa miocardiopatía hipertrófica (HCM), una enfermedad genética del músculo del corazón caracterizada por un engrosamiento asimétrico de las paredes ventriculares y una disminución en el tamaño de la cámara ventricular. HCM es la enfermedad cardíaca hereditaria más común, con una prevalencia de 1 por cada 500 individuos. Clínicamente, el curso de HCM es variable, desde pacientes que experimentan síntomas mínimos hasta otros que desarrollan arritmias, insuficiencia cardíaca o muerte súbita (2). Las relaciones entre el genotipo y la expresión de la enfermedad en HCM han sido difíciles de establecer debido a la ausencia de datos genéticos a gran escala provenientes de poblaciones y la falta de intercambio multicéntrico de datos genéticos y clínicos de los pacientes (4, 5).

El gen MYH7 está extremadamente limitado en su variación genética. Se observan pocas variantes con pérdida de la función en cohortes poblacionales, y las variantes patogénicas identificadas son principalmente mutaciones con cambio de sentido. Sin embargo, aunque muchas variantes genéticas con cambio de sentido en MYH7 causan HCM, no todos los cambios genéticos dentro del gen conducen a la enfermedad. Hay distintas hipótesis con respecto a la localización de las variantes patogénicas de mutaciones con cambio de sentido dentro de MYH7, el análisis de las cuales puede ofrecer información acerca del mecanismo subyacente de HCM. Algunos investigadores han sugerido el enriquecimiento de variantes patogénicas en los dominios funcionales de la β-miosina cardíaca, incluyendo el dominio convertidor, el sitio de unión a actina y el dominio de unión a ATP (7-9). Sin embargo, otros han sugerido que no hay un enriquecimiento regional para las variaciones de HCM dentro de MYH7 (4, 10). Estas inconsistencias podrían ser debido a los tamaños de muestra limitadas o a la falta de cohortes de referencia para la comparación. Sin información sobre la distribución natural de variantes raras dentro de MYH7, es imposible de distinguir las regiones con enriquecimiento de variantes asociadas a la enfermedad de aquellas regiones con una mayor tolerancia genética (11). Además, algunas supuestas variantes patogénicas se encontraron posteriormente en frecuencias alélicas más altas de lo esperado en cohortes de referencia de poblaciones étnicamente diversas (12). El estudio que sugería dominios enriquecidos carecía de cohortes de referencia, cuando una cohorte de referencia fue comparada contra las variantes genéticas de una muestra pequeña de pacientes con HCM, el estudio no pudo detectar ningún enriquecimiento significativo de variantes asociadas a la enfermedad (10). Además, un enfoque en secuencia lineal del gen o en los dominios funcionales descritos previamente podría pasar por alto regiones funcionales novedosas o enriquecimientos que abarcan varios dominios. Estas discrepancias apuntan a la necesidad de evaluar el enriquecimiento de variantes de HCM regionales dentro de MYH7 usando cohortes grandes tanto de pacientes como de referencias, mientras se tiene en cuenta la estructura tridimensional de β-miosina cardíaca.

Avances recientes en tecnologías de secuenciación de última generación han permitido el ensamblaje de grandes conjuntos de datos de variación genética en humanos tanto en poblaciones no seleccionadas como en aquellas afectadas por la enfermedad. El análisis comparativo de estas cohortes permite hacer inferencias intragénicas de la morbilidad de la enfermedad y de limitaciones (a la variación), una medida de la tolerancia de la población a la variación, lo cual puede ayudar a comprender qué residuos de aminoácidos son funcionalmente críticos y la etiología de la enfermedad. El Exome Aggregation Consortium (ExAC ) (13) y la cohorte DiscovEHR (14) son cohortes de secuenciación de exoma de 60.706 y 42.930 individuos, respectivamente, que proporcionan información detallada acerca de las tasas y tipos de variaciones genéticas observadas dentro de los genes asociados a enfermedades. Además, el Registro de Miocardiopatía Sarcoméricas humanas (SHaRe por sus siglas en ingles) fue establecido como un consorcio internacional de investigadores de HCM y actualmente poseen datos clínicos longitudinales detallados de 2.913 pacientes con HCM que se han sometido a pruebas genéticas. A medida que proyectos con una amplia clínica y secuenciación de poblaciones se hagan más frecuentes, métodos estadísticos novedosos para el análisis de la restricción y la carga de las variantes serán esenciales para ampliar la comprensión de la enfermedad e identificar regiones intragénicas enriquecidas con variaciones asociada a la enfermedad.

Nosotros formulamos la hipótesis de que el evaluar la tolerancia genética regional en el contexto de las estructuras tridimensionales desplazadas en el tiempo revelaría nuevas ideas acerca de MYH7 y posibles puntos calientes en la estructura de miosina de las variantes patogénicas en HCM. A continuación, comparamos los datos genéticos de SHaRe, un registro internacional de HCM (15) con variantes identificadas en proyectos de secuenciación de exomas a gran escala (13), con la finalidad de identificar regiones de enriquecimiento para las variaciones asociadas a HCM antes y después del golpe de fuerza de la β-miosina cardíaca. Además, desarrollamos un marco estadístico general basado en una versión modificada de un estadístico de exploración espacial para buscar regiones con incremento en las variaciones asociadas a la enfermedad en la estructura tridimensional y superficies de la proteína. Finalmente, aprovechamos los datos clínicos y fenotípicos disponibles en SHaRe para analizar diferencias clínicas entre los grupos de pacientes basados en la ubicación de la variante en la β-miosina cardíaca. Nosotros demostramos el poder de la combinación de datos clínicos, genéticos, y estructurales para hacer inferencias respecto de la etiología de la enfermedad y a los puntos calientes en la estructura tridimensional de las variantes de HCM.

Resultados y Discusión

Primero comparamos la distribuciones lineales de las variantes con mutaciones con cambio de sentido en pacientes HCM (SHaRe) y en la cohorte de referencia de la población (ExAC). La cohorte ExAC contiene la información de la secuencia de 60.706 individuos que formaron parte de estudios de una enfermedad específica (no HCM) o de estudios de genética de poblaciones, mientras que la base de datos SHaRe contiene 2.913 individuos con HCM que fueron secuenciados para MYH7. Aunque la referencia ExAC contiene algunas variantes del sarcómero patogénicas y probablemente algunas personas con HCM, estos datos no se encuentran enriquecidos con individuos con la enfermedad. Se encontraron 192 variantes por mutaciones con cambio de sentido únicas (en 474 pacientes con variantes MYH7) en la cohorte HCM y 421 variantes por mutaciones con cambio de sentido en la base de datos ExAC (Tabla S1). En ambos casos las variantes con cambio de sentido observadas eran muy raras, y la mayoría de ellas fue observada una sola vez (ver Fig. 1), consistente con los reportes previos de restricción dentro del gen MYH7 (6). Más aún, la gran mayoría de pacientes de SHaRe con alguna variante rara en MYH7 llevaba una sola de estas variantes (457/474 pacientes), mientras que 16 llevaban 2 variantes raras por mutaciones con cambio de sentido y un único paciente portaba tres variantes diferentes.

fig1_stickPlot_wSFS_revised-01

Fig. 1. Diferencias en la posición  de las variantes por mutaciones con cambio de sentido entre las cohortes poblaciones de HCM y referencia en la β-miosina cardíaca humana. 

Las variantes tanto de la enfermedad (SHaRe) como las de la población/referencia (ExAC) se encuentran distribuidos de manera no uniforme a lo largo del gen, y encontramos una diferencia significativa en la distribución lineal de las variantes raras en estas cohortes (KS p= 5,0×10-11, Fig. 1). Variantes de mutaciones con cambio de sentido asociadas a la enfermedad se encuentran concentradas en el dominio catalítico globular y en la hélice enrollada del dominio S2, consistente con resultados obtenidos previamente (4), pero en contraste con otras comparaciones recientes (10). Sin embargo, incluso dentro de estos dominios, la distribución de las variantes de la enfermedad y la población no son las mismas (KS p = 0,003). Además, las variantes de mutaciones con cambio de sentido en MYH7 tanto para las cohortes SHaRe como ExAC son extremadamente raras; la mayoría de ellas se observa solo una vez en ambas cohortes (Figura 1B-C). Estos resultados sugieren que la probabilidad de que las variantes MYH7 causen la enfermedad se debe en parte a su ubicación adentro del gen.

Ya que los motores moleculares actúan en el espacio tridimensional, buscamos un método para estudiar los patrones de tolerancia genética en la estructura plegada de la β-miosina cardíaca humana. Para ello usamos un modelaje de homología multi-plantilla de otras proteínas de miosina en los estados pre y post golpe de fuerza para construir modelos tridimensional de la β-miosina cardíaca humana que contiene las cadenas ligeras ventriculares humanas (Fig. 2 y Métodos). Estos modelos representan dos fases distintas del ciclo quimiomecánico de la miosina activada por actina. Incluimos cuatro regiones fundamentales del dominio motor de la miosina: sitio de unión a actina (Fig. 2, residuos aminoacídicos verdes), el bolsillo de unión al ATP (rojo), el dominio convertidor (azul) y la región de unión a la cadena ligera o el brazo palanca. En la fase pre golpe de fuerza, el convertidor se alinea con una superficie relativamente plana de la cabeza de la miosina, la cual ha sido descrita como la meseta de la miosina. Basado en su tamaño (>20 nm2), topología plana y el alto grado de conservación evolutiva, esta característica ha sido propuesta como un sitio de interacción de unión inter o intra molecular (16). Después de la producción de fuerza por la cabeza de miosina y el brazo palanca, el motor pasa al estado post golpe de fuerza (Fig. 2A) y el dominio meseta queda desalineado con el dominio convertidor.

fig2_models

Fig. 2. Modelos estructurales de la β-miosina cardíaca humana pre y post golpe de fuerza obtenidos por integración de los datos de estructuras cristalográficas resueltas en modelos homólogos. 

Para identificar las regiones estructurales tridimensionales de interés, aplicamos una versión modificada del test estadístico de escaneo espacial (17, 18) a los modelos de la β-miosina cardíaca S1 pre y post golpe de fuerza. Este estadístico busca regiones esféricas con un incremento en la proporción de variantes genéticas en la enfermedad comparada con las cohortes de referencia. Definimos las variantes raras por mutaciones con cambio sentido observadas en pacientes HCM en la cabeza de MYH7 como asociadas a la enfermedad (n=103), y cualquier variante vista solamente en la cohorte ExAC como variante de referencia (o población) (n=110). 22 variantes observadas tanto en SHaRe como en ExAC fueron clasificadas como asociadas a la enfermedad. En el modelo de la miosina previa al golpe de fuerza, encontramos un sorprendente aumento en la proporción de las variantes por mutaciones con cambio sentido asociadas a la enfermedad en la esfera de 15 Å centrada en el residuo aminoacídico 736 (p= 0,001) (Fig. 3A, Tabla S2). Esta región, que abarca el subconjunto del dominio convertidor, contiene 7 variantes por mutaciones con cambio de sentido observadas en la enfermedad y ninguna variante observada en los datos de referencia (Fig. 3C). Usando el modelo de la β-miosina cardíaca humana posterior al golpe de fuerza, nuevamente observamos un enriquecimiento de variantes asociadas a la enfermedad en la porción del dominio convertidor (p< 0,001) centrado en el residuo aminoacídico 733 (Fig. S1).

ps_sphereAnalysis_formatted

Fig. 3. La exploración estadística de escaneo espacial identifica una región esférica en el dominio convertidor con un incremento en la proporción de variantes asociadas a HCM. 

El enriquecimiento de las variantes asociadas a la enfermedad tanto para los estados pre como post al golpe de fuerza persisten cuando son incluidas solo variantes formalmente clasificadas como patogénicas o probablemente patogénicas (26 asociadas con la enfermedad de 103 en SHaRe; ver Texto suplementario). Pruebas de carga también pueden ser sensibles a las diferencias en las prevalencias de la enfermedad en la población o a las diferencias en las frecuencias de las variantes en la población. Para asegurar que nuestros resultados fueron robustos a estos posibles sesgos, se realizó el mismo análisis limitado por personas de ascendencia europea, la población más grande tanto para SHaRe como ExAC (2516 pacientes de un total de 2913 para SHaRe y 89 de las 103 variantes asociadas a la enfermedad; ver Texto suplementario). Identificamos regiones enriquecidas muy similares tanto en los modelos pre y post al golpe de fuerza, lo que indica que nuestro análisis no se ve afectado de forma significativa por la estratificación de la población. Sin embargo, grandes cohortes de otras poblaciones pueden ayudar a identificar otras regiones de la miosina enriquecidas con variaciones asociadas a la enfermedad.

Durante la contracción sistólica del corazón, el dominio convertidor sirve la función crítica de transducción de la fuerza al oscilar alrededor de 70º desde su posición previa al golpe de fuerza (Fig. 3B, el brazo de la palanca que se proyecta hacia el exterior). Se ha demostrado que variantes en el dominio convertidor alteran la intensidad de la potencia del músculo así como la cinética (19, 20), y se asocian con peores resultados en HCM (21, 22). Encontramos que el dominio convertidor es la única región esférica que se encuentra significativamente enriquecida con variantes de la enfermedad, en contraste con reportes previos que conjeturaban que había muchas regiones enriquecidas a lo largo de la cabeza de miosina (7-9) u otros que no encontraron regiones de enriquecimiento significativo (10). Aunque la ubicación en una región enriquecida no es una condición necesaria de la patología, nuevas variantes en regiones fuertemente enriquecidas con variantes de la enfermedad deben ser vistas con mayor sospecha. En regiones cercanas donde las variantes no tienen efectos similares, no habrá un enriquecimiento de variantes asociadas a la enfermedad. Nuestros datos proporcionan una línea complementaria de evidencia de que las variantes del dominio convertidor de la β-miosina cardíaca son muy poco toleradas y que los individuos portadores de variantes en esas regiones son propensos a desarrollar HCM.

Para replicar estos resultados, buscamos una fuente independiente de variación asociada a la enfermedad y a la genética de la población. Seleccionamos y organizamos publicaciones de centros médicos que no están afiliados con el registro SHaRe (Texto suplementario, tabla S3). Comparamos un conjunto de 231 variantes por mutaciones con cambio de sentido con 430 variantes por mutaciones con cambio de sentido que se encuentran en 42.930 exomas de individuos no seleccionados del Sistema de Salud Geisinger y secuenciados por el Centro de Genética Regeneron (cohorte DiscovEHR) (14) (Tabla S4). Las regiones del dominio convertidor identificadas tanto en el estado pre como post al golpe de fuerza para ambos conjuntos mostraron un enriquecimiento de variantes asociadas a la enfermedad en la réplica del conjunto de datos (pre golpe de fuerza = 0,079, post golpe de fuerza p=4,1×10-4).

Se ha sugerido que las regiones superficiales β-miosina cardíaca son dominios funcionales importantes implicados en HCM (16). Hemos ampliado nuestro análisis para analizar regiones de la superficie β-miosina cardíaca y buscar regiones enriquecidas con variantes asociadas a HCM. En primer lugar definimos los aminoácidos expuestos a la superficie por su accesibilidad a la sonda esférica con un radio de 2,5 Å (el tamaño aproximado de una cadena lateral de aminoácido) y aproximamos la distancia a la superficie entre dos residuos aminoacídicos (23) (ver Texto suplementario). Como era de esperar, las distancias en la superficie tienden a ser más cortas entre aminoácidos cercanos en la secuencia primaria (Fig. S2B, diagonal). Además, había muchas regiones donde los aminoácidos distantes en la secuencia primaria estaban juntos en la superficie de la β-miosina cardíaca (como los residuos aminoacídicos 110 y 684).

La superficie de la β-miosina cardíaca contiene 568 de los 765 residuos aminoacídicos en el dominio S1 (74%). De estos, 71 están asociados con HCM (72% de todas las variantes HCM) y 79 fueron encontrados en la población ExAC (71% de todas las variantes de referencia), sugiriendo que las variantes en ambas cohortes están distribuidas de manera pareja entre la superficie y el núcleo de la proteína (chi cuadrado = 0,51). A continuación aplicamos nuestro test estadístico de escaneo espacial a la superficie de β-miosina cardíaca. Utilizando el modelo de miosina previo al golpe de fuerza, identificamos una región de la superficie que cubre 277 de los 568 residuos aminoacídicos de la superficie (p= 0,002, Fig. 4A, B), incluyendo el dominio convertidor y meseta, la cual está altamente enriquecida con variantes asociadas a la enfermedad. Sorprendentemente, la región contiene en la superficie 52 de las 71 variantes de por mutaciones con cambio de sentido asociadas a HCM, y solo 27 de las 79 variantes por mutaciones con cambio de sentido que no están asociadas a la enfermedad (Fig. 4D), mientras que el resto de la superficie de miosina (Fig. 4C) cubre 291 residuos aminoacídicos y contiene solo 19 variantes asociadas con la enfermedad en comparación con 52 variantes no asociadas a la enfermedad (Fig. 4D). La región identificada convertidor/meseta también estaba enriquecida en las replicas (p= 4,3×10-5).

Print

Fig. 4. El análisis de exploración espacial de superficie identifica una región de mayor superficie enriquecida para variaciones por mutaciones con cambio de sentido asociadas a HCM. 

Usando el mismo procedimiento para buscar regiones en la superficie de la estructura de la miosina post golpe de fuerza, detectamos una región enriquecida más pequeña con 122 residuos aminoacídicos que nuevamente cubren el convertidor pero con una reducción en la porción de la meseta de la miosina (Fig. S3) un dominio que se ha propuesto como sitio de unión para otro elemento estructural de la proteína (16). Durante el golpe de fuerza de la miosina, el convertidor se aleja de la meseta (comparar la Fig. 2A y Fig. 2B, y la Fig. 4 y la Fig. 3S), de manera que la región del convertidor/meseta ya no es contigua y no se encuentra disponible para interacciones intra o intermoleculares en el estado post golpe de fuerza (Fig. 2B, Fig. 4A, B). Los residuos aminoacídicos enriquecidos en el modelo post golpe de fuerza se mueven significativamente más en el espacio tridimensional entre los modelos pre y post al golpe de fuerza (Wilcoxon p < 2 x 10-16) que otros residuos aminoacídicos en la superficie de la proteína. Esto sugiere que los cambios conformacionales de la miosina durante el ciclo quimiomecánico activado por actina podrían ser importantes no solamente en la transducción de la fuerza sino también en la modulación del tamaño y la forma de esta región de la superficie, alterando así la disponibilidad de unión con otros elementos estructurales de proteínas. La importancia funcional de la región convertidora y la meseta es también apoyada por la presencia de sitios de unión a omecamtiv mecarbil, descrito recientemente como una pequeña molécula moduladora de la miosina cardíaca usada actualmente en ensayos clínicos como tratamiento a la insuficiencia cardíaca (24, 25).

A continuación evaluamos la existencia de regiones del fragmento S2 de miosina enriquecidas con variantes asociadas a la enfermedad. El análisis de escaneo espacial reveló que la primera mitad del fragmento S2 está enriquecida con variantes asociadas a la enfermedad (p= 0,003, Fig. S4). Se ha mostrado que esa parte proximal de S2 se une al extremo amino terminal de la proteína C de unión a miosina (MyBP-C) (26), una proteína del sarcómero que también esta frecuentemente mutada en pacientes con HCM (27). El enriquecimiento de las variantes asociadas a la enfermedad en esta región sugiere que la unión entre la miosina S2, MyBP-C (y potencialmente otros asociados) es importante para el desarrollo de HCM.

Para estudiar con mayor profundidad la contribución a la enfermedad de las regiones restringidas genéticamente, comparamos las características clínicas de los pacientes con variantes en estas regiones con las de los pacientes con variantes en cualquier otro lugar de MYH7. El perfil clínico de HCM es altamente variable, con algunos pacientes que llevan una vida normal con síntomas mínimos y otros que mueren repentinamente o que requieren un trasplante cardíaco a una edad muy temprana (28). Del mismo modo, la aparición de la enfermedad según la edad varía ampliamente entre pacientes con HCM, estando un inicio temprano de la enfermedad correlacionado con un fenotipo más severo (29). Encontramos que pacientes con HCM con una variante adentro de la región esférica enriquecida son 11,2 años más jóvenes al momento del diagnóstico (24.9 (s.e. 1.0) vs. 36.1 (s.e. 1.2) años de edad, p = 5.6 x 10-5) (Fig. 5A-B) que los pacientes que poseen otras variantes en la cabeza de la miosina. La presencia de las regiones enriquecidas con variantes HCM en la superficie está asociada con pacientes 10 años más jóvenes al momento del diagnóstico (edad 31.5 (s.e. 2.4) vs. edad 41.5 (s.e. 2.6), p = 1.6 x 10-4) que aquellos con otras variantes en la superficie (Fig. 5C-D). Además, encontramos un incremento en el riesgo para los resultados clínicos en las regiones enriquecidas de la superficie después de ajustar las diferencia en la edad al momento del diagnóstico (HR = 1.918, p=0.023), aunque no así en la región enriquecida esférica (Fig. S5, ver Texto suplementario). Estos hallazgos demuestran que el análisis de las restricciones genéticas en el espacio de las proteínas puede revelar dominios que tengan incrementos tanto en la carga de la enfermedad como en la patogenicidad.

fig5_PD_Age-01

Fig. 5. Comparación de los fenotipos clínicos entre las regiones enriquecidas y otras regiones de la β-miosina cardíaca. 

Nuestro estudio demuestra el poder de la integración de la información estructural detallada con grandes bases de datos clínicas y genéticas para identificar regiones asociadas con importancia funcional y gravedad de la enfermedad en las enfermedades Mendelianas. Encontramos un enriquecimiento de variantes asociadas a HCM en el dominio convertidor de la β-miosina cardíaca, donde conducen a resultados más severos. Proporcionamos la primera evidencia (de la que tengamos conocimiento) de que un agrupamiento y patogenicidad similar estén presentes en una superficie que abarca el dominio convertidor y la superficie relativamente plana del dominio catalítico de la miosina llamado meseta de la miosina (16). Debido a que los residuos aminoacídicos que forman la meseta proceden de lugares diferentes en la secuencia nucleotídica, el descubrimiento de esta región depende de la integración de la información estructural de la proteína. El desplazamiento pronunciado en la superficie de la meseta–convertidor durante el golpe de fuerza plantea la hipótesis mecánica de que estas variantes ejercen un efecto perjudicial selectivamente en la fase previa al golpe de fuerza, tal vez mediante la interrupción de las interacciones dinámicas de unión. En resumen, estos resultados resaltan la importancia de considerar los datos de genética humana en el contexto de la estructura dinámica tridimensional de la proteína, e ilustran un nuevo enfoque para el análisis de la estructura–función en enfermedades genéticas.

Materiales y Métodos

Base de datos SHaRe

El Registro de Miocardiopatía Sarcoméricas Humanas (SHaRe por sus siglas en ingles), es una base de datos multicéntrica que contiene un fondo común de datos, no identificables a nivel del paciente, de la información suministrada por instituciones participantes. Al momento del análisis, el registro contenía datos de pruebas clínicas y genéticas de 2.913 pacientes con HCM, de los cuales 514 se encuentran dentro de las variantes MYH7. Esta base de datos contiene individuos de 9 centros de enfermedades hereditarias en todo el mundo e incluye datos demográficos, historia médica, datos de ecocardiograma, resultados de pruebas genéticas, y muchos otros datos relacionados con la salud cardíaca y resultados clínicos.

ExAC

El Exome Aggregation Consortium (13) dio a conocer los datos de 60.706 exomas de múltiples cohortes secuenciales que no están enriquecidas en enfermedades raras como HCM. Nosotros hemos descargado los datos desde ExAC de la transcripción normal de MYH7 ENST00000355349 el 27 de agosto del 2015.

Filtrado de variantes y criterios de inclusión

Las variantes MYH7 de la base de datos SHaRe fueron filtradas con el propósito de garantizar la calidad. Solo las variantes exónicas de MYH7 con mutaciones con cambio de sentido fueron incluidas en el análisis. Se incluyeron todas las variantes exónicas con mutaciones con cambio de sentido observadas en pacientes HCM durante las pruebas genéticas clínicas. A modo de comparación, hemos descargado los datos del gen MYH7 de Exome Aggregation Consortium (ExAC ) el 27 de agosto de 2015.

Para los análisis de exploración espacial y de superficie, las variantes fueron consideradas en una de las dos categorías: asociadas a la enfermedad y referencia. Cualquier variante rara con mutaciones con cambio de sentido identificada en pacientes HCM en SHaRe fue considerada asociada a la enfermedad, sin importar su presencia en la población ExAC. Las variantes raras con mutaciones con cambio de sentido identificadas en ExAC fueron clasificadas como no asociadas a la enfermedad o referencia. Cualquier variante identificada tanto en la cohorte ExAC como SHaRe fue considerada como asociada a la enfermedad. Dentro de la cabeza S1 de MYH7, identificamos 103 variantes asociadas a la enfermedad (vistas en SHaRe) y 110 referencias (o variantes poblacionales) encontradas solo en ExAC. Identificamos 22 variantes observadas tanto en SHaRe como ExAC y fueron clasificadas como asociadas a la enfermedad.

Las pruebas de enriquecimiento fueron realizadas mediante la búsqueda de regiones en la proteína de miosina que tuvieran una proporción significativamente mayor de variantes asociadas a la enfermedad que de variantes no asociadas. Es probable que la población ExAC contenga algunos individuos con miocardiopatía hipertrófica inducida por cambios en MYH7, por lo tanto no podemos suponer que las variantes identificadas en ExAC no sean patogénicas. Por ejemplo, hay varios individuos portadores de una variante patogénica reportada para HCM en el gen MYBPC3, p.Arg502Trp, en la cohorte ExAC. Sin embargo, no se espera que la incidencia de miocardiopatías en ExAC sea mayor que la incidencia en la población general. Una gran proporción de las variantes raras en MYH7 identificadas en ExAC probablemente no estén asociadas con miocardiopatías. Por el contrario, las variantes raras identificadas en SHaRe para pacientes HCM probablemente estén enriquecidas con variantes causantes de la enfermedad.

Calculamos la máxima frecuencia alélica específica de la población para cada variante en ExAC como la frecuencia máxima de la variante en cualquiera de las poblaciones ExAC (excluyendo a Finlandia). Con la finalidad de comparar la carga genética de las variantes dentro de cada cohorte, hemos eliminado de ambos conjuntos de datos (SHaRe y ExAC) cualquier alelo con una frecuencia alélica específica de la población mayor a 1/2000. Esto eliminó 16 variantes en MYH7 de nuestra lista ExAC (de un total de 421), 6 de los cuales también fueron reportados en SHaRe (de un total de 192). Dentro de la cabeza de MYH7, solo 4 variantes ExAC se encontraron con una frecuencia mayor que 1/2000 (de un total de 136), 2 de las cuales también fueron identificadas en SHaRe (de un total de 105).

Para fines de validación, también se realizó un subconjunto de análisis que incluía las variantes clasificadas como “patogénicas” o “probablemente patogénicas” de acuerdo con las pautas de la American College of Medical Genetics and Genomics ACMG (30), aunque excluyen variantes de significado desconocido, benigno y probablemente benigno (ver Texto suplementario). También se realizó una validación usando variantes encontradas en individuos con ancestros europeos en ExAC e individuos reportados como de raza blanca, con la finalidad de asegurar que la estructura global de la población no estaba confundiendo nuestro análisis (ver Texto suplementario).

Generamos un conjunto de datos de validación independiente combinando análisis publicados previamente para variantes HCM de otros centros médicos con 42.930 exomas del proyecto de secuenciación DiscovEHR (14). Incluimos solo mutaciones con cambio de sentido y quitamos variantes con una frecuencia alélica mayor que 1/2000 en los exomas de DiscovEHR (ver Texto suplementario).

Desarrollo de modelos de proteínas de β-miosina cardíaca humana

En base a los datos estructurales conocidos del dominio motor, desarrollamos modelos de la β-miosina cardíaca humana S1. Recuperamos la secuencia proteica de la β-miosina cardíaca y las cadenas ligeras de la base de datos UNIPROT (31): cadena pesada del dominio motor de la miosina (MYH7) – P12883, cadena ligera esencial de miosina (MLC1) – P08590, y la cadena ligera reguladora de miosina (MLC2) – P10916. Se utilizó un enfoque de modelaje múltiple de homologías para construir las coordenadas estructurales de MYH7 (1-840 residuos aminoacídicos), MLC1 (1-195 residuos aminoacídicos. MLC2 (1-166 residuos aminoacídicos) y S2 (841-1280 residuos aminoacídicos). Obtuvimos el modelo estructural tridimensional de S1 para antes y después del golpe de fuerza mediante la integración de los datos estructurales conocidos obtenidos por cristalografía de proteínas (detalles en Texto suplementario). El modelaje por homología de la estructura previo al golpe de fuerza fue realizado usando como plantilla el dominio motor de la miosina del músculo liso (32) (AP id: 1BR1; conMgADP.A1F4 unido a sitio activo, el cual se cree que es el que mejor imita el estado de unión a ADP.Pi o estado previo al golpe de fuerza de la miosina) y el dominio de cadena ligera de miosina del músculo liso de la vieira (33) (id AP: 3TS5). Las plantillas usada para el modelo de la estructura post golpe de fuerza fueron obtenidos a partir del dominio motor de la β-miosina cardíaca humana (34) (PDB id: 4P7H sin nucleótidos en el sitio activo) y la estructura del dominio motor de la miosina del calamar (35) (PDB id: 3I5G; sin nucleótidos en el sitio activo). El modelaje se realizó utilizando el paquete MODELLER (36). Las visualizaciones se realizaron utilizando la versión 1.7.4 de PyMOL (www.pymol.org).

Métodos estadísticos

Las comparaciones entre las ubicaciones variantes de ExAC y SHaRe en MYH7 fueron realizadas mediante la prueba estadística Kolmogorov-Smirnov. Todos los análisis estadísticos fueron realizados en R versión 3.1.2 (37) y muchos de los gráficos se realizaron utilizando ggplot2 (38).

Estadística de escaneo espacial

Para el análisis de escaneo espacial comparamos las ubicaciones de variantes únicas asociadas a HCM con las ubicaciones de las variantes de referencia. La Estadística de Escaneo Espacial busca exhaustivamente ventanas tridimensionales de un conjunto predefinido de tamaño y formas a lo largo de la molécula de β-miosina cardíaca humana para ubicar regiones con incrementos en la proporción de variantes asociadas a HCM. El análisis identifica las regiones tridimensionales de la proteína con la mayor razón binomial de verosimilitud para el enriquecimiento de variantes asociadas a HCM (17, 18) (ver Texto suplementario). El test estadístico del cociente binomial máximo para un conjunto de ventanas en el modelo fue calculado y la significancia se evaluó a través de la permutación rótulos de variantes usando 1000 permutaciones. Para la validación, realizamos el análisis anterior eliminando todas las variantes de mutaciones con cambio de sentido clasificadas como Variantes con Significado Desconocido, usando solo las mutaciones con cambio de sentido observadas en los individuos europeos (ver Texto Suplementario)

Análisis de superficie

Además de las ventanas esféricas tridimensionales definidas anteriormente, ] definimos ventanas basadas en la superficie expuesta de la molécula β-miosina cardíaca humana. Para este análisis, nosotros estimamos la distancia superficial entre dos aminoácidos cualesquiera basados en la superficie de exclusión de solvente calculado por el programa MSMS (23) (ver Texto suplementario). Sobre la base de este conjunto de distancias calculadas, definimos regiones superficiales planas de la β-miosina cardíaca para el análisis como todos los aminoácidos dentro de una cierta distancia de un dado aminoacídico “centro”. Excluimos todos aquellos aminoácidos que no fueran de superficie basados en su profundidad. Un vez más realizamos la exploración estadística espacial descrita anteriormente para identificar regiones con un incremento en la carga genética.

Análisis de fragmentos S2

Se realizó el test de exploración espacial estadística como se describió anteriormente para evaluar el enriquecimiento en el fragmento S2 de la miosina, incluyendo la región entre los aminoácidos 838 y 1112 (ver Texto suplementario)

Análisis del fenotípico clínico

Para el análisis de la edad de diagnosis solo fueron incluidos probandos conocidos (n= 260 cabeza de miosina, n= 201superficie de la miosina). Los pacientes con múltiples variantes de MYH7 fueron excluidos del análisis de la edad de diagnosis, debido a que la presencia de múltiples variantes es causante del inicio temprano de la enfermedad HCM. Comparamos las edades del diagnóstico primario utilizando el test Wilcoxon. El resultado combinado global combinó los resultados de las arritmias e insuficiencias cardíacas así como también de la fibrilación auricular, accidente cerebro vascular y muerte por cualquier causa (ver Texto suplementario). Los individuos fueron considerados para entrar en el estudio a la edad de su diagnóstico y su última edad conocida fue censurada. Comparamos las proporciones de riesgo para cada región usando el modelo de los riesgos proporcionales de Cox ajustado por género.

Agradecimientos

Queremos agradecer a los investigadores y participantes en el registro SHaRe por su apoyo en este proyecto. También queremos agradecer al Jonathan Fox por su orientación durante los primeros inicios del registro de SHaRe. J.R.H es apoyado por la beca Stanford Graduate. R.E.T es apoyado por la subvención NIH F32 HL123247. Este trabajo fue apoyado por las subvenciones de NIH U01HG007436 (a C.D.B.), 1U01HG007708 (a E.A.A.), and U01HG006382 (a R.P.R.M.), y una subvención de SAP (a C.D.B.).
Referencias

  1. Krendel M, Mooseker MS (2005) Myosins: tails (and heads) of functional diversity. Physiology 20:239–251.
  2. Maron BJ, et al. (1995) Prevalence of Hypertrophic Cardiomyopathy in a General Population of Young Adults : Echocardiographic Analysis of 4111 Subjects in the CARDIA Study. Circulation 92(4):785–789.
  3. Maron BJ, Casey SA, Hauser RG, Aeppli DM (2003) Clinical course of hypertrophic cardiomyopathy with survival to advanced age. J Am Coll Cardiol 42(5):882–888.
  4. Walsh R, Rutland C, Thomas R, Loughna S (2010) Cardiomyopathy: a systematic review of disease-causing mutations in myosin heavy chain 7 and their phenotypic manifestations. Cardiology 115(1):49–60.
  5. Jellis CL, Desai MY (2015) Hypertrophic cardiomyopathy: still connecting the dots between genotype and phenotype. Cardiovasc Diagn Ther 5(2):156–159.
  6. Pan S, et al. (2012) Cardiac Structural and Sarcomere Genes Associated with Cardiomyopathy Exhibit Marked Intolerance of Genetic Variation. Circ Cardiovasc Genet:602–610.
  7. Moore JR, Leinwand L, Warshaw DM (2012) Understanding cardiomyopathy phenotypes based on the functional impact of mutations in the myosin motor. Circ Res 111(3):375–385.
  8. Buvoli M, Hamady M, Leinwand LA, Knight R (2008) Bioinformatics assessment of beta-myosin mutations reveals myosin’s high sensitivity to mutations. Trends Cardiovasc Med 18(4):141–149.
  9. Rayment I, Holden HM, Sellers JR, Fananapazir L, Epstein ND (1995) Structural interpretation of the mutations in the beta-cardiac myosin that have been implicated in familial hypertrophic cardiomyopathy. Proceedings of the National Academy of Sciences 92(9):3864–3868.
  10. Kapplinger JD, et al. (2014) Distinguishing hypertrophic cardiomyopathy-associated mutations from background genetic noise. J Cardiovasc Transl Res 7(3):347–361.
  11. Minikel EV, et al. (2016) Quantifying prion disease penetrance using large population control cohorts. Sci Transl Med 8(322):322ra9–322ra9.
  12. Golbus JR, et al. (2012) Population-based variation in cardiomyopathy genes. Circ Cardiovasc Genet 5(4):391–399.
  13. Lek M, et al. (2015) Analysis of protein-coding genetic variation in 60,706 humans. bioRxiv. doi:10.1101/030338.
  14. Dewey FE, et al. (2016) Inactivating Variants in ANGPTL4 and Risk of Coronary Artery Disease. N Engl J Med. doi:10.1056/NEJMoa1510926.
  15. Examining Prevailing Genotype-Phenotype Correlations in Hypertrophic Cardiomyopathy: Findings From The Sarcomeric Human Cardiomyopathy Registry (SHaRe) (2015) Circulation 132:2267–2285.
  16. Spudich JA (2015) The myosin mesa and a possible unifying hypothesis for the molecular basis of human hypertrophic cardiomyopathy. Biochemical Society Transactions 43:64–72.
  17. Kulldorff M, Martin K (1997) A spatial scan statistic. Communications in Statistics – Theory and Methods 26(6):1481–1496.
  18. Ionita-Laza I, Makarov V, ARRA Autism Sequencing Consortium, Buxbaum JD (2012) Scan-statistic approach identifies clusters of rare disease variants in LRP2, a gene linked and associated with autism spectrum disorders, in three datasets. Am J Hum Genet 90(6):1002–1013.
  19. Seebohm B, et al. (2009) Cardiomyopathy mutations reveal variable region of myosin converter as major element of cross-bridge compliance. Biophys J 97(3):806–824.
  20. Köhler J, et al. (2002) Mutation of the myosin converter domain alters cross-bridge elasticity. Proc Natl Acad Sci U S A 99(6):3557–3562.
  21. Garcia-Giustiniani D, et al. (2015) Phenotype and prognostic correlations of the converter region mutations affecting the myosin heavy chain. Heart 101(13):1047–1053.
  22. Woo A (2003) Mutations of the myosin heavy chain gene in hypertrophic cardiomyopathy: critical functional sites determine prognosis. Heart 89(10):1179–1185.
  23. Sanner MF, Olson AJ, Spehner JC (1996) Reduced surface: an efficient way to compute molecular surfaces. Biopolymers 38(3):305–320.
  24. Malik FI, et al. (2011) Cardiac myosin activation: a potential therapeutic approach for systolic heart failure. Science 331(6023):1439–1443.
  25. Winkelmann DA, Forgacs E, Miller MT, Stock AM (2015) Structural basis for drug-induced allosteric changes to human β-cardiac myosin motor activity. Nat Commun 6:7974.
  26. Starr R, Offer G (1978) The interaction of C-protein with heavy meromyosin and subfragment-2. Biochem J 171(3):813–816.
  27. Alfares AA, et al. (2015) Results of clinical genetic testing of 2 , 912 probands with hypertrophic cardiomyopathy : expanded panels offer limited additional sensitivity. (January). doi:10.1038/gim.2014.205.
  28. Maron BJ, et al. (1999) Clinical Course of Hypertrophic Cardiomyopathy in a Regional United States Cohort. JAMA 281(7):650.
  29. Maron BJ, et al. (2015) Hypertrophic Cardiomyopathy in Children, Adolescents and Young Adults Associated With Low Cardiovascular Mortality With Contemporary Management Strategies. Circulation. doi:10.1161/CIRCULATIONAHA.115.017633.
  30. Richards S, et al. (2015) Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med 17(5):405–424.
  31. UniProt Consortium (2013) Update on activities at the Universal Protein Resource (UniProt) in 2013. Nucleic Acids Res 41(Database issue):D43–7.
  32. Dominguez R, Freyzon Y, Trybus KM, Cohen C (1998) Crystal structure of a vertebrate smooth muscle myosin motor domain and its complex with the essential light chain: visualization of the pre-power stroke state. Cell 94(5):559–571.
  33. Kumar VSS, et al. (2011) Crystal structure of a phosphorylated light chain domain of scallop smooth-muscle myosin. Biophys J 101(9):2185–2189.
  34. Winkelmann DA, Miller MT, Stock AM, Liu L (2011) Structure of Human beta-Cardiac Myosin Motor Domain at 3.2 A. Mol Biol Cell:4705.
  35. Yang Y, et al. (2007) Rigor-like structures from muscle myosins reveal key mechanical elements in the transduction pathways of this allosteric motor. Structure 15(5):553–564.
  36. Sali A, Blundell TL (1993) Comparative protein modelling by satisfaction of spatial restraints. J Mol Biol 234(3):779–815.
  37. R Core Team (2014) R: A Language and Environment for Statistical Computing Available at: http://www.R-project.org/.
  38. Wickham H (2009) ggplot2: Elegant Graphics for Data Analysis (Springer Science & Business Media).
  39. Fiser A, Sali A (2003) ModLoop: automated modeling of loops in protein structures. Bioinformatics 19(18):2500–2501.
  40. Yang J, et al. (2015) The I-TASSER Suite: protein structure and function prediction. Nat Methods 12(1):7–8.
  41. Lovell SC, et al. (2003) Structure validation by Cα geometry: ϕ,ψ and Cβ deviation. Proteins: Struct Funct Bioinf 50(3):437–450.
  42. Syamaladevi DP, et al. (2012) Myosinome: a database of myosins from select eukaryotic genomes to facilitate analysis of sequence-structure-function relationships. Bioinform Biol Insights 6:247–254.
  43. Bos JM, et al. (2014) Characterization of a phenotype-based genetic test prediction score for unrelated patients with hypertrophic cardiomyopathy. Mayo Clin Proc 89(6):727–737.
  44. Ingles J, et al. (2005) Compound and double mutations in patients with hypertrophic cardiomyopathy: implications for genetic testing and counselling. J Med Genet 42(10):e59.
  45. Kubo T, et al. (2007) Prevalence, clinical significance, and genetic basis of hypertrophic cardiomyopathy with restrictive phenotype. J Am Coll Cardiol 49(25):2419–2426.
  46. Millat G, Gilles M, Valérie C, Hervé C, Robert R (2010) Development of a high resolution melting method for the detection of genetic variations in hypertrophic cardiomyopathy. Clin Chim Acta 411(23-24):1983–1991.
  47. Otsuka H, et al. (2012) Prevalence and distribution of sarcomeric gene mutations in Japanese patients with familial hypertrophic cardiomyopathy. Circ J 76(2):453–461.
  48. Roncarati R, et al. (2011) Unexpectedly low mutation rates in beta-myosin heavy chain and cardiac myosin binding protein genes in Italian patients with hypertrophic cardiomyopathy. J Cell Physiol 226(11):2894–2900.
  49. Richard P, et al. (2003) Hypertrophic cardiomyopathy: Distribution of disease genes, spectrum of mutations, and implications for a molecular diagnosis strategy. Circulation 107(17):2227–2232.
  50. Song L, et al. (2005) Mutations profile in Chinese patients with hypertrophic cardiomyopathy. Clin Chim Acta 351(1-2):209–216.
  51. Wang J, et al. (2014) Malignant effects of multiple rare variants in sarcomere genes on the prognosis of patients with hypertrophic cardiomyopathy. Eur J Heart Fail 16(9):950–957.
  52. Yu B, et al. (2005) Denaturing high performance liquid chromatography: high throughput mutation screening in familial hypertrophic cardiomyopathy and SNP genotyping in motor neurone disease. J Clin Pathol 58(5):479–485.

 

Leyendas de las figures

Fig. 1. Diferencias en la posición de las variantes por mutaciones con cambio de sentido entre las cohortes poblacionales de HCM y referencia en la β- miosina cardíaca humana. (A) Se muestran las variantes con cambio de sentido identificadas en pacientes HCM de SHaRe en rojo y aquellas identificadas en individuos de ExAC en azul. La altura de cada punto se compensa para la visibilidad. (B) Recuento de alelo menos común de las variantes con cambio de sentido de MYH7 observadas en probandos HCM de SHaRe. (C) Recuento del alelo menos común de las variantes con cambio de sentido de MYH7 en la base de datos ExAC. No se muestran 15 variantes con cambio de sentido con una frecuencia menor a 0,005.

Fig. 2. Modelos estructurales de la β-miosina cardíaca humana pre y post golpe de fuerza obtenidos por integración de los datos de estructuras cristalográficas resueltas en modelos homólogos. (A) vista lateral de la miosina S1, con meseta relativamente plana en la parte superior, en el estado post golpe de fuerza con los dominios funcionales importantes destacados: el sitio de unión a actina (residuo aminoacídico color verde), bolsillo de unión a ATP (rojo), el convertidor (azul), y la región de unión a la cadena ligera o brazo palanca. El convertidor y su brazo palanca asociado se encuentran por detrás del plano de la figura y por debajo de la meseta. (B) La miosina S1 en el estado pre golpe de fuerza. Pequeños cambios dentro de la región de la cabeza globular con ADP y Pi en el bolsillo de nucleótido resultan en una gran rotación de 70º del convertidor y del brazo palanca. El convertidor se mueve hacia adelante y hacia arriba en comparación con la estructura post al golpe de fuerza, y el brazo de la palanca se proyecta hacia delante, fuera del plano de la imagen. La distancia recorrida por el extremo C-terminal del brazo de palanca es de ~10 nm, el tamaño del golpe del motor.

Fig. 3. La exploración estadística de escaneo espacial identifica una región esférica en el dominio convertidor con un incremento en la proporción de variantes asociadas a HCM. (A) La misma vista lateral del motor S1 previo al golpe de fuerza, como se muestra en la Figura 1B, sin las cadenas ligeras unidas a la región de unión de la cadena ligera α- hélice de S1. Los residuos aminoacídicos color naranja definen una esfera de residuos en el dominio motor que es la única región significativamente enriquecida con las variantes de HCM. Los residuos aminoacídicos de S1 fueron coloreados como se describen a continuación: naranja – región enriquecida con variantes para HCM, azul – variantes por mutaciones con cambio de sentido vistas solo en ExAC, rojo – variantes por mutaciones con cambio de sentido vistas solo en SHaRe, gris claro – otros residuos aminoacídicos. (B) Región enriquecida en el modelo de miosina previo al golpe de fuerza, desde una perspectiva diferente. La vista es directamente hacia abajo sobre la superficie. Los colores son los mismos que en (A). (C) El número de variantes de HCM (SHaRe) y las variantes no asociadas a la enfermedad (ExAC) identificadas en la región esférica enriquecida (izquierda) y en la suma de todas las partes de la miosina (derecha).

Fig. 4. El análisis de exploración espacial de superficie identifica una región de mayor superficie enriquecida para variaciones por mutaciones con cambio de sentido asociadas a HCM. (A) Una visión similar al modelo previo al golpe de fuerza de la Figura 2B, mirando directamente hacia abajo sobre la meseta. Los residuos aminoacídicos fueron coloreados como se describe a continuación: naranja – región de la superficie enriquecida para variantes de HCM, azul variantes por mutaciones con cambio de sentido vistas solo en ExAC, rojo – variantes por mutaciones con cambio de sentido vistas en SHaRe, gris claro –residuos aminoacídicos que se consideran de la superficie, gris oscuro – residuos aminoacídicos que se consideran que no deberían estar en la superficie. La región de la superficie enriquecida en HCM cubre toda la meseta más el dominio convertidor contiguo. (B) La misma vista lateral del modelo previo al golpe de fuerza del dominio motor S1 como se muestra en la Figura 1 y 2A. (C) Vista del modelo previo al golpe de fuerza vista desde el lado opuesto de la meseta. Esta superficie no está enriquecida por variantes HCM. (D) El número de variantes HCM (SHaRe) y de variantes no asociadas a la enfermedad (ExAC) identificadas en la región de la superficie (izquierda) y la suma de todas las demás partes de la superficie de la miosina (derecha).

Fig. 5. Comparación de los fenotipos clínicos entre las regiones enriquecidas y otras regiones de la β-miosina cardíaca. (A) Edad de diagnosis de los pacientes con variantes de HCM enriquecidas en la región esférica del convertido (naranja, n=45) en comparación con otras partes de la cabeza de la miosina (azul, n=201), Wilcoxon p = 6,7 x 10-5. Las gráficas muestran las medianas flanqueadas por el rango intercuartílico (IQR), con los bigotes que se extienden 1,5 veces del rango IQR. (B) Las curvas Kaplan–Meier de edad al momento del diagnóstico comparadas entre variantes HCM en la región esférica enriquecida del convertidor (naranja) y pacientes con variantes en otras partes de la cabeza de miosina (azul). El sombreado indica los intervalos de confianza del 95% para la curva de supervivencia. (C) Edad de diagnosis de pacientes con variantes HCM en la región enriquecida de la superficie (naranja, n=145) en comparación con otras partes de la cabeza de la miosina (azul, n=46), Wilcoxon p = 1.6 x 10-4. Las gráficas muestran y el IQR, con bigotes que se extienden 1,5 veces el rango IQR. (B) Las curvas Kaplan–Meier de edad al momento del diagnóstico se comparadas entre variantes HCM en la región enriquecida de la superficie (naranja) con la de pacientes con variantes en otras partes de la superficie de la cabeza de miosina (azul). El sombreado indica los intervalos de confianza del 95% para la curva de supervivencia.