Gene Cag_1026 details

Gene Information       Plasmid Coverage information       Fosmid Coverage information       Sequence       

Gene Information

Locus tagCag_1026 
Symbol 
ID3746754 
TypeCDS 
Is gene splicedNo 
Is pseudo geneNo 
Organism nameChlorobium chlorochromatii CaD3 
KingdomBacteria 
Replicon accessionNC_007514 
Strand
Start bp1381847 
End bp1394986 
Gene Length13140 bp 
Protein Length4379 aa 
Translation table11 
GC content46% 
IMG OID637773555 
ProductC-type lectin 
Protein accessionYP_379331 
Protein GI78188993 
COG category 
COG ID 
TIGRFAM ID[TIGR01435] glutamate--cysteine ligase/gamma-glutamylcysteine synthetase, Streptococcus agalactiae type 


Plasmid Coverage information

Num covering plasmid clones
Plasmid unclonability p-value
Plasmid hitchhikingNo 
Plasmid clonabilitynormal 
 

Fosmid Coverage information

Num covering fosmid clonesn/a 
Fosmid unclonability p-valuen/a 
Fosmid Hitchhikern/a 
Fosmid clonabilityn/a 
 

Sequence

Gene sequence
ATGTCTATAA TTCAAGAGCA TGAGTCAAAC GATCTTATTG CCAACGCAAC CTCTTTAACG 
CTTGTTGCAG AATCGCTTGG TAGCACAACA AGTGTAGCTG ATGGCGTTGG TACACAGTCA
AATCCAACAC AATACAACTC GTGGAGCGAT CCCGATTATT GGCGTATTGA GTTGCTTGCA
GGCTATCAAA TCTCTTTTTC CATTCTTACT CCTTCAAGTT CCTTACAGCC TTATGCCGAG
CTACGTGATG CGGCAAATAA TACTGTAGCG TATGCAACGG CTGACGCGTC GGGTGAATCG
GTGCATTTAG TGCCTTACAC TCTAACGGCA AGCGGTTCCT ACTATGTGGT GGTTGGTAAG
AATTATTATA CCAGCGATGG TGGTGATTAT GAATTGCATG TGGAAACAGC CCCCTTTATA
AAACCAGAAG ATGATGACAA CAACACTATT GATAAAGCGA CTGAGCTTGT ATTAAGCGAA
AATCCAGCCA GCAGTGGTTT GCTGCTTGGG GTTGGTATGG GTGAGCAAGA TCCAGCAACT
ATGTACAATC ATTGGAGTGA TCCCGATTAT TGGCGCATTG AAGTGTTAGC GGGCGATCTT
GTCTCCATTA CCGTGCAAAC CCCCGATAGT GAGCTTAACC CTTATGTTGA ATTGCGTAAT
GCGGCTGATG GAAATTTAGT TGGCAGTAAC GACGAAGGCG CTGGTAACGA TGCTTTTATT
AGCTCTTATG AGATTAAGGA TAGTGGCTCA TATTTTGTTT TGGTTGGTAA GGATTATTAC
AGCGGAGGTG GAACGTATAG TGTGCAGGTT GATGTGGCGC GTGGTATTCA GATGGAGAGC
GATGCTAATT ACGATAATGG AAACCTTACC CAAGCAAATG CGCTCCATTT ATCAGCCGAA
ATCACGAACA CTGATAGATA CCAAGTAGCG ACGGTTGCTG GTGCAATTAT GCTGCCTGAA
TACTTAACGG TTGATGTGGA TGTTTTTGCA CTTGGGCGAC TGAATGCCGA AAACACCGTT
GAACTCACCT CGTTGCTGCC ATCAACCAGC AATCTTACGC CGCTTGTTAC GCTGCTTGAT
AGCGCAGGAA ATGTTGTTAC CGATAGTGAT GGCAACAGTG CGGATGGCAA TTTTAGCGCC
ACATTAACGA AGGATGACGA CTATTACGTA CAAGTTGAAC GAGGCTATCA ATACAACGGG
CATACCTATC TGCTTACCAA TAATGGTATG AACTGGACAG CAGCACAAGA GTATGCTGAA
TCGCTTGGTG GGCATCTTGT AACCATTGAC GATGCAAGTG AACAGCAATG GCTTTTTTCG
CAGTTTGGTT CCACAAATTC ATGGATTGGA TTGAACGATG AAGTTACAGA GTCCATATGG
CAATGGGGTA ATGGGGCAAC CTCAACATAT CGTTATTGGG GCGATGGACA CCCTTATGGC
GGGGAGTATT ACAATTACGC TTATATCGCA ACGGATGGTA AATGGTATTC AGGTAATGAA
ACATGGGGGT ATTACGCTCT TATTGAAATT GAAAACACAG CTTCAGCCGC AAACTCAGCG
TCAAGTTCGA CCTCAAATTA TCTGCTTGAT GTTCGTATTG AGGATAGTGT AGCACCTCGC
GTTGAATCCA TAACGCTTCC TGCAAACGGA AGCAGCGTTG ATGATCCAAT TGGAGCAACG
ATTACGGTAA CCATGAGCGA AAAGCTTGAG CCTGCAACCG TGAAGGCTGG CTTGCGTGAA
GTGTGGGTGC GTGATGGACA TTACTACACG GTAACTGACG CTGCCGTGAG TTGGACGGAT
GCAAACACGG CAGCCACAGC GCTTGGTGGG CAGCTTGTCA ATATTGAGAG TGCCGAAGAG
CAAGCGTGGT TGCTCTCTAT GCTTGATGGG CGCTATGGCG ATGTGTGGCT TGGCTTGAGC
GATACTGCAA CAGAAGGCAC ATGGGTTTCG GCAAATGGTG AAACGGTGTG GGTTTATGGT
GCTGAAACGA ACAGTGCTTA CGCTAATTGG GGGGACTCGC AACCCTATTA TCAATGGGAT
GAGAATTACG ATTATGCTGC CATGAATGGT AGTGGTAAAT GGTATGCAAG CTATGGGAGC
AACGCCATGC GGGGTGTTAT TGAAATTGTT GACAATGATT CCGATAGTGA CGGTTTGTCC
GATGCACTTG ATCCTTATGA TAACGATCCG CTTAATGCGT GGGATTTACG TGAAGCTGGT
GCCGATGGCG TGTTCGATAC TCCTGATGAC GTTATTCATC GCCTCTTGTT AAAAGAGGCA
TACAATGGTG GTACAGCGGT TAATCTGCTG ATTGAAGATG GAACGTTAGG TGCTGGTTCG
TATCGTTTTA CCGCCAATAC AACGCTCACC GATATTGTTG GCAATGTGCT TGATGGCGAT
AGCGCGAAGA TTGGTAGTGA GCCATACGTG CACTATTTCA CCATTACCCA TCCTGCTGGT
GTTACCGCTG AAGGTGGACG TAACAATATT CTTCAAAATG CCACAACGCT TTCGCTAAAC
GAAGATCCTG CGGGCAAAGG GTTATGGCTG GCACATGGAG TGGGTAATCA AGACCCTGCA
ACTATTTACA ATCATTGGAG CGATCCCGAT TATTGGAAGC TTGAGTTGCA ACAAGGCGAT
CTTGTTTCGA TTTATGTGAA TACGCCCGAT AGTTCGCTTG ATGCGTATGT TGAATTACGT
AATGCCAATG ATGGCTATGT GGCATCAAGC AATGACGATG GAGCATCGAA CGATTCTTTT
ATCAGCCGTT ATGTGGTAAC CGAAAGCGGC ACCTATTATG TGCTGGTTGG TAAAGGGTAT
TATAGTGGTG GAGGTGCTTA CGAACTGCAA GTTGATGTAG CAAAGAGCAT TCAGATGGAA
AGTGATGCCA ATTACAGCAA TAATCCTCTT AGCGGTGCGA ATTTACTCTC CTTTGTAGCA
GATGGTAACA ATCAAGTAGC TACTGTTGCG GGTGCTATTA TGGAGTCGGA AGGTCAGCCT
GATATTGATG TGTATGCACT TGGGCGCTTT AATGCTGGTA ATACTATAAC GCTTACGGCA
AACCTTCCAT CAACAAGCGG GCTTTCCCCA ATTGTAACCT TGCTTGATGA AGCTGGTCAT
CTTCTGCTCG ATGCCGACGC TCATTATGCT GATGGCACCT GTACCATTAC GTTAGAAGAT
AACGGCAACT ACTACGCACA AGTTGAAAAA GGTTATCAGT ACAATGAATA CACCTACATT
GTAAGTAGCA CCACTATGAG TTGGGAGGCG GCTCATATTT ATGCTGATAT GATTGGTGGG
CATATTGTAA CCATTAACGA TGCTGATGAA CAGCAATGGT TAACCGAGCA ATTTGGTTGG
ACAAGTTCGT GGATTGGTAT GAATGATGCT GCGCTTGATG GAACGTGGGT GTGGGATGAT
GGCACAACGG TGGAGTACCA AAATTGGGGT TCAGGTCATC CTTACACTTG GAGTAATGAT
TATAACTATG GTTATCTCGC AACAGATGGT AAGTGGTACT CAAGTTATAA TGGTTACACG
TATCGTGCTC TTATTGAAAT TGAAATTCCT CATACTGCGG AGGCTTCAAC CAATTCGCTC
AATACAAGCT ACCTGCTTGA TGTTTCGATT GAGGATGATG TAGCGCCTCG TGTTGAATCT
ACTACGCTCC CCACCAATAA CAGCACTGTT GATAACCTTG TTGGAGCAAC CTTCTCGGTT
ACTATGAGCG AAAAGCTTGA TGCTGCAACA GTGAAAGCTG GCTTGCGTGA AGTGTGGGTT
CGTGATGGGC ATTACTACAC GGTAACTGAT GCTGCCATGA GCTGGCAGGA TGCTGCAATT
GCTGCACAAG CACTCGGTGG GCAGCTTGTC AATATTGAGA GTGCCGACGA GCAAGCGTGG
GTGCAATCCA TGCTGGATGG ACGGTACGGC GATGTATGGC TTGGCTTGAA CGATGCCGCA
ACGGAAAATA CGTGGGTTTC AGCCGATGGT AGCACCACAT GGATTTATGG AGCTGAAACG
AACAGTGCTT ATACCAATTG GGGTGATTCC CAACCCTATT ACCAATGGGA TGAGAATTAC
GATTATGCTG CCATGAATAG CAGCGGCAAG TGGTATGCCA CCTACAACAA TAGTTCCTAT
AACCTCATGC GTGGTGTTAT TGAAATTGTT GGTAGTGATT CCGATAACGA TGGAATGCCT
GACGCGCTTG ATCCTTATGA TAACGATTTA TACAACGCAT GGGATTTACG CGAAGCGGGT
GCTGATGGCG TGTTTGATAC AACTGACGAC ATTATTCATC GCTTGTTATT GAATGGAACG
TATGTGGATA GCACAACGGT AAATCTCCTC ATTGAAGATG GTTCGCTGAA TGCGGGTTCC
TACCGATTTA CTGTTAACAC AACGGTTACT GATATTGTAG ATAATACGCT TAATGGAAAT
GTGCTTAATG GGGATGGTGA TAGCACTGCG GGCGATCGTT ATGAGCACTT CTTTACCATT
GCTCCACCTG CTGGCGTTAC TACCGAGGGT GGGCGCAACA ACATTTCACC AAATGCAACG
GCATTAACGT TCTCCGAAGA TCCTTCAGGC AAAGGTTTGT GGCTTGCGTA TGGCATGGGT
AACCAAGACC CGGCAACCAT GTACAATCAT TGGAGTGATC CCGATTATTG GAAAATTGAG
TTGCAAGCTG GCGATTATGT TTCGGTGTAT GTGAATACGC CTGAAAGCGA TCTTGATCCT
TACGTTGAAT TACTTAATAC CAATAATGGT GGAGTAGCAT GGAGCAATGA TGATGGAGCG
CATGAAGATT CTTTGATAAG CCGTTATGCA GTAACAGAAA GCGGCACATA TTATGTGCTG
GTTGGTAAAG GGTATTATAG TGGCGGGGGT TCTTACGAGT TGCAAGTTGA TGTGGCGCGT
GGTATTGATA TGGAGAGTGA TGCCAATTAC AGCAATAGCT CGTTTGGTAA TGCAAATAGA
GTAACCCTTG TTGATGCTGG CGTTGAGCAG CGCGCTACGG TAGCAGGCAA CATTATGGCA
CCTGAATCCA CCTTTGATAG AGATATCTAT GCGCTTGGGC GGCTGAATGC AGGTAATCGT
GTGGAGCTAA ACACTGCCAT GCCTTCAAGC AGCGATCTTA TGCCAGTTGT AACACTATGG
CAAGCTGATG GCACTATGGT TGCTGATAGC GATGGTAACT ATACCGATGG ACAATTCAAT
GCGTTGTTAG CTGCCGATAG CGATTACTAC ACTCAAGTTG AGCGTGGCTA TACGTTTGGT
GAACATACTT ACTTGCTCAG TAGTAGTAAC ATGACGTGGA GTGCAGCAAA AACCTATGCA
GAATCACTTG GCGGACATCT TGTAACCATT GAAACGGCTG AAGAACAAGC ATGGATTAAT
GAATTGCTTG GCTCCTCAAC CTCATGGATT GGCATTTATG ATGCCGCTGA TAACGGGACA
TGGGTGTTGC TGGATGGCAC TCAACCAACC TACACCAATT GGGAAGCAAG TCAACCGTCA
ACATGGGATA ACTATAATTA TGGGCATATC AACTACAATC AACTATGGTA TGCCGGGCTT
GAATCGTGGG GCTTGCCCGT GCTTGTAGAG ATTGATACAG TGGGTACCTT GCCAAGTAGC
AGTGCATTAG GTTCCGAGTA CATTCTCGAC ATTACGGTAA CCGATGGCGT TGCGCCTCGT
GTTGAATCCA CAACCCTTCC CACCAACAAC AGCACAACCG ACAATTTAGT AGGTGCCACC
TTCTCGCTTA CCATGAGCGA AAAGCTTGAT GCAGCAACCG TAAAAGCTGG AGCTTTTGAG
GTGTGGAAGT ATAATGGCAA TTACTACGCT CTTACCGAAT CAGCAATGAC TTGGGTGCAA
GCTGAAGCGG CTGCCGTAGC ACTCGGTGGT CATTTAGCAA GTGTGCTTGA TGCCAACGAG
CAAGCGTGGG TGCAATCCAT GCTTGATGGA CGCTACGGCA ATGTATGGCT TGGCTTGAAT
GATGCGGCAA CTGAAGGCTC ATGGGTTTAC AGCGATAACA ATCTTGCTCT TTACACCAAT
TGGGCATCGA ATGAGCCATA TTATCAATGG GATGGCAATT ACGATTACGC CTACATGCAC
ACGAATGGTG AATGGCGAAA CACCGATGGC AGCTCTACCA TGCGTGGGCT TATCAAATTA
AACGATACCG ATAGTGATAA GGATGGTTTG CCTGACGCGT TTGATCTTTA TCTAACCGAT
AGCCGCAATG CGTGGGATTT ACGCGAAGCT GGTGCTGATG GCGTGTTCGA TACGGCTGAT
GATATCATTC ACCGTGTTTT ACTCAATGGC GCTTATGAAA ATGGCACAAC GGTGAATTTG
CTTATTGAGG ATGGTTCGCT TGGTGCTGGT TCCTACCGCT TTACCGCAAA TGCTACCCTT
ACCGATATTG TAGGCAATGC GCTGGACGGC AACGGTGATG GTACAGCAGG CGATTATTAT
CAGCAATTCT TTACCATTGC ACCTCCAACA GGTATTACGG TTGAAAATGG ACGCGACAAC
ATTTCTACGA ACGCAACAGC ACTTGCATTG CACGAAGATC CATCAGGCAA AGGCTTATGG
CTTGCACATG GCATGGGCAA TCAAGACCCT GCTACCATGT ACAATCATTG GAGCGATCCT
GATTATTGGA AAATTGAGTT GCAAGCAGGC GATTTGCTTT CTGTTTATGT CAATACACCT
GAAAGCAATC TTAATCCTTA TGTTGAATTA CGCAATGCAA CGGATAGTCA GATTAGTTAT
AACAACGATG ACGGAGCTAA GGAGGATGCC TTTATTAGCC GCCACCTTAT TGAGCAAAGT
GGCACCTACT ATGTGTTAGT TGGTAAAGAT TATTACAGTT ACGGTGGCTC TTATGAGTTG
TTGGTGGATG TGGCGCGTGG TATTGATATG GAGTACGATC CTCAATATCG CAATGATTCC
TTAGGTGGCT CTCAATCGCT TGGCTTTAGT GCAGCACAAA ACTACCAACT CTCCACCGTT
GCCGGTGCTA TTATGGGTTA TGAGTATGGT TACGATTACG ATGTGTATAA CCTTGGGCGC
TTTAATGCAG GCAACACTAT TGAGCTAACC ATTACTCAGC CATCAACCAG TTCACTTGTC
CCACTTGTAA CGTTGTACAA TGCTGCAGGC ACTCCTGTTA CCGATGCGAA TTGGAACCCT
GCTGATGGTA CCTTTAACGC CACCTTAACG CACAATGATG ATTACTACGC TAAAGTTGAG
CATGGCTACA CCTTTGCTGG GCATACCTAC GTGCTTACAC ACGACAACAT GTATTGGAGT
GATGCCGAAG CTTATGCTGA AGCACTTGGT GGGCATTTGG TAACCATCAA TAACGCTTTT
GAACAGCAGT GGCTTGCTAA CACCTTTAGC TGGGCAAATC CATGGATTGG CATTTCGGAT
AGTTCCAACA CCAATGAATG GCACTGGAGT GATGGCTCTC AATCACTCTA TCGCAATTGG
GGTGATTCTC AACCCGATAA TTACTACGAC TACGGCTATT TAAATCCCAA TGGCTATTGG
TACACAGGTG CTAATAATTG GAATTATCGA GCACTGATTG AGTTTGATAG TATGGGCATT
ATTCCAGCAG CTACCGACCC AACGGTTACC AATTATCTGC TTGATGTTCG TGTAGAGGAT
AGTGTTGCAC CTCGTGTGGA GATGGTAAGT TTGCCTGCAA ATAACAGCAC CATTGAGCAT
CTTGTGGGAG CATCCATTAC CGTAACCATG AGCGAAAAGC TTGCACCTGC AACCGTGCAA
GCAGGTATGT TTGAAGTGTG GGAACATAAC GGACATTATT ACACCTTAAC CGATAGGGCA
AAAAGCTGGC AGGATGCTGA AGCTTCGGCT GTAGCGCTTG GCGGACATCT TGTAAGTATT
AACGATGCTA CCGAGCAAGC GTGGTTACAA TCCATGCTTG ATGGGCGATA TGGCAATGTG
TGGATTGGCT TGAGCGATGC TGCCGCTGAA GCTACATGGC AGCTTACTGA CGGCACAACT
TCTACGTATG CCAATTGGGC ATCGAATGAA CCATATTACC AGTGGGAGAG CAATTACGAC
TACGCTTACA TGAATAGCAA TGGGCAGTGG GGTGCAAGTT ATAACACGAA CTCCATGCGT
GGCGTTATTG AGCTGGTGGG AACTGATTCC GATAACGATG GAATGCCAGA CCAACTTGAT
ACTTATCGAA ACGATCCATA TAACGCATGG GATTTACGTG AAGCGGGCGC TGATGGAACA
TTCGATACCG CCGATGATGT TATTCATCGC CTGATCTTAA ATAAAGGGTA TAGCAGTGGT
TCTACCTTCG TGAATTTGCT GATTGAGGAT GGTTCTCTGA ATGCAGGCTC TTATCGCTTT
ACCGCAAATG CAACCTTAAC CGATATTGTA GGCAATCATT TAGATGGCAA TGCCAACAGC
ATTGGTGGCG ATGCCTACAT GCATTATTTC ACCATAGCGC CACCAGCCGG TGTTATCGCA
GAGGGTGGGC GCAACAACAC CATGCAAAAT GCCACAGTAC TTCCTCTGAC GCAAGACCCC
GCAGGACGAG GCTTATGGCT TGGGCACGGC ATTGGCAATC AAGACCCCGG TTTTGCGTAT
GAATATGGTA TTGATGTTGA TTATTGGAAA GTTGAGTTGC AAAAGGATGA CCTTGTTTCC
ATTAGCGTTA ACACGCCGGA CAGTAACCTT GATCCAAATA TTGCACTCTA CGATGCTAAC
GGTACCTATT TTGATTACAG CAATAACGAA GGTCCCGATT ATGATGCCTT TATAAGTCGT
TACGTTGTTA CGACTACCGG AACCTATTAC ATCAAAGTTG ATAAAGATTA TTATAGTGGT
CCCGGTAGTT ACGAATTGCA AGTGGATGTA GCACGCGGTA TTCAAATGGA GTACGATCGA
AACTATGACA ACGATCCACT ATCGGGTGCT AATGTGCTTA CCTTTACGCA AGCAGGTACG
CAGCGCATTG CTACCGTTGC CGGCAACATG ATGAGTGCAG GCGATGGGCA AGTTGATGAC
GACACCTACG CGCTTGGCGC CATTGAGGCA GGCAACACCA TTTTGCTTGG CATTACCATC
CCCGACATGG GCGATTTACG TCCGGTGGTT GAAATTTATA ATGCTCAAGA ACAACTTGTT
GGGCTGGATC CCAATCCATC CTCAGGTGTT GCCCGTTTTG ATGTAATCAC TACAGGTACC
TATTTTGCTC GTGTGTTGCC CTTTACAGGA AGTGGTAGCT TTGGGCACTA TTTGCTTGAT
GCGGCAATAA CGCCAACGGT TGAAGCCCAA TTTGCTGATT TAGCGATTGA TAGTAAGTCT
GTTATTGTAC CAGCAACACC GCAAAGCGGT AGCACTATAA CAATTGCATG GAGTGTTGGG
AACTATGGCA AAATTGCAAC TGAGCAAAGC ACATGGCAAG ACCGCGTTGT ACTTTCGCTT
AATAGCCGCC TTGGCGATGC TGATGATCTG CTGCTTGCAA CGGTGGAGCA CAATGGCGTG
CTTGATCCCG CTACTTCTTA CAACGCTTCG GTTGATGTAG TGTTGCCAAC ATTGCTTGAA
GGCAACGCAA GAATTTTTGT AACCAGTGAT GTTGCCGACG TGGTTGAGGA GAGCTTCTTT
GAAATCAATA ATACCGCAGA AAAGGAGATT GTGGTTTCGC TTACCCCTTA TGCCGATTTG
CATGTTGCAG AAGCCTCAAT GCCATCAACG CTTCAAGCTG ATACCACGTT TATCGTAACA
GCTACAATTG CCAACAACGG TACAGGTGCA CCGGGTACAG GTATTCCAAA TGAAAGCGTC
AACACATGGG TTGATAAACT TGTGCTCTCC GGCAATGCCG TGCTTGGCGA TGCTGACGAT
GAAATTCTTG AGACCCTTGC GCATACAGGA GGGCTTGATG CAGGCTCATC ATACGAAGTG
AGCTTTGACG TTACCTTATC GGCAGAGCAA CTGCAAGACC ATCTCTTTAT TGTAAGCGAT
AGCGGTGATG CGGTGTTTGA AGCCTACAAT AGCGGGATGA ATGAGCGTCG CGTAAACCAT
CTACCCGAAG GAAGCGTCGT TATTAATGGC AATGCGCTGC AAAGCACTAC ACTTACGGTA
ACGCAGACAA TCAATGATGC TGATGGCATG GGCGATCTGC TCTACCAATG GTATGCTGAC
GACGAAGCCA TTGCAGGCGC AACGCAAACA ACCTTATGGC TTGACACCTC TCTTATTGAT
AAGCAAATAA GCGTTGTCGC CCATTATGAA GATGGCTATG GCGTTGAAGA AGCGGTTGAA
AGTACGCCAA CTGAAGCCGT AGTAGCCGAC ACAACAGCGC CAACAGTGGT TAGTTTTGCA
CCGACCGACA ATGCCACAGA GGTTGGGCTA AATAGTTCAA TTACGGTAGA ATTTAGCGAA
GCTATTGAGC GGGGGAGTGG CACCATTTCT CTCCATACCG GTAGTCCGCA AGGCACGTTG
GTGGAAAGCT ACGATGTTTC CAGCAGCTAT AACTTGCACA TTGCAGGATC AACGCTGACC
ATCACGCCAA ACAATAGGCT CGATGATAGC ACGCACTACT ATGTTGTGTT TGAAGAGGGA
AGTATGCAGG ATATGGCAGG CAACGATTAT GCAGGAACGG TAGAATATGA CTTCACAACC
GTTGTTAATC ATGCACCAAT AATTAGGATT CCACACGAAT TATCGTTTGC GGATAAGGTG
GATTATGCAA CAGGCGATGA ACCTTACGAT ATATCCACAG GATATTTTAA TAATGATGAA
TGGTTGGATG TTGCCGTTGT AAATAGCCGC AGTAAAACAT TTGCTATTTA TAATAACAAC
GGAAATGGTT CGTTTACTTT AGGAGAAAGC TATAACACGC CACATATGTC ATTCTCTATA
GCTTCTGGGG AGGTAACAGG AGATGATTAT GTTGATTTAA TTGTTTCGAA CTATTACAAC
AACACCGTAT CAGTATGGAG TAATTCAGAG ATAGGAACCT TTACAGAAAC GTCAAGTTGT
GTTACCGCTA ATGCACCTTC GGATGTTAGG TTGGCTGATA CTGACGGAGA TACTGATCTT
GATATAATTA CACTACATCA AGATTCTAAT AGTATTTCCA TCATTAAGAA TAATGGAGAC
AATACTTTTG CCAATTATGT TGTGTATGCT ACCGGTAATC ATCCATCCAG TTTAGCTGTT
AGTGATCTCA ATAACGATGG ATTTGTTGAC CTGATGGTTA CCAATACTGT TGGTGATTCT
GTCTCTGTTC TTATAAATGA CACTTATGGT GCTTTTAGTG AAAAGGTTGA TTATAGTATA
GTAAATCCAT CAATTGTCAT AAGTCGTGAT GTTGATGCAG ATGGCGATGC TGATATGGTG
GTTGGGCGTG CGCTTTTTGG CTATGTATCC GTACTGAAAA ATAATGGAGA CGGCACCTTT
ACAGCGCAAG CTGATTATCG GCTTGCCGAT AACCCAGCTT CGCTCAATAG CGTTGATGTA
GATGGCGATG GTATGCTGGA TATTATTGTT GGTTACAGAG ATGAGCTATC AACTATTTCA
GTGCTGAAAA ATAATGGCGA TGGAACGTTT GGAACTCCTA TTGATTATCC TGCCGGCACT
AAATCTTACT CAATAGCCTC TGGTGATTTT AATAATGATG AACAATCGGA TTTAGTTGTT
GTTCATTATG ATACCGACAC CTTTACTCTC CATTTAAACA ACTCTGTAGA AAAAACAGCA
ACCGCATTTA CCGAGCAAAC CCCCGTTGCG GTAAGCAGCA ACATTACCAT CAACGACCCC
GATGGCGATG CAAGCTGGAA CGGAGGCTGT TTGCAGGTTC AAATTACTGC CAATGCTGAA
TCTCTTGACC GTCTCTTATT GCCGACAGTA GCAGGAAACG GGGTTTGGCT TGATAGCGCT
AACAACAATG CACTCATGGC AGGCGAACTC CGCATTGGTG AGGCGAATGT TGTAGGAGTG
CAGGGAAGTG CAGCATGGCA CTTCAGCTTT AACGAACATG CTACAAACGC ATTAGTTCAA
GAGGTCACGC GTTCCATTAT GTTCAATAAC AACAGCAATA CGCCATCCGA ATTGGAACGC
ACCATAACCT TTACTGTAAC CGATACCTTT GGCGACTGGG CTGCAGTTGA TCAGCAAATT
ACAGTAACGG CTGATGATGA TCCAGCACCT ATCACCCACG ACCTCTACGG CAACATCACC
TTCTGGAAGA GCGGTAATCC CTTAAATGAC GTACAGCCAA CGCTTGCCTC CAAGCCCATG
GAAAACCATG ATCAAGAGGT AGCCTTCCGC AACCTTCAGC AGCAATCGGA TGGCAGTTAT
ACCGTTGAGC TATGGGCATC AACAACCCAA ACCGATATCC ACGATTTCCA ACTGCAACTT
TACTTTCCTG AAAGTACAAC CAGCGTGTCG TGGCAGGCGA GCAGCACGCT CAATGGCTGG
ATCAGCGTTC TTAGCGATCA AACCACAGGG CAAGTGGTGC TTGGTGGAGT AAGTACTGCG
CAAACTTTGC AAACAGGCAG CGTACAAATC GGTACCCTCA GCTTTAGCGC TCCTGATATC
CCTGATAACT TTACGCTTAC GGCTGCATCA GGCTGGATTG GTACTGAAAA CATTGTGCCA
ACCTCCATTC TTTGTACCGC TACCGACACG ACAGGAGACT ACCGTTTTGA GGACGTTACC
GATGGCTGGT ACCGTGTTGC GGGCGAAAGC AATACCAATA TGCTTGCTAA TGCTGTAACC
ACTGAAGATG CCCTTGCTGC ACTTAAAATG GCAGTGGAAC TCAACCCCAA CGAACCTAAC
GCAAGTGGGT TGCTTGATCC CGTTTCACCG TACCAATTCC TCGCAGCCGA CATCAATCGT
GATGGCAAAG TGCGTGCCAA CGATGCACTC AATATTCTCA AAATGGCAGT AAATTATGCC
AACGCTCCAA CTGACGAGTG GATTTATGTT CGTCAAGATC ATCAATTAGC AGATATGGAT
CGCAGCCACG TAGATTGGTC ATTTGCTGAG CGTGCAATAG ATATTTATGG GGATATGAAC
GTCAATTTTG TAGGCGTTGT GAAAGGCGAC ATTGATGGTA GTTGGGGAAT GGTTCCATGA
 
Protein sequence
MSIIQEHESN DLIANATSLT LVAESLGSTT SVADGVGTQS NPTQYNSWSD PDYWRIELLA 
GYQISFSILT PSSSLQPYAE LRDAANNTVA YATADASGES VHLVPYTLTA SGSYYVVVGK
NYYTSDGGDY ELHVETAPFI KPEDDDNNTI DKATELVLSE NPASSGLLLG VGMGEQDPAT
MYNHWSDPDY WRIEVLAGDL VSITVQTPDS ELNPYVELRN AADGNLVGSN DEGAGNDAFI
SSYEIKDSGS YFVLVGKDYY SGGGTYSVQV DVARGIQMES DANYDNGNLT QANALHLSAE
ITNTDRYQVA TVAGAIMLPE YLTVDVDVFA LGRLNAENTV ELTSLLPSTS NLTPLVTLLD
SAGNVVTDSD GNSADGNFSA TLTKDDDYYV QVERGYQYNG HTYLLTNNGM NWTAAQEYAE
SLGGHLVTID DASEQQWLFS QFGSTNSWIG LNDEVTESIW QWGNGATSTY RYWGDGHPYG
GEYYNYAYIA TDGKWYSGNE TWGYYALIEI ENTASAANSA SSSTSNYLLD VRIEDSVAPR
VESITLPANG SSVDDPIGAT ITVTMSEKLE PATVKAGLRE VWVRDGHYYT VTDAAVSWTD
ANTAATALGG QLVNIESAEE QAWLLSMLDG RYGDVWLGLS DTATEGTWVS ANGETVWVYG
AETNSAYANW GDSQPYYQWD ENYDYAAMNG SGKWYASYGS NAMRGVIEIV DNDSDSDGLS
DALDPYDNDP LNAWDLREAG ADGVFDTPDD VIHRLLLKEA YNGGTAVNLL IEDGTLGAGS
YRFTANTTLT DIVGNVLDGD SAKIGSEPYV HYFTITHPAG VTAEGGRNNI LQNATTLSLN
EDPAGKGLWL AHGVGNQDPA TIYNHWSDPD YWKLELQQGD LVSIYVNTPD SSLDAYVELR
NANDGYVASS NDDGASNDSF ISRYVVTESG TYYVLVGKGY YSGGGAYELQ VDVAKSIQME
SDANYSNNPL SGANLLSFVA DGNNQVATVA GAIMESEGQP DIDVYALGRF NAGNTITLTA
NLPSTSGLSP IVTLLDEAGH LLLDADAHYA DGTCTITLED NGNYYAQVEK GYQYNEYTYI
VSSTTMSWEA AHIYADMIGG HIVTINDADE QQWLTEQFGW TSSWIGMNDA ALDGTWVWDD
GTTVEYQNWG SGHPYTWSND YNYGYLATDG KWYSSYNGYT YRALIEIEIP HTAEASTNSL
NTSYLLDVSI EDDVAPRVES TTLPTNNSTV DNLVGATFSV TMSEKLDAAT VKAGLREVWV
RDGHYYTVTD AAMSWQDAAI AAQALGGQLV NIESADEQAW VQSMLDGRYG DVWLGLNDAA
TENTWVSADG STTWIYGAET NSAYTNWGDS QPYYQWDENY DYAAMNSSGK WYATYNNSSY
NLMRGVIEIV GSDSDNDGMP DALDPYDNDL YNAWDLREAG ADGVFDTTDD IIHRLLLNGT
YVDSTTVNLL IEDGSLNAGS YRFTVNTTVT DIVDNTLNGN VLNGDGDSTA GDRYEHFFTI
APPAGVTTEG GRNNISPNAT ALTFSEDPSG KGLWLAYGMG NQDPATMYNH WSDPDYWKIE
LQAGDYVSVY VNTPESDLDP YVELLNTNNG GVAWSNDDGA HEDSLISRYA VTESGTYYVL
VGKGYYSGGG SYELQVDVAR GIDMESDANY SNSSFGNANR VTLVDAGVEQ RATVAGNIMA
PESTFDRDIY ALGRLNAGNR VELNTAMPSS SDLMPVVTLW QADGTMVADS DGNYTDGQFN
ALLAADSDYY TQVERGYTFG EHTYLLSSSN MTWSAAKTYA ESLGGHLVTI ETAEEQAWIN
ELLGSSTSWI GIYDAADNGT WVLLDGTQPT YTNWEASQPS TWDNYNYGHI NYNQLWYAGL
ESWGLPVLVE IDTVGTLPSS SALGSEYILD ITVTDGVAPR VESTTLPTNN STTDNLVGAT
FSLTMSEKLD AATVKAGAFE VWKYNGNYYA LTESAMTWVQ AEAAAVALGG HLASVLDANE
QAWVQSMLDG RYGNVWLGLN DAATEGSWVY SDNNLALYTN WASNEPYYQW DGNYDYAYMH
TNGEWRNTDG SSTMRGLIKL NDTDSDKDGL PDAFDLYLTD SRNAWDLREA GADGVFDTAD
DIIHRVLLNG AYENGTTVNL LIEDGSLGAG SYRFTANATL TDIVGNALDG NGDGTAGDYY
QQFFTIAPPT GITVENGRDN ISTNATALAL HEDPSGKGLW LAHGMGNQDP ATMYNHWSDP
DYWKIELQAG DLLSVYVNTP ESNLNPYVEL RNATDSQISY NNDDGAKEDA FISRHLIEQS
GTYYVLVGKD YYSYGGSYEL LVDVARGIDM EYDPQYRNDS LGGSQSLGFS AAQNYQLSTV
AGAIMGYEYG YDYDVYNLGR FNAGNTIELT ITQPSTSSLV PLVTLYNAAG TPVTDANWNP
ADGTFNATLT HNDDYYAKVE HGYTFAGHTY VLTHDNMYWS DAEAYAEALG GHLVTINNAF
EQQWLANTFS WANPWIGISD SSNTNEWHWS DGSQSLYRNW GDSQPDNYYD YGYLNPNGYW
YTGANNWNYR ALIEFDSMGI IPAATDPTVT NYLLDVRVED SVAPRVEMVS LPANNSTIEH
LVGASITVTM SEKLAPATVQ AGMFEVWEHN GHYYTLTDRA KSWQDAEASA VALGGHLVSI
NDATEQAWLQ SMLDGRYGNV WIGLSDAAAE ATWQLTDGTT STYANWASNE PYYQWESNYD
YAYMNSNGQW GASYNTNSMR GVIELVGTDS DNDGMPDQLD TYRNDPYNAW DLREAGADGT
FDTADDVIHR LILNKGYSSG STFVNLLIED GSLNAGSYRF TANATLTDIV GNHLDGNANS
IGGDAYMHYF TIAPPAGVIA EGGRNNTMQN ATVLPLTQDP AGRGLWLGHG IGNQDPGFAY
EYGIDVDYWK VELQKDDLVS ISVNTPDSNL DPNIALYDAN GTYFDYSNNE GPDYDAFISR
YVVTTTGTYY IKVDKDYYSG PGSYELQVDV ARGIQMEYDR NYDNDPLSGA NVLTFTQAGT
QRIATVAGNM MSAGDGQVDD DTYALGAIEA GNTILLGITI PDMGDLRPVV EIYNAQEQLV
GLDPNPSSGV ARFDVITTGT YFARVLPFTG SGSFGHYLLD AAITPTVEAQ FADLAIDSKS
VIVPATPQSG STITIAWSVG NYGKIATEQS TWQDRVVLSL NSRLGDADDL LLATVEHNGV
LDPATSYNAS VDVVLPTLLE GNARIFVTSD VADVVEESFF EINNTAEKEI VVSLTPYADL
HVAEASMPST LQADTTFIVT ATIANNGTGA PGTGIPNESV NTWVDKLVLS GNAVLGDADD
EILETLAHTG GLDAGSSYEV SFDVTLSAEQ LQDHLFIVSD SGDAVFEAYN SGMNERRVNH
LPEGSVVING NALQSTTLTV TQTINDADGM GDLLYQWYAD DEAIAGATQT TLWLDTSLID
KQISVVAHYE DGYGVEEAVE STPTEAVVAD TTAPTVVSFA PTDNATEVGL NSSITVEFSE
AIERGSGTIS LHTGSPQGTL VESYDVSSSY NLHIAGSTLT ITPNNRLDDS THYYVVFEEG
SMQDMAGNDY AGTVEYDFTT VVNHAPIIRI PHELSFADKV DYATGDEPYD ISTGYFNNDE
WLDVAVVNSR SKTFAIYNNN GNGSFTLGES YNTPHMSFSI ASGEVTGDDY VDLIVSNYYN
NTVSVWSNSE IGTFTETSSC VTANAPSDVR LADTDGDTDL DIITLHQDSN SISIIKNNGD
NTFANYVVYA TGNHPSSLAV SDLNNDGFVD LMVTNTVGDS VSVLINDTYG AFSEKVDYSI
VNPSIVISRD VDADGDADMV VGRALFGYVS VLKNNGDGTF TAQADYRLAD NPASLNSVDV
DGDGMLDIIV GYRDELSTIS VLKNNGDGTF GTPIDYPAGT KSYSIASGDF NNDEQSDLVV
VHYDTDTFTL HLNNSVEKTA TAFTEQTPVA VSSNITINDP DGDASWNGGC LQVQITANAE
SLDRLLLPTV AGNGVWLDSA NNNALMAGEL RIGEANVVGV QGSAAWHFSF NEHATNALVQ
EVTRSIMFNN NSNTPSELER TITFTVTDTF GDWAAVDQQI TVTADDDPAP ITHDLYGNIT
FWKSGNPLND VQPTLASKPM ENHDQEVAFR NLQQQSDGSY TVELWASTTQ TDIHDFQLQL
YFPESTTSVS WQASSTLNGW ISVLSDQTTG QVVLGGVSTA QTLQTGSVQI GTLSFSAPDI
PDNFTLTAAS GWIGTENIVP TSILCTATDT TGDYRFEDVT DGWYRVAGES NTNMLANAVT
TEDALAALKM AVELNPNEPN ASGLLDPVSP YQFLAADINR DGKVRANDAL NILKMAVNYA
NAPTDEWIYV RQDHQLADMD RSHVDWSFAE RAIDIYGDMN VNFVGVVKGD IDGSWGMVP