Gene Cpin_0549 details

Gene Information       Plasmid Coverage information       Fosmid Coverage information       Sequence       

Gene Information

Locus tagCpin_0549 
Symbol 
ID8356655 
TypeCDS 
Is gene splicedNo 
Is pseudo geneNo 
Organism nameChitinophaga pinensis DSM 2588 
KingdomBacteria 
Replicon accessionNC_013132 
Strand
Start bp654353 
End bp667642 
Gene Length13290 bp 
Protein Length4429 aa 
Translation table11 
GC content51% 
IMG OID644962695 
ProductFibronectin type III domain protein 
Protein accessionYP_003120248 
Protein GI256419595 
COG category 
COG ID 
TIGRFAM ID 


Plasmid Coverage information

Num covering plasmid clones
Plasmid unclonability p-value
Plasmid hitchhikingNo 
Plasmid clonabilitynormal 
 

Fosmid Coverage information

Num covering fosmid clones32 
Fosmid unclonability p-value
Fosmid HitchhikerNo 
Fosmid clonabilitynormal 
 

Sequence

Gene sequence
ATGCATTTCA AAGCTACTCC TAAAAGCCCG TTAAGAGCTT TTATTCTTAT TTTCTTTTGC 
CTGGTCTGGC TGGTTGGGTT ACCGGTGGGT AAGGCTTCCT ATAAGAAGCT CCCCGTAACT
AAAGCCGTCC CCAAAGATGG CGCAATCTCC AGGTTGGACA ATTACCTATT GCATCACCCC
TATGCACCAT TACTACCAAA TGCCTGGCGT AATGCCGGCG CTGCCGATGG GCCACTATGG
AGCTACGCCG GCAGTCAGTC CTTTGTCACC TTCGGCCTTG CCTGTGCATT GTGTCGTGTT
GACGATGGGG CTAATGCCAT TGACGCCAAT CCCAATACTG CCGCTACACT CGTACTACCG
GTAGGCGCTG CAGGAGGGGT TGGATTAAAG CTAAAGTTCA GTGGTAGTTA TCAGGCTGGT
GACCAGGTGG CCTTCGACCT GGAAATACCT GACCAGATCT ACTCCCAGCA GTTACTTTCC
GCACTTTCTG TGACCTCCTT TAATGGAGGC GTATCTAATA ATGACGCTAC CCCGCTGAAT
AGTTCCCAGA TCCGCCTCGA CCTCTTAGGT CTCGGTCTTG GTTCTACGCC GAAATTTCGC
GTAACAGCTC CTGTCACGCA TGCTTTTGAT GAAGTACAGA TCAGTTTATC AACGCTGGTC
AGCACCTTTA CTTCTCTGCG TGTATATGAA GCTGCCGCAT TTATTCCTGT AACAGTAAGT
CCTGCGAATC CTGCTATCAC TTCCAATGCT ACTGTTACCT TCTCTCCTTC TATCAGAATT
CCTAACGCCA CCTATTCATG GTATACCACC CCCGAAGGTG GTACGCCCGT GTTTAATGGC
GCCGGATTTA CCACGCCTCC GCTGAAACGC AGTACTACTT ATTACGTGGC AGCCACCAAT
CCCCTGGATG GTCTGGTTAG TCCGGTACGT ACCCCTGTTA CAGTGCGTGT GAGCGGTGGC
GTCGGTCCTA TCTGGACATA TGCTGATCAG CAGGTAAGCC CTATCACCGG TGGTATTGCC
TGTGCGCTCT GCTATGTAGA TAACCCTGCC GCAGCTGTTG ACGCGGATAC CACCACAGCT
TCCATGCTGC AATTACCGGT AGGTGCACTG ACTGCTGTCG GACAACTCCT GAAGTTTCCC
GGCGACTACA AAGCCGGCGA TGTCATTGTA CTGGACGTGG ATATTCCGGG TCAGATCGTT
TCACTCGGCG CATTGTCCGC TATCCAGATA CAAACATTTA ATAATGATGT CGCTAATAAC
GATGTGATCA ATCTGGGTGC TACTACTGTT GGTGTTAATG TACTGGGTCT CGGACTCGGT
ACTTCGCCTA AAGTGCGTCT CACCATTCCC GTTACCAAAG ATTTTGATGC CGCTCAGGTA
AGTCTGACCA CCGCATTCAC TGCGTTTGGT TCTTTACGCA TTTATGAAGC GGTAGCTACC
ATACCGGTAA AAGTTAGCCC TGCGGCTCCG CTGATCACTG CTGGTAGCAG CGTAACGCTG
TCTGCTACTA CCGACGGCCG TATTGCAAGT CCTGTATACA GATGGTACAC AACGCCTGCT
GGCGGTACCC CTGTCGCTAC CGGCAACAGC TTCCCTACTC CCATGCTGAA CCGTACCACT
ACCTATTATG CCGAAGCATA TAGCGCTGCG GATAATCTGA GCAGTTATGT ACGTACGCCT
GTAACAGTAA AAGTAGCAGG TGGTCCTGGT ACCATCTGGA GCTATGGCCA GGAAGAAGAT
GGTCCTTTCA CCAGTGGTGT AGCCTGTGCG GCCTGTGCGA TCAGCACACC GGAAGCCGCC
GCCGATGGTG ATACCACAAC GGCATCCACC CTCACCGTTC CTTTAGGACT GGCAGCCTAC
GTCGGTCAGC TGGTTAAATT GCCAGGTGTA TACCAGGCGG GCGATAGTAT TGTCCTGTTC
CTGGAAGCGC CAACAGAGAA TCTGGTAGCT GTTGTGTTGC CCAAAGTAAG AGTTACTACC
TTCAATAATA GCATCGCAGG TCCGGCGGTC TCCAACAATG ACGCCGTGAC TCTGGATGCA
CCAACTGTAA AACTCCAGTT GCTGGGCGCT GGTCTGAATA ATGCCCGCAA ATTCCGTGTA
ACGATTCCGG CCACCAAAAC CTTTGATGGG GTACAGGTGG ATTTCGGAGG ACTGGTAGGG
GCATCCGGCT CACTTAAATT ATATGAAGTA GCCGCGATGA TCCCGGTGTC GGTATTGCCC
AACCCCGCAA AAACACCTTA CAATACCGGT GTTACCTTAA CACCTTCTAT ACGGATCACT
AATCCTACTT ATAACTGGTA TACCACCCCT ACGGGTGGTT CCCCTGTATT CACCGGTTCC
GGCGCTTTCA TAACGCCTGC GCTGATCCGC AACACAACGT ACTATGTTGA AGCGAAAGAT
CCTGCGGGTA CTGCCAGCCT GGTAAGAACG GCGGTACCGG TAACGATAGG TGGTGGTACA
GGTCCGCTGT GGACATATGG TACTGGGCAG ACAGGTCCTA TTACCGGTGG TGTAGCCTGC
GCGCTTTGTA CGATTACAGA TCCTGTATTT GCTGCTGATG GCGATTCCAC AACAGCATCC
AGACTGTCAC TGCCACTGGG TATTGCCTCT ACGGTAGGAC AAAAGATCAA CTTTCCCGGT
ATTTATCATA GTGGAGATAG CATCATTCTG ATACTCGGCA GCAAACCTGG TTTCCTGGCG
GATGCCTCCC TCCTGGGTAG TATTCGTATA ACCACTTCTC TGAATAATGT CAGCAACAAT
GATCCGCAGA CATTGAATAA TCCACTCTTA AAGGTGAATC TGCTGCAAAC AACGGCAGGT
ATTAGTAAAT TCCGTGTAGC AATACCGGTG TCTAAAACGT TTGATGCGGC ACAGGTCGAT
ATCAGTAGTC TGCTGGCGGT TGACAATAGT CTATATATCT ACGAGGCGAT TGCAATGACG
CCTGTAACAG TAACACCTAG TCCTGCTACG ATCACCGCAG GACAGACAGC TACGCTGAAT
GCATCTCTTC CCAGCATTCC TGGTGTGATC TTCAACTGGT ATGAAACCAA AGAAGGAGGA
TCTCCTGTTC ATACCGGCAA TAGTCTGACA ACACCTCCGC TGTTCCAGGA TAAGACTTAT
TATGTAGAAG CTGTGTCTCC TACTGATGGT CTGATCAGTA TTACAAGAAC TGCCGTGGAA
GTAGACGTGA ATGGCGCTAC CGGTAACGGT CCGCTGAGCT GTAGTGGCGC AACGACCGAG
AGCAGTGGTA CAGGTGGTTT AGCCTGTCTG CTGTGTGGTA CACAAAATGC TGCGCTGGCG
GTAGATAATA ATACCGCAAC AGCCTCTACT ATCCGTCTGG GTGTTGGTGC ATTGGGTTAT
GCTTACCAGG ATGTCGTATT TCCTTTCAAA GGAAAAGCCG GCGATTCTGT ACGTATCGGT
CTTGGTACTA CTAATGGTCT GCTGGATCTC GGTGTGATCA GTGGTATCGG TGTAGGTCTG
GGCAATGGAG CAAGACCAAC GGATGCAGAA ATGGCAGGTC TTTCCAGCCC GCTGCTAACG
ATCCGTTTGC TCGATGGTGT ACAGCAGAAT GCCTATACAT TTGTAGCTAA TAAAGACTTT
GACAGAATTG AAATAAGGGT GAATGCAGTA GTGGGTGCAC TGACTTCACT GAACCTCTAT
TATGCCCAGG TAGTAACTCC GATCGTACAA CCCGCGGTAG CAACTGCTTA TGTATGTACC
GGTAGTCCGG CTACTTTGAG TGTTGTCGCT CCGACCGGTT ATACTTACCG TTGGTATACT
GCTTATACAG GCGGTTCTCC GGTTGGTTAT GGTGCAACAT TCGTGACGCC TGCTATTACC
AAAGACACCA CTTACTTTGT AGAAGCGGCT GGCGCTGATA GTTGCGGCAG CGAAAGACGT
ACGCCTGTTC AGATCAAAAC GGGTCTGCCA GGTGTAACCG TTACACCGTC TTCTGCTTCT
GTAGAAGAAG GTACTACACC GACCTTCAAT ATTGTTTCTC CGAATCCTAC TTATCAGTAT
AACTGGTATA GCGCACCAAC AGGTGGCACA CCGGTATTTG TAGGTACCCA GTTCACCGTT
CCTCCGGTTA CAGGTAATGT GACCTACTAT GCGGAAGCGG TGGCACAGGG TAATACGAAC
TGTCGCAGTT TACGTACTCC GGTATCTATT ACCCTGAATG GGGACGGCGG ACCGTCAAAT
CCTGGTGATA TTGATTGTGG CGGCGCTACC AGCCAGCAGA GTATCACAAG TGGTATCTGT
GTGGGTTGTT ATGTAGAGAA ACAGGATTCT GCGGTAGATA ACAGTTCTCA GACAGCTTCT
ATTATTCACA CCATCCTGGG TGTGGGCGCC AATATCCAGC AGTCCCTGAT CTTCCCGGCT
CCGGGTGTCA AAGGCGACAG TATCCGGATC AAACTTGGTT TTACTACCGG ATTGGCTGAC
CTGAATGCAT TAGCTGGTAT CCAGATTTCC TCTTCTAACG GAGGTACGTT AAATGCTGAC
CAGGTAACTC TGAATGCGGG TACGCTGAAT CTGCAGCTGT TGAACGGTAA CAGGGACCTG
GTTTACTCCT TTGCACCGGG AGCTGCTTTT GACAGGGTGA ATATCAAACT CAATGGATTG
GCCACCGCAT TAACTGCGCT GAAAGTATAT TCTGCACAGA TCTACGCAGG TACGCCGACT
GTTGAGAAAG ACACTGTTTA TATCTGTCAG GGTACTACCG GTACGCTCCG CGCTACCGGT
CCTGGTACTA CTTTCCGTTG GTATAATCAG CCTGCAGGTG GCACGGTGTT AGGCACTGGC
GCAACCTTCC AGGTAAGCGA TATGACCAAC GCGATCTATT ATGTTGAGTC AATTTCTTCT
GCAGGATGTG TGAATCCTGT GAGAAAACCT GTATATGTGA TTGTTGGTCT GCCTCAGCCA
CTGGTTTCAC CAACAGTGAG AACCATTAAC GCCGGTCAGA CAGCTACCTT CACCGTTACC
AGCCCGAATC CGGCTTACCA ATATACCTGG TATGACGCGC CTGCAGGCGG TAATGTGGTA
CAAAGCAATT CATCCACCTT TACGACGCCA GCACTTTCAG CGGCTGCTGT ATATTATGTA
GAGGTGAAAG ATCCTTCTAA CAATTGTACC AGCTCTGCCC GTACAAGAGT ACAGGTAGAT
ATCAATCTGC CAACGGAGCC GACACCATGT AGCTATGCGA AACAGCAGGT GAGCCCTGTT
ATCTCCGGCG TATGTCTGCT GTGCTCTGTA GCAGATCCTG CGCTGGCAGT GGATGAGAAT
TCCAATTCTG CTTCTACGAT CACGGCTACT GTCAGTGCAT TGGGTTATGT GGGTCAGCTG
TTACAGTTTG ACAACACCTA TCCTGCCGGT GACAGTGTGA CACTGGACCT GGAAATTCCG
GGTCAGCTGG CAGACGTTAC ATTGCTAGGT GGCATCAGAC TGGAAACTTA TAATGGCAGC
ACTCCAAACG CAGATGCTGT TTTCCTGAAT AATCCTACTG TACATCTTAC CCTGCTGAAT
ACCGGTAACA AGTTCCGTGT AACACTGCCT GTATCCAAAG CTTTCAACGG CGTTATGATC
AGCATCAATG GTGTGCTGGC AGCGCTGACG AGTGTGAAAA TATATTTTGC GGCAGTGGTG
ACACCTCGTC CGGTGGTAAC TGTTGCAAGT GTAGACGTCT GCAGTGGCAG TACGGCAACA
CTGAATGCAA CTACTGCAAA TGGTGCAGAT CTTGCCTGGT ACGCGGCTGC TGTTGGTGGT
ACGGCTTTAC AGACCGGACC TACCTATACA ACTGGTGCGC TGACTGCATC TGCTACCTAC
TATGTTGCAG CAGGTCGTTT CGGTTGTGCT AATCCGACCA GGGTGCCGGT AAGAGTAAAT
GTAGGTGCCG CGCCTGCAGC TCCGACAGCC GCCGGTAGAT CAGTTTGTAC CGGTAGTCCT
GCCTCTCTGC TGGCAACAGC TCCTGCAGGT GCTACCTTCC GTTGGTACAC AGCGCCAACT
GGTGGCACAT TACTGTCATC TACTGCAAAC TATACCACTA ATGCGCTGAC TGCGGATACC
GCATTCTATG TAGAAGCTGA CAACAATGGT TGTAAGAGCG TTACCAGAAC CAGGGTACCG
GTGACGGTGA GCCCCGCTCC GGCCAATCTT ACCGTAACGC CGCTAAACAC AACAGTGAGC
GTTGGTCAGG GTGCGATCTT CACCGCATTC GCGACCGGTA CGAATGTGAT CTACAAATGG
TATAACGCTG CCGGTGATTC TATCTATACC GGTGCGGTAT TCAATACGGG TCCGCTGACG
GCTACTACGA CCTTCTCTGT TGTGGCAGTG AATACCAGCG GCTGTATCAG TGGTCCGAGA
GTATCTGTAA CCGCTACGGT AGTACCAGGT GGTAATGATA TTCCTTGTGA TGCTGCTACC
AGCGAACAAC ATACTTCCAA TGGCGTATGT GTAGGTTGCT TTGTTGAAAA TCCTGCCCTG
GCAGTAGATA ACAGCACGGC TACTAAATCT ACGCTCCATG TGGCACTGGG ATTGCTGAAC
GGTTATGTAC AGCAATCACT GGTATTCCCG CAGATCAGTG AACTGAATGA CAGCACAGTA
ATTGGCCTGT CCTTCGATGC TTCCCTGGCT GATATTGGTC TGCTTTCTAC AGTTGAAATA
GGCTCCTATA ATGGTGCTAC TTCAAATAAT GACTTTGTGT CGCTGAATAG TCCGCTGGTG
AAAGTTGCCC TGTTGGGTGG CAGTCAGCAG GCGCTCGTAG GTTTCAAACC GAAAGCGTTG
TTTGACAGGA TTGTGGTGCG TCTGAATTCA GGTGTGGCGA CAGCCCTGAG TGCTGTAAGT
GTGAACTTCG CGAGTCGTGT GGTTGGTCTG CCTGTAGTAC AGGGAGATAC GATCTGCGCA
GGCAATCGTG CAAACCTGAC AGCAAGCGGT CCGGCGAATG TATCCTTCCG TTGGTATACT
ACCGCTACAG GAGGTACTGC TATCTTCACC GGTACAGCTT ATCAGACACC AGCTCTGACT
GCGAATACCA CTTATTATGT GGAAGCAGTG AAGACAAGTC TGAACTGTCC GAACCTGCAA
CGTGTGCCGG TAACAGCTAT CGTTGATCCT GTTCCGGATG CACCAGCACT GGATACGACG
GCGTTGACGA TTTGTAGTGG CAGCACTGCT ACCTTTAATG TGAAACCTGT TGCAGGTATT
ACCTATCGCT GGTATACTGC TTTGACAGGT GGTACGGCCT TCTTTACAGG TACATCTTAT
ACTACACCGG CGCTGACAGC GACGACTGTA TACTATATCG AAGCATCAAA CGCTACTGGC
TGTGCGACTA CAACCCGCAC AAGGGTAACT GCCAATGTGA TCGATCAACC GGCTGTTCCG
GTGGTGACAC CAACCAGTGC TAGTATCTGT GCTAATAACA GCACGCAGCT GGTAGCTACA
TCTGCAACGC CGGGTGTGAT ATTCCGCTGG TACACAACAG CGACTGGCGG TACATCTGTA
TTTGAAGGAG CTTCCTTCCA GACGCCGGTG CTGACAGCTA CTACTACTTA TTATGTGGCG
GCGGTAACAG GTGCTTGTTC AAGCGCTTCC AGAACGGCTG CTACAGTTAC TGTAAATGCA
GTTCCAGCTG CTCCGACGGT AACAACCGTA CCTGCGAATG GTCAGGTAGT ATCTGGTCAG
ACAGCTACGC TGACAGCCAG CTCCACAACA CCAGGTGTGA CTTACGCATG GTTTACAGTG
GCTACCGGTG GTAGTTCAGT GGCAACAGGT CCGACATTCA CTACGCCGGC ACTGACCAGC
AACATTACTT ATTATGTAGA AGCGGTAGCT GTCGCAGGTA GCTGTCCGAG CCAGCGTACA
GCAGTACCGC TGACAGTGAC CGTTGCGCCC AATACAGCAT GTGATTTTGC AAATGCACAA
ACAAACAGTA CAACAGCGGT ATGTGTACTC TGCTCTGTAC AGGATGCAGC GAATACAACA
GATGCTGATA TCAATAATTT CTCGATACTT TCTGTACCAT TGGCTGCCGG CAGCGGTAGC
GTACAGCAAA GTCTCATCTT CCCGGATGCA GCAGCTGCCG GCGATAGCGT ACGCATCGTG
CTGGAACTGC CTGCTCAGGT AGTAGATGCA GGTTTACTGA GTTCTCTGGA AGTATCCAGC
TTCAATGGCG CTAACCCGAA TAACGACGCC GTATTACTGA ATAACAGCAG CGTAAGTGTT
CGTCTGCTGA CAGGTTCCAG CAAATTCACG GTAGCATTTG CGCCAGGTGG TACTTATGAC
CGTGTTCAGG TTCGCCTGAG AGCTGGTATC ATTGCCGCAC TGGTGAAAGC GAACGTCTAC
TATGCTACAA GACAGGTATC CGCTCCGGCT GTCGCCGTTC GTAACGTTAC GATCTGTAGC
GGTAATACAG CGACGCTGAC AGCAACAGGC AGTGCTGTTT CTTCACTTGA ATGGTATACA
CAACCAGTGG GTGGTACGAA AGTAGGTGAT GGCGGAAGCT TCACTACACC ACAGCTGACG
GCTACTACGA CTTATTATGT ACAGAGCGTA CGTACAAGCA ATAATTGCGC GAATCCCAAC
AGGGTATCTG TCACAGTAAG TGTGGTGCCT GGTCTGGTAA CGCCGACTGT CACCAACGCA
ACTATCTGCG CGGGCCAGCA GGCAACCCTT ACAGCAACTG TAACAGGTCA GAACATCCAG
ACCCGTTGGT ACAGTGCACC AATAGGTGGT ACACTCCTCT TTACAGGTAC AACCTATGTG
ACGAATGCAC TGAATACAGA TACTGCATTT TATGTAGAAA CAGGTAATGG TTCCTGCATA
CTCTCTGCAA GAGTAAGGGC AACCGTAAGC GTAGGTGCAG CAGCTCCGAC TCCTGTATTG
GAAGCACAGA ATGTCGATAT CTGTTCAGGT AGTACTGCTA CATTCCGTGT AGTATCTCCG
GCAGCAGGTG TCACCTACAG ATGGTATACA GCGCTGACTG GCGGTACGCC GGTATCAACA
GGTGCTACCT TCACTACAGG CGCCCTCACA GCGACTACAG TTTACTATGT AGAAGCAATT
AATAATGCAT CACAATGTGG CGCTGCCAGT GCAAGAGTCG CTGCTACTGC AAGTGTGGCC
CTGAATCCGG GTACACCTGT ATTGCAAACG GCAAGTGTAC AGGTTTGTGC CGGTCAGGAC
GCAACCCTCG CCATTCTGAA TCCACAGGGC ACCCTTACCT ATCAGTGGTA TGATGCCGCT
ACTGGCGGTA CACTGTTAGC TACCGGTCCG ACTTTCGTGG TAAGAGCTGC AAACGCGAGT
GCAGATTACT ATGTACAGGC AGTCAACAGC AATGGCTGTA TCAGCACCGG CGTCCGTGCA
AAAGCAAGTG TGGTGGTAAC ACCAGCTCCG GGTACGCCAA CAGTGGTCAG CACTGCTGTG
AATATCTGTC GTGGTGCAAC TGCGGCACTG GCTGTACAAA ATCCGAATAA CAGCTTTACC
TATCGCTGGT ATACTACCGC TACCGGTGGT ACAGCTGCAG GTACAGGCGC AACCTTTACA
ACGCCTGTTA TCAATGCAGA TACTGATTAT TATGTGGAAG CTACCAGTGG TAACTGTAGC
AGCGCTGTAA GAGCAAGAGT GAGTGTGGTG GTAAGCGATC CTGCGCCTAC TCCGACCCTG
GAATCCGCCA ATCTCTCTGT ATGTACAGGT GCGGCTGCAA CCCTGCGTGT AACTTCCCTG
ACTACAGGTA TTACCTATAA CTGGTATACT ACGGCTACAG GTGGCACACC GGTATTCTCC
GGTCCTGAGT TCACAACAGC GCCGCTGACA ACTACCACTG TATACTATGT AGAGGCAGTG
AATACCGCCT CCGGTTGTGG TGCTTCCGGT GCAAGAGTGT CCGCTACAGT AACTGTAGTG
CCAAGACCAG TTACTACTGC TGTGGTAAGC AACAGTATAG ATGTATGTTC AGGTCAGAAT
ACGATCCTGT TCATACAGGA TCCGCAGGAT AATCTGGCTT ACCAGTGGTA TGACGCTCCT
ACCGGCGGTA CGCTGGTATC TACGGGTCCG GTATTCGTAG TATATGCGAT AACCAGCAAT
ATCACCTACT ATGTGCAGGC GGTAAATGCA AATGGTTGTG CAAATGCAGG CGCCCGTGTT
GCTGTAGCAA TCAATGTTAC ACCAGCCCCT GCTACACCGG TGACGGCTTC AGATGTGACA
GCATGTCCGG GTACAACCAT TGATCTGGCG GTACAGAATC CGAATGCAGC ACTGACTTAT
AACTGGTATA CTACCGCTAC TGGTGGTACG GCAGCAGGCA CAGGTGCCAC CTTTACAACG
CCTGTCATCA ATGCGGCTAC TACCTACTAT GTGGAAGCAA GCAATGGTAA CTGTAGCAGT
GCGACAAGAG CGGCTGTTAA CATTACACTG TCCAGCGCTC CGCCTGTTCC GACCCTTGAA
TCCAATAATG TAAATATCTG TACAGGTGCC TCCGCAACAT TACGTGTGAC ATCCAGTACA
ACAGGTGTGA CTTATAACTG GTACACTGCA GCAACAGGCG GTACACCTGC CTTCAGCGGT
CCTGAATTTG TAACGCCAAA CCTGACGGCA AGTACTACTT ATTATGTACA GGCGGTTAGT
ACCAATAGTC AATGTGCGGG AACAAGCGCA AGAGTCGCTG TGACAGTAAC AGTCAATCAG
ATCCCTGGTA CACCGGTACT GACAGCTGCA AACGTAAGCA TCTGTGCTGG TCGGGATGTG
ACGCTGTCAG TACAGAGTCC GCAGACAGGT GTAGACTACC AGTGGTTTAA TGCAGCGACC
AACGGTACGC TTGTGTTTAC CGGTAACAGC TTCACTATCA CGGGCGTGAC GGCTACCGCG
AACTACTATG TACAGGCTGT AAATGCAGGT GGTTGTGTGA ATGCAGGCGC CCGTGCAACA
GCAACGATCA CAGTTACGCC GGCACCGGCC ACACCGGTAA CCGCGTCTGC TGTCAATACA
TGTCCAGGTA CAACAGTTGA CCTGACTGTA CAGAATCCGG ATGCAGCACT GACCTATAAC
TGGTATACTG CCGCTACGGG TGGTACCCTG GCTGGTACAG GCAGCACGTT CACTACACCA
GTGATCACAG CGCCGACTAC CTACTATGTA GAAGCGACCA ACGGTAATTG TAGCAGTGCG
ACAAGAGCGG CTGTAAGCGT GACAGTGTCC AGCGTTCCGC CTGTTCCGAC CCTTGAATCC
AATAATGTAA ACACCTGTAC AGGCGGTACC GCAAGACTGC GTGTCACCTC CTCTACAACA
GGTGTAACCT ATAACTGGTA CACAACAGCA ACAGGTGGTA CCGCAGTATT CAGTGGTCCT
GAATTCGTAA CACCAAACCT GAATGCAAGC ACTACCTACT ATGTGGAAGC TGTCAGCACT
AACAGCCAGT GTGCTGGTTC CAGTGCAAGA GCAGCTGTTA CGGTAACTGT AGGTCAGTCC
CCTGATGTGC CGGTACTGAC TGCCGCAAGC GTAAGAGTAT GTGCGGGTCA GGATGTAACG
CTGTCAGTAC AGAGTCCGCA GGCGGGTATC GATTACCAGT GGTTTGACGC AGCGAATGGT
GGTACGCTTG TATTCACAGG CACTACGTTC ACCGCAACCG CTGTAACGGC AAATGTCAGC
TACTATGTGC AGGCTGCTTC AGGTACTACC TGTGTAAGTG CAAGCCGCGC AACAGGAAGC
ATCGTGGTAG ATGCTGCTGC GCCAACGCCG GATGTCGTTT CTGCAAATGT GGTGACTTGT
GTAGGCGGTA CGGCTACTCT CAATGTACTC AACCCGGATG CAGCGCTGAC CTATCGCTGG
TACGATGCGC CGGATAATGG TACCCTGCTG GCTACCGGTC CTGAGTACAC CACTACATCG
CTGAACGGTA ATACTACCTT CTATGTGGAA GCCCTGAATG GTTCCGGTTG CAGCAGCCAG
GCAAGAAAAG GCGTGACTGT CACCATCGTG AATACGATTG ATGCGCCGCT GGCAGATGGT
GCGACGATCT GTGCCGGAAC TTCTGCCCTG CTTTCTGTGA AGAATGCGCA GGCTGGTATC
AGCTACAAAT GGTACGAAGC TGCAATAGGT GGTACTGCCG GCTTCACCGG TGCAGAGTTT
ACCACTCCGC AGCTGAATAC AAGCATGACT TACTATGTGG AAGCATCTTC CGGTGGTTGT
GTGAGCCAGA GCCGTACGAT TGTACAGGTA ACTGTGAATA CTACGCCTAC TGCTCCTGTA
GTGGCAAGTG CAAGTGTAAC GGCTTGTCAG GGTCAGACAG CTACGCTGAG CGTACAGAAT
CCGAATGCGG CCCTCACCTA TCGCTGGTAC ACCACTCCGA CCGGTGGTAC AGCGGCTGGC
ACAGGCAGCA CATTTATCAC TCCTCCAATT AATGCAAACG TCACATATTA TGTAGAAGCA
CTAAATGCAT CTGGTTGTGC AAGTGCAGCA CGTACCACAG TCAATGTGAA TGTAGGTGCG
CCGGCGAATA ACGCCACAGT AACCGGCAAT GAAGCTGGTA TTTGTCCGGG TGCTACCGCA
ACACTTACTG CGTCTTCAAC AACACCAAAT GCAGGCTTCC GCTGGTATAC AACAGCAACA
GGTGGTACAG CAGTCGCTAC AACGGCAGCA TTTACCACAC CAGCACTGAA TCAGAACACT
ACCTACTATG TGGAAGTAGT AAGCGCCGGT GGTTGTACCA GCAGCAGCAG AATAGCGGTA
CAGGTGAATA TCCTGGAAGC CCTGGATGCT CCGGTTGTAA CTGTCAGCGA AACAACACCA
ACACAGGTGA CCTTCCAGTG GGCGGCTGTT CCAGGTGCAG TATCTTATGA GGTAACACTT
GACAATGGCA TTACTTATAT CGTTCCAAGC GCTGGTGCTG CGGGTCTCAC ACATGTCGTA
TCGGGTCTGA CGCCTACGCA GTCAGTAACT ATACGTGTAA GAGCACTGGG TGATGCTGAT
TGTGAAACCA GCGCACTCTC TGCAGCGGTG ACCGGTAAAG CGGAGAACCC ACAGGGTAAC
AAGATCTTCG TACCGAACCT CTTCACGCCA AACGGTGATG GCTTCAACGA TGTACACTAT
GTATACGGCA ACACAATTGC CAACGTGGTG GTGAGATACT ACAACCAGTT TGGTCAGCAG
ATCTTCGAAA CAAAAGATCA GCGTACCGGA TGGGATGGTA CAATGGGTGG CCGCCAGCAA
CCGGTAGGTG TATATATCTG GGTGCTTCGC GCTACGCTTC AGGATGGTTC AGTTGTTAAC
ATGAAGGGAA CCGTCACTAT CGTACGCTAA
 
Protein sequence
MHFKATPKSP LRAFILIFFC LVWLVGLPVG KASYKKLPVT KAVPKDGAIS RLDNYLLHHP 
YAPLLPNAWR NAGAADGPLW SYAGSQSFVT FGLACALCRV DDGANAIDAN PNTAATLVLP
VGAAGGVGLK LKFSGSYQAG DQVAFDLEIP DQIYSQQLLS ALSVTSFNGG VSNNDATPLN
SSQIRLDLLG LGLGSTPKFR VTAPVTHAFD EVQISLSTLV STFTSLRVYE AAAFIPVTVS
PANPAITSNA TVTFSPSIRI PNATYSWYTT PEGGTPVFNG AGFTTPPLKR STTYYVAATN
PLDGLVSPVR TPVTVRVSGG VGPIWTYADQ QVSPITGGIA CALCYVDNPA AAVDADTTTA
SMLQLPVGAL TAVGQLLKFP GDYKAGDVIV LDVDIPGQIV SLGALSAIQI QTFNNDVANN
DVINLGATTV GVNVLGLGLG TSPKVRLTIP VTKDFDAAQV SLTTAFTAFG SLRIYEAVAT
IPVKVSPAAP LITAGSSVTL SATTDGRIAS PVYRWYTTPA GGTPVATGNS FPTPMLNRTT
TYYAEAYSAA DNLSSYVRTP VTVKVAGGPG TIWSYGQEED GPFTSGVACA ACAISTPEAA
ADGDTTTAST LTVPLGLAAY VGQLVKLPGV YQAGDSIVLF LEAPTENLVA VVLPKVRVTT
FNNSIAGPAV SNNDAVTLDA PTVKLQLLGA GLNNARKFRV TIPATKTFDG VQVDFGGLVG
ASGSLKLYEV AAMIPVSVLP NPAKTPYNTG VTLTPSIRIT NPTYNWYTTP TGGSPVFTGS
GAFITPALIR NTTYYVEAKD PAGTASLVRT AVPVTIGGGT GPLWTYGTGQ TGPITGGVAC
ALCTITDPVF AADGDSTTAS RLSLPLGIAS TVGQKINFPG IYHSGDSIIL ILGSKPGFLA
DASLLGSIRI TTSLNNVSNN DPQTLNNPLL KVNLLQTTAG ISKFRVAIPV SKTFDAAQVD
ISSLLAVDNS LYIYEAIAMT PVTVTPSPAT ITAGQTATLN ASLPSIPGVI FNWYETKEGG
SPVHTGNSLT TPPLFQDKTY YVEAVSPTDG LISITRTAVE VDVNGATGNG PLSCSGATTE
SSGTGGLACL LCGTQNAALA VDNNTATAST IRLGVGALGY AYQDVVFPFK GKAGDSVRIG
LGTTNGLLDL GVISGIGVGL GNGARPTDAE MAGLSSPLLT IRLLDGVQQN AYTFVANKDF
DRIEIRVNAV VGALTSLNLY YAQVVTPIVQ PAVATAYVCT GSPATLSVVA PTGYTYRWYT
AYTGGSPVGY GATFVTPAIT KDTTYFVEAA GADSCGSERR TPVQIKTGLP GVTVTPSSAS
VEEGTTPTFN IVSPNPTYQY NWYSAPTGGT PVFVGTQFTV PPVTGNVTYY AEAVAQGNTN
CRSLRTPVSI TLNGDGGPSN PGDIDCGGAT SQQSITSGIC VGCYVEKQDS AVDNSSQTAS
IIHTILGVGA NIQQSLIFPA PGVKGDSIRI KLGFTTGLAD LNALAGIQIS SSNGGTLNAD
QVTLNAGTLN LQLLNGNRDL VYSFAPGAAF DRVNIKLNGL ATALTALKVY SAQIYAGTPT
VEKDTVYICQ GTTGTLRATG PGTTFRWYNQ PAGGTVLGTG ATFQVSDMTN AIYYVESISS
AGCVNPVRKP VYVIVGLPQP LVSPTVRTIN AGQTATFTVT SPNPAYQYTW YDAPAGGNVV
QSNSSTFTTP ALSAAAVYYV EVKDPSNNCT SSARTRVQVD INLPTEPTPC SYAKQQVSPV
ISGVCLLCSV ADPALAVDEN SNSASTITAT VSALGYVGQL LQFDNTYPAG DSVTLDLEIP
GQLADVTLLG GIRLETYNGS TPNADAVFLN NPTVHLTLLN TGNKFRVTLP VSKAFNGVMI
SINGVLAALT SVKIYFAAVV TPRPVVTVAS VDVCSGSTAT LNATTANGAD LAWYAAAVGG
TALQTGPTYT TGALTASATY YVAAGRFGCA NPTRVPVRVN VGAAPAAPTA AGRSVCTGSP
ASLLATAPAG ATFRWYTAPT GGTLLSSTAN YTTNALTADT AFYVEADNNG CKSVTRTRVP
VTVSPAPANL TVTPLNTTVS VGQGAIFTAF ATGTNVIYKW YNAAGDSIYT GAVFNTGPLT
ATTTFSVVAV NTSGCISGPR VSVTATVVPG GNDIPCDAAT SEQHTSNGVC VGCFVENPAL
AVDNSTATKS TLHVALGLLN GYVQQSLVFP QISELNDSTV IGLSFDASLA DIGLLSTVEI
GSYNGATSNN DFVSLNSPLV KVALLGGSQQ ALVGFKPKAL FDRIVVRLNS GVATALSAVS
VNFASRVVGL PVVQGDTICA GNRANLTASG PANVSFRWYT TATGGTAIFT GTAYQTPALT
ANTTYYVEAV KTSLNCPNLQ RVPVTAIVDP VPDAPALDTT ALTICSGSTA TFNVKPVAGI
TYRWYTALTG GTAFFTGTSY TTPALTATTV YYIEASNATG CATTTRTRVT ANVIDQPAVP
VVTPTSASIC ANNSTQLVAT SATPGVIFRW YTTATGGTSV FEGASFQTPV LTATTTYYVA
AVTGACSSAS RTAATVTVNA VPAAPTVTTV PANGQVVSGQ TATLTASSTT PGVTYAWFTV
ATGGSSVATG PTFTTPALTS NITYYVEAVA VAGSCPSQRT AVPLTVTVAP NTACDFANAQ
TNSTTAVCVL CSVQDAANTT DADINNFSIL SVPLAAGSGS VQQSLIFPDA AAAGDSVRIV
LELPAQVVDA GLLSSLEVSS FNGANPNNDA VLLNNSSVSV RLLTGSSKFT VAFAPGGTYD
RVQVRLRAGI IAALVKANVY YATRQVSAPA VAVRNVTICS GNTATLTATG SAVSSLEWYT
QPVGGTKVGD GGSFTTPQLT ATTTYYVQSV RTSNNCANPN RVSVTVSVVP GLVTPTVTNA
TICAGQQATL TATVTGQNIQ TRWYSAPIGG TLLFTGTTYV TNALNTDTAF YVETGNGSCI
LSARVRATVS VGAAAPTPVL EAQNVDICSG STATFRVVSP AAGVTYRWYT ALTGGTPVST
GATFTTGALT ATTVYYVEAI NNASQCGAAS ARVAATASVA LNPGTPVLQT ASVQVCAGQD
ATLAILNPQG TLTYQWYDAA TGGTLLATGP TFVVRAANAS ADYYVQAVNS NGCISTGVRA
KASVVVTPAP GTPTVVSTAV NICRGATAAL AVQNPNNSFT YRWYTTATGG TAAGTGATFT
TPVINADTDY YVEATSGNCS SAVRARVSVV VSDPAPTPTL ESANLSVCTG AAATLRVTSL
TTGITYNWYT TATGGTPVFS GPEFTTAPLT TTTVYYVEAV NTASGCGASG ARVSATVTVV
PRPVTTAVVS NSIDVCSGQN TILFIQDPQD NLAYQWYDAP TGGTLVSTGP VFVVYAITSN
ITYYVQAVNA NGCANAGARV AVAINVTPAP ATPVTASDVT ACPGTTIDLA VQNPNAALTY
NWYTTATGGT AAGTGATFTT PVINAATTYY VEASNGNCSS ATRAAVNITL SSAPPVPTLE
SNNVNICTGA SATLRVTSST TGVTYNWYTA ATGGTPAFSG PEFVTPNLTA STTYYVQAVS
TNSQCAGTSA RVAVTVTVNQ IPGTPVLTAA NVSICAGRDV TLSVQSPQTG VDYQWFNAAT
NGTLVFTGNS FTITGVTATA NYYVQAVNAG GCVNAGARAT ATITVTPAPA TPVTASAVNT
CPGTTVDLTV QNPDAALTYN WYTAATGGTL AGTGSTFTTP VITAPTTYYV EATNGNCSSA
TRAAVSVTVS SVPPVPTLES NNVNTCTGGT ARLRVTSSTT GVTYNWYTTA TGGTAVFSGP
EFVTPNLNAS TTYYVEAVST NSQCAGSSAR AAVTVTVGQS PDVPVLTAAS VRVCAGQDVT
LSVQSPQAGI DYQWFDAANG GTLVFTGTTF TATAVTANVS YYVQAASGTT CVSASRATGS
IVVDAAAPTP DVVSANVVTC VGGTATLNVL NPDAALTYRW YDAPDNGTLL ATGPEYTTTS
LNGNTTFYVE ALNGSGCSSQ ARKGVTVTIV NTIDAPLADG ATICAGTSAL LSVKNAQAGI
SYKWYEAAIG GTAGFTGAEF TTPQLNTSMT YYVEASSGGC VSQSRTIVQV TVNTTPTAPV
VASASVTACQ GQTATLSVQN PNAALTYRWY TTPTGGTAAG TGSTFITPPI NANVTYYVEA
LNASGCASAA RTTVNVNVGA PANNATVTGN EAGICPGATA TLTASSTTPN AGFRWYTTAT
GGTAVATTAA FTTPALNQNT TYYVEVVSAG GCTSSSRIAV QVNILEALDA PVVTVSETTP
TQVTFQWAAV PGAVSYEVTL DNGITYIVPS AGAAGLTHVV SGLTPTQSVT IRVRALGDAD
CETSALSAAV TGKAENPQGN KIFVPNLFTP NGDGFNDVHY VYGNTIANVV VRYYNQFGQQ
IFETKDQRTG WDGTMGGRQQ PVGVYIWVLR ATLQDGSVVN MKGTVTIVR