Gene Cpin_3622 details

Gene Information       Plasmid Coverage information       Fosmid Coverage information       Sequence       

Gene Information

Locus tagCpin_3622 
Symbol 
ID8359789 
TypeCDS 
Is gene splicedNo 
Is pseudo geneNo 
Organism nameChitinophaga pinensis DSM 2588 
KingdomBacteria 
Replicon accessionNC_013132 
Strand
Start bp4517124 
End bp4532060 
Gene Length14937 bp 
Protein Length4978 aa 
Translation table11 
GC content47% 
IMG OID644965791 
Productconserved repeat domain protein 
Protein accessionYP_003123285 
Protein GI256422632 
COG category 
COG ID 
TIGRFAM ID[TIGR01451] conserved repeat domain
[TIGR01965] VCBS repeat 


Plasmid Coverage information

Num covering plasmid clones
Plasmid unclonability p-value
Plasmid hitchhikingNo 
Plasmid clonabilitynormal 
 

Fosmid Coverage information

Num covering fosmid clones
Fosmid unclonability p-value0.00000013093 
Fosmid HitchhikerNo 
Fosmid clonabilitydecreased coverage 
 

Sequence

Gene sequence
ATGGTAGAAT TTTACTGTCG TGGCCTTCTC AGGAGGCTGA AAATCTGGTG TCTGCTAATA 
ACAGCAATCA TCTTCACGCG CACTGGTGCG AGGGCAGAGG GTAGTAAAGA ATTGAATCAG
AGTGGTGGTT ATCGTGCTTA CCTGAACTCG GCTTCTGCTA CAAGCGTGAA TAATCTGTTT
CCAACCATGG GAACGATGAA GGTGTATGTG AACGTAGGCG AGCGTATTTT CGTCGGATCC
AGTGCACAGG GTATTGGTAG TGGCACCATC AACCTGCGTG CTCCTAACGG TGTAACGTAC
ACGACAGGTA CGAGCACCAC GACAGGACGT ATCAGTAACC GTACGCAGGA GGTGAATGGT
CCGAATGTAT TGACGTTGAC GACAGGATAT ACCCCAGGAA TTTTTACGGT AGGCGCCGGA
CAGGCGGGTG TTTGGGAGAT TGATTTCGTA CCTCCGAATG CAGCGGCAGC GAATAACCCG
ACAGCAATTG TCTCTACCGG CAACTGGACA CAGCCTACCG GTACTTCCAT GATCGCCGCA
TTTGACGTAA GTGTGAGAAA TGCTGCGAAT ACGGCGTTTG TTCCGGGGCG TCTTTATACA
AATATTTTCA CTGCCAACCT TGGCGCTGCC AATGCTACTT TTAATGCGAT TTTAAGAGTA
CTGACGAATG ATGGTTACAT TTATACCGTT AACAACAATG GTCAGGCCGG TTTCGGTTTT
TCCTTCGTCG CTAATAACAA AGGCTTCCGT ACAACTACTG GTGATCCTTC TTATAAAAGC
GTAGACGATC TGACCAACCT GCGTCTGAAA GATCCCCGTA CTGCTGATAC GGAAACGGAT
ATTACGCACA AGATCTTTTT CAATACACCT GCTGTAGATC TGCCCGCAAG CGCACCCAGC
GTCTCGGGCA CAACGTGGCT CTTAACCACA CCTCCGGTCA TCTCTGCCTC TATCCTGACA
TTTACCGGGG TAGAGGGGAC CCCGGGGGTA GCGGGAACGA GTCCCGCAGG GGGAAATATT
ACTTTCACCG CTACATATGC TGCAAACTAC GCCGTTGATA TTGACATCAA CGGCAATGGT
GTTTATACGG ATGCAGTAGA CCGCCGTCTT ACAGGAAGTG CGGTAGTGGG AACTAATAGT
GCTTACTGGG ATGGTAATAA CGGGCAGGGC GTAAAAGTAT TATCTGGCAC AAATACCTAT
AATAGCCGTG TTGTTCTGTT TGCAGGCGAG GTCCATTTTC CGTTTATAGA TGTGGAGAAT
AACCCGACGG GTATTATTAT CACACGTACA AACGGATCAG GTTCACCCAG TGATATCGTC
TACTGGGATG ATTCCCAGCT GACTGTCAAT GGTACTCCCT CAAATCCTAT CAGTACTGCC
ACTACAGGTA TATCCAGTAC AACCAATGGG CACAAGTTTG GTTCCACTGC TTATAGTGGT
ACTGACTTCG GTAATGAAAA TGGTATCGAT ACCTGGTCTT ATCTGACAAG TACACCGACA
GCCACACCGT TGATTATTAC ACTACGCGAA GCGGACCTCG AGGTGGTCAG TATTACTAAA
TCTAATGCTA CTCCTTGTCA GGGAGCAACG GTGACCTATA CGACGGCTGT CAGGAACAAT
GGGCCAAATA ATGTAGTGGG GGCCATATAT GAGTTCAATT TTCCCGCGAA TCTGACTAAT
GTAACGGTAA CGCCAACACT GACAAGTGGC GTTGCTGTGG TAACTGGTGG TACTACTACT
GCAACACAAT ATACTGCTAC ATTATCCATG AACAATGCAG CAGTTGTTAC CTTTACGATC
ACTGGTACAA TCTCTTCTTT TCCTACAGGT GGTACACTCA GTGTAACATC TGCTATCATG
CGTCCTCAGG ACGTTACGGA CCCGGATGCA ACGAATCCTG ACGCCGCAGT TCCTACTGAT
CCACAGTCGG AATGTGATGC CCTGCCCTCT GGTGTAGGAT GTAACAACAT CAAAACAGAT
GCGACTACGG TGTCACAGAC GCCGACTGCT TCAGTAGCTG GTCCTGCGCA GACATTGTGT
GCCGCTACCT CTGCTACACT GGCAGCGAAT ACGCCTACTG TGGGAACAGG TATATGGTCG
CAGGTCAGCG GACCCGGAAC AGCTGTGATC ACTAATACCA GTTCGCCGAC ATCTACGGTG
ACAGGTCTGG TAACCGGTAC ATATGTTTTC CGTTGGACCA TTTCTAATGG TAGTTGTACG
CCAAGTACCA GTGACGTGTC TATTACGGTC CAGGCAGCTT TAGCGGGCAA TACGATTACT
GCGCCTGCTA CGACTACTTT CTGTGGATCG GGGGACCCGG CAATTATTAC CGGTTCTACC
CCAACAGGCG GCAATAGTTC GTATACCTAT CAGTGGCAGC AATCCACAGA TAATACAACT
TATACAAATA TCAGCGGCGC CACCGCGCAG TCGTATGACC CGCCTGTACA GAGCACGACC
ACTTATTTCC GCAGACTGAT CACGTCCGGT GCATGTACAA CAGCTAGTGC AAGTAATGTG
GTGACCGTCA CTATTCAGTC AGCTATTACT AATAATACAA TTACTGCGCC TGCGACAACC
ACATTCTGTT CCACCGGTGA TGCCGCTATT ATTACAGGCG CAACGCCGGC CGGTGGTAGT
GGTACGTTTA CCTATCAATG GCAGAGCAGT ACAGATAATA CCACATTTAC TAATATAGCG
GGAGCTACTG CATTGTCTTA TGATCCGCCG GCAACAAGTG CGACTACGTA CTATCGTCGT
CAGGTAACAT CAGGCGCTTG TTCCAGTGCG AGCACAAGTA ATGTGGTGAC CATCACAATA
CAGGCTGCGC TCACAGCCGG CGCTATTGCC GCCAGTCAGG AGTTCTGTGT ATCCGGTGAT
CCGGTAGCAT TCACACAGAC AACAGCGCCT ACTGGTGGTA GTGGTACTTA TACCTATCAG
TGGCAAAGTT CCGTTACAAG TGCAAGTACA GGGTTTACAG ATATCAGTGG GGCTACCGCC
GTAGTCTATG ATGCCGCCGC TATCAATCAG ACAACTTATT ACAGAAGAAT CACCCGTTCC
GGTGTTTGTT CGGATGTGAT CAGCAATGTA TTGACAGTAA CGGTAAACGC TGCGTTGACA
CCAGGTGTGA TTGCAGGTAA TCAGACCTTC TGTACCAGTG GAGATCCGGC TGCATTTACA
CAGACAACAG CGCCAGCTGG TGGTAACGGA ACATTTAGCT ATCAGTGGCA AAGTTCTGTA
ACCAGTACGA CGGCAGGTTT CTCTGATATT GCAGGAGCTA CTGCTAATAT ATATGATGCG
CCTTCTTTGT CGCAGACCAC TTATTTCCGC AGGATTACCC GTTCAGGTAC CTGCGCAGAT
GTTACTTCCA ATGTGCTGAC TGTAACAGTG AATCCTTCTC TGTCTAATAA TACTATAGCT
GCATCCCAGA CCATCTGTAG CGGCTCAACA CCGGCGGCAT TAACGGGCAG TACACCAGCA
GGTGGGAATG GTACTTATAC TTATCTTTGG GAAGTGAGTG TTAGCGGTGG TGCATTTACT
ACTGCACCAG GCACAAGCAA CCTGCAGAAT TATACACCAT CGGCACCATT GACACAGACT
ACCCAGTACA GAAGAACAGT TACTTCTGAT GGTTGTGCTA CCAGTCTGAG TAATGTGATA
CAGGTAACTG TGAATGGCAG CACGACTGTT TCAAATGCCG GACCTGATCA GGGACCGTTA
AACGCGACAA CAGTAACGCT GGCAGCCAAT GCGCCTGCTA CCGGTACTGG TACCTGGACA
CAGGTATCTG GTCCTAATAC GGCGAATATT GTCAATCCTT CGGCAAATAA TACAAGTGTT
ACCGGACTGG TTGCTGGTAC TTATACTTTC CGCTGGACAA TCACCAACCC TCCATGTACC
CCAAGTACAG ATGATGTACT GATCATCATC AATACAGCTC CGGTTGCTGG TAATGATGTC
GTCACCACGC CGGAAGATGT TGCGGTAAAC ATCAATGTAC TCAGCAATGA TAGTGATGTG
GATGGTACAT TGAACACCGG TAGCGTAGCC ATTGTTAATC AACCTACACA TGGTACTGTA
AGCGTAGCGG CGAATGGCGT AGTGACCTAT ACGCCAAATG CTAATTATAA TGGTACTGAT
GTATTTACTT ATACCGTAAG AGATAACCTG GGTACTATTT CCAATACAGC TACTGTTTCT
ATTAATATTA CGCCGGTGAA TGATCCTCCG GTAGCGGTGG ACGATGATAT CAACCTGACG
GAAGATATAA CCGTTACTAT TCCTGCGCCT GGTGTGCTGG GTAATGACTA TGATCCGGAT
GGCGATCAGC TGACAGCAGT GATCGTAACA CCGGTGACAG TTGGTACCCT TGTTTTAAAT
GGTAACGGTT CGCTGACGTA TACACCACCG GCTAATTTTA ACGGCATTGC TACTTTCACA
TATCGTGTGT GTGATGGTTC CGGCGCCTGT GATACTGCTA CGGTACGACT GGAAGTAGGT
AATGAAAACG ATGCGCCGGT AGCAGTCAAC GATAGCTATA CTGTAGATGA AGATACTCCA
CTGGACGTAG CTGCTGCAGG TGTCTTATCC AATGATACAG ACGCTGATAA TGATGCCTTG
AGCGCGACCC TGGTGACTCC TCCTGCGAGT GGTACCCTGA CACTGAACTC AAATGGTTCT
TTCCGTTATG TACCGGCACC TAACTTTAAT GGTGTTGTTT CATTCGTATA TTCCGCCTGT
GATGCAAGCG GTGCATGTAG CAATGCTACT GTAACAATTG CAGTAAATAG TGTAAACGAT
GCACCTGTCG CCAATGATGA TGCATACGTT ACTGATGAAG ACAAGGTGCT GGATGTGGTA
GTGCCTGGTG TATTAAGTAA TGATGTTGAT GTTGATGGTA ATACATTGAC AGTAAGTCTG
GTGACTACTC CTGCAAGCGG CACTGTAACA CTCAATCCGA ATGGACGTCT TATTTATACA
CCGGCACAGG ACTTCAACGG TGTGGTGAGC TTTATTTACC GCGCCTGTGA TAATGGTACA
CCTCAGTTAT GCGATACCGC GTTGGTAACA ATTACAGTAA GACCGGTGAA TGATACGCCG
GTTGTCGCCA ATGACACCTA TACCCTGAAT GAAGATACAC CGCTTAATAT AGCAGCGCCT
GGTCTGCTGG CGAATGATAC GGATGTAGAC GGCAATACGC TGACTGCATC TATTGTGACA
AATCCGGCTC ATGGTACTGT GACCGTGAAT GCAGATGGTA GCTTTATGTA TATGCCGGCG
GCAGACTACA ATGGTACAGA TGTATTTACT TATAAAGCCT GCGATGGAAG TGGCGCTTGT
GCTACCGGTA CGGTAACATT GACTATTACA GCCGTAAATG ACGCACCAGG TGCAGGAGAT
GTGAGCTTCT CTGCAAGAGA AGATATTCCG TTGACTATTA ATTCTCCGGG ATTATTGGGT
GCGAGCACTG ACAAGGAGGG AGGTACCCTG ACAGCAGCTA TTGTTACACA ACCCGCGAAT
GGTACTATTA CTGTAAATCC GAATGGTAGT TTCACCTATA TACCAAATCC GAATTTCAAT
GGAACAGACG TCTTTACATT CAGTGTATGT GATAATGGTA CACCACAGCT GTGTGATACG
GCCACCGCAA CCATTTCTGT AGCTGCAGAG AATGATGCGC CTGTTGCGGG TGATGATACT
TATAATGCGA CAGAAGATAC GCCATTGACA GTGGCAGCGC CGGGTGTATT GTCCAACGAC
ACAGATCCGG ATGGCGATCC GCTGACAGTA GCTGTACTGG CCGGACCTGC AAATGGTACC
CTGACATTGA ATCCGAATGG TAACTTCACC TATACGCCAA GAAGCAATTA TAATGGTACT
GATACTTATA CCTATCGGGT ATGTGATGGC AATGGCGGAT GCGATACAGG AGCCGTCACC
ATTAACATCG CGGCCGTAAA CGATGCACCG GTTATCGGAC AGATCGGTTA CACGGTGACA
GAAGATGTAC CATTGACTGT AAATGCACCG GGTGTATTGT TTAACGATAC AGATCCGGAT
GGCGATCCAT TAACAGCCGT CTTACAGACG CCGCCTGCTC ATGGTACGCT GACACTGAAT
CCGAATGGTA GCTTTACTTA TGCACCGGCA GCTAACTTTA ATGGTATAGA CAGCTTCCTG
TACAGGGCAT GTGATCCTTC CAATGCTTGT GCTACCGGCG TAGTAATACT GACAGTACAG
CCGGTAAATG ACAGACCGGT AGCGGTTGAC GACAATTATA CCACCAGTGA GGAAACTACA
CTGACCATTG CTGCGCCAGG CGTATTGGCG AACGATACAG ATGTTGATGG CGATGTATTG
ACATCAAGTA TACTGGGTAA TCCGGTTCAT GGTTCCGTAA CGCTGAACAG CAACGGCGCC
TTCGTATATA TACCGAATCC AGACTTCAAC GGCGTAGACA GCTTTACCTA CAGAGCCTGT
GATGGTAGTG GCGTTTGTGA TACGGGAATG GTGTCTATTA CAGTGACGCC GGTGAATGAT
ACACCACTTG TAGTGAACGA TGTATATACT ATCAGTGAGG ATAATGTACT GACGGTGGCG
CCAACAGGCG TACTATTTAA TGATCGTGAT AAAGAGGGAG ATGCGTTGGC GGCAAGTCTG
CTCGCGCCAC CATCCAGCGG TACAGTTGTA CTAAATGCCA ATGGAGGATT TGTTTACACA
CCTGCGCCAA ACTTCAATGG CACCGTTACA TTTACTTATC TGGCCTGTGA TAACGGCACC
CCAAGTCTTT GTGATACGGG TACAGTAACG ATCAATGTGA CACCGGTCAA TGATGCACCC
GATGGTGTTG ACGATGCGTA TACTTTACAG GAAGATGTAC CATTGACGAT AGCAGCGCCA
GGTCTGCTGG CGAATGATAC AGATCCGGAT GGCGATCTAT TGCAGGTAAC CGGTATTTTC
AGACAACCTG TCCATGGTAC CGTGGTTGTA AACGCCAATG GTAGTTTTAC ATACACTCCT
GCAAAAGATT ACAACGGTAC CGATCAGTTT GTATATAATG TCTGCGACAA CAATATACCG
TCCGCTTGCG ATACGGCTGT GGTGACACTC ACGATCAATG GAGATAACGA TGCACCGGTT
GCGACAGATG ACAACTATAC AACCCCTGAA GATGTTCCGC TGAATATTGC GGCTCCGGGT
ATCCTGTTTA ATGATACCGA TGCAGATGGC GATCCGTTGA CAATAACGGG AGTCGTGCTT
AATCCGGCGA ATGGTACCGT TACGGTAAAT GCGAATGGTG GTTTTGTATA TACACCTAAT
CCAGACTATC GCGGTCTGGA TACCTTTGTG TACAGGGTTT GCGATAACGC CGGCGGTTGT
GATACCGGTG TTGTGCGCAT TGTGGTGTCT CCTGTGAATG ACGCGCCAGT TACCTCATTA
GAGACATATA CCACACCAGA GGACGTGCCG CTGAATGTGA ATGCCTTCAA CGGTGTATTG
TCCAATGATA CGGATGTGGA TGGTGATAGT CTGCGGGTGA CACTGCTGAA CACCACAACA
CACGGTATGC TGACATTGTC ACAGGATGGC AGCTTCAGCT ACGTACCGGC AAGAGATTAT
AACGGTAATG ATTTCTTTAC ATATAATGTA TGTGATCCTT CCGGCGCCTG TGCCTCAGAT
ACCGCTTATA TCATTATTAC ACCGGTAAAT GACACCGTGA TTGCACGCGA TGATATCTTA
AATGGTGATG AGGATGTTGT GATTAACGGA GATGTATCAT TGAACGACGA TGATGCGGAC
GGAGATCCAT TGACTTTTAC ACTGCTTGTG CAGCCTGCAA GAGGTACGAT TGTATTTAAC
AGCAATGGTA CATTTACTTA TACGCCGACA CTGGATTCAA CAGGACTTGA TTCTGCCATT
TACCGCGTAT GTGATCCGTT TGGTGCGTGT GATACTGCAC GTATCTATTT CAATGTAGGC
GATGAAAATG ATCCGCCGGT GGCGAATGGG AATGCTTATA CGATGAATGA GGATGAGATA
TTGAATGTTG CTGCTCCGGG TATTCTGGCC AATGATACAG ACCCAGACCT GGGTACACAG
CTGAATGCTT CTGTAGTGAA TGGCCCGGTT AATGGTAGAT TGACGATCTG GTCGGATGGT
AGTTTCTCTT ATAAACCGAA TCCAAATTAT AATGGTACGG ATCAGTTCTC CTATAGCGCC
TGTGATGCCA ATGGGGCCTG TGATACGGCG ATTGTAAATA TTACAATCAA TCCGGTGAAC
GACGCACCTA ATGCAGTCAG CGATACGGTT ACGACGGATG AAGATACACC TGTGAATGGC
AATGTATTGA CAAACGATAC TGATCCGGAA GGTAATGAAC TGACAGCCTC CCTGGTATCC
GGACCGTCCA GTGGTACGCT TGTACTGAAT GCGAATGGTA CGTTTACTTA CACACCAGGT
ACTAATTTCA ATGGTACAGA CATCTTCCAG TACCAGGTAT GTGATGCTGG TCCGTTGTGC
GATACGGCCT TCGTAACAAT CATTGTCAAT CCGGTGAATG ATCCGCCGGT TACGGAAAAC
GATGCTTATA CAGTAGCAGA AGATAATACA CTTACTGTAC CGGCCGCTTC AGGTGTATTG
AGCAATGATA GTGATGCAGA TGGGGAAGTA TTGGTATCTA CCTTGGTCAC TACAACGAAC
GGTACGCTGA CATTGAATCC GGATGGATCA TTTGTATATC GTCCGAACCG TGACTTCAAT
GGCACAGATG GATTTACCTA TCAGGCATGT GATCTGAGTG GCGCATGTGC GCAGGGTTCG
GTGACGATCA CTGTTACACC AGTGAACGAT GCGCCTATAG CGGTAAATGA TTATTTCACA
AGGTCAGAGG ATACTGTGCT CACATTCCCA CCATCTGTTA TCCTGGCAAA TGATATAGAT
GTAGATGGCG ATGTACTGAC GGGCCGACCT ATTGGCAATC TCCAACATGG TTCTTATGTA
AGTAACCCTG ATGGTACGTA TACTTATACA CCGGCGCCAA ACTTTAACGG TTTGGATAGT
ATTCAGTATG AAGTGTGTGA CGGCGCGGGA TTATGTGACA CCGGTGTGAT TATCCTTAAC
ATTACGCCAG TAAATGACCC ACCAGTAGCC AATCCGGATG CATATGAAAC ACAGGAAGAT
GTGGTGTTGC AAATACCGGC TACTGCGGGT GTTCTGAGAA ATGACACGGA TCCGGATGGA
GATGCGCTTG TATCTACTAT TGTAGATCCG GCAAATGGTT CGCTGACGCT GAATTCTGAT
GGTTCATTTA GTTACAGGCC GAATCTGAAC TTCAACGGAC TTGACTCATT TAGTTATCGG
GCCTGTGATC TGGGAGGATT GTGTGATACG GCGAATGTGC GGATTACGGT GGTACCTGTA
AATGACAGGC CAATAGCTGT AAATGATTAT TTTGTAAGAT CTGAGGATAC GACTATAACG
TTCCCGCCAT CTGTGATCCT GGCGAACGAT ATTGATGTGG ACGGCGATCC GCTGACGGGA
AGACCTATAG GCAATCTCCA GAATGGTACT TATGTCGGCA ATCCAGATGG AACATATACT
TATACACCGG CGCCGAACTT CAACGGACTG GATAGTATTC AGTATGAAGT TTGCGATGGT
GCTGGCCTGT GCGATACAGG AGTGATCGTA CTTGAAATCA CCCCTGTTAA TGACAGACCA
GTGGCGCAGG ATGATCAGTT CTCTGTGAAT GAAGATGGCA GTCTGACAGT GAATCCCCCA
GGCGTATTAA GCAACGATGT AGATGTTGAC GGAGATCCGC TGGCTGTAAG TGTGCTCACT
ATTCCGGCAC ATGGAACGGT GACACTCAAC AGGGATGGTA GTCTTACGTA TACGCCTGCG
GCGAATTATA ATGGGTCGGA TAGTTTGTTA TACAGCGTCT GTGATCCTTC TGGTGCCTGT
GATACGGGTA TTGTGCGCTT CTCGGTGGTG GCAGTTGCTG ATCCACCTTT GCCGGGCAAT
GACGCTTATA CAACAAATGA GGATACCCAG CTGACTGTGG TAGCACCCGG TGTATTGGCG
AATGATACTG ATCCGGATGG CTTCCCGTTA GTGACTACAC TGGAAACTCA GGCAGTCAAT
GGTACAGTGG TAATGAATAG TGATGGGAGC TTTACATATA CGCCGAACGC AGATTTCAAT
GGTATAGACA GATTTACGTA CCAGGTTTGC GATACATCAG GCGGTACGAC ACAGTGTGCA
AGTGGTACGG TGACTATTAG CGTATTGCCG GTAAATGACG CACCTGTTGG TCAGCCGGAT
ATTTATGTAT TTGACGAGGA TAGTACTATT GCGATAGGTA CACCAGGCGT ACTGGCGAAT
GACCTCAACG TAGACGGCGA CGTGCTGACG GCTACAATTG TTACTACGGT GGCCCATGGT
CAGTTACGGC TGAACCAGAA CGGTGGATTT ACTTATATTC CTAATAAGGA TTACAATGGC
AGGGATAGTG CGGTGTATAA TGTCTGCGAT CCTTTGGGCG CTTGTGATAC GGCTAAGATC
CTCTTTATTA TTAATCCTGT GAATGACCGT CCTGTAGCAG TTGATGATCA GTTTACGAGA
AGTGAGGATA CGGTTATAAC CTTTACGCCG CAGGTAGTCC TCGTGAACGA TTATGATCCG
GATAGAGATG CATTACAGGG CCGGCCGATT GGTAGTCCTA TACATGGTTC TTATACTGCT
AATCCTGATG GTACTTATAC ATACAGACCT GATCTTAACT TCAATGGTCT GGATAGTGTA
CAGTATGAAG TATGCGATCC ATATGGCGCT TGTGATACAG GTTATATCAG ACTGACTATT
ACACCTGTTA ATGATGTACC AGTTGCACAG CCTGATTTCT ATCAGACAGA TGAGGACATT
GTACTGAGTG TACCGGCGCC AGGCGTGAAA GGGAATGACA GTGATGTGGA TGGAGACGAG
TTATCCATCG CTATCCAGAC GCCGGCATCC CATGGCCGCG TGACGCTGAA TGGTGATAAC
TCATTCCTAT ATGTGCCTGA TCCGAACTTT AATGGTATAG ATTCATTTAT ATACAGGGCC
TGTGATCCGG GAGGACTGTG TGATACTGCC CTTGTAACCA TTACTGTCAA TAGTGTGAAT
GATGCACCAG TTGCATTGGA CAATATATAT GCGTTGCCAG AGGATAGTCT GATGACCGGT
AATGTATTGG ATAATGATAC AGATCAGGAT GGCGATCCGC TGACGGCTTC ACTGATCTCT
ACTACGACAA ATGGTACTTT ATTATTTAAT GCGAATGGTA CGTTTACTTA TACGCCAGAT
CCGGGATATA ATGGTCCGGA TCAGGCTGTT TACAGGGTCT GCGATCCGGC AGACGCCTGT
GATACGGCAT TATTATCATT TATAGTAACA CCTGTGAATG ATGCGCCGTT GGCGGTAGAT
GATAGTGTCA GTGTTGCGGA GGATACACCT GCGACCGGTA ATGTGTTGAC GAATGACAGC
GATCCGGAGG GGGACGCTCT GACAGCGTCG CTGATAACAG CGCCGGTGAA TGGAATTGTA
GTGTTGAATG CAGATGGCAG CTTTACTTAT GCGCCAAATC CGAATTACAA TGGTGCGGAT
ATTCTGGTAT ACCGTGTTTG TGATAATGGT GTACCAGGTC TTTGTGATTC AGCGGTTGTG
AGGTTTACTA TTACGGCGGT GAATGATGCA CCTGTAGCAG TAGATGATAG TGTGAATGTT
ACAGAAGATG TACCAGCGAC AGGTAATGTA CTGTCTAATG ATACGGATAT AGAGGGTAAT
ACTTTGACGG CTTCATTGGT AACTGCCCCG GTAAACGGCA CGGTTGTGCT GAATGCGGAT
GGTAACTTCA CATATACACC GAATGCGAAT TATAATGGTC TGGATAGCCT TGTTTATCAA
GTATGTGACA ATGGGGTGCC AAGTCTGTGT GATTCAGCAG TTGTGAGGTT TACTATTACG
GCGGTGAATG ATGCACCGGT GGCTGTGGTG GATACTGTTA ATGTTATAGA AGATACGCCG
GTGACAGGTA ATGTATTGAC GAATGATATA GATGTAGAAG GTAATAGCCT GACAGCTTCA
TTGGTGACAG CGCCGGTGAA TGGAACGATC GTACTGAATG CGGATGGTAG CTTCACGTAT
ACACCGAATG CGAATTACAA TGGTTTGGAT AGCCTGGTTT ACCAGGTATG TGATAATGGT
GTGCCAAGCC TTTGTGATGG TTCTGTGGTA AGATTTACAG TAAATGCGGT GAATGACGCA
CCGGTAGCTA TTCCGGATAC TGTTGTGGTT ACGGAAGATG TTCCGGTTAC GGGAAATGTG
TTGACGAATG ATATAGATGT AGAAGGTAAT AGCCTGACAG CTTCATTGGT GACAGCGCCG
GTGAATGGAA CGATCGTACT GAATGCGGAT GGTAGCTTCA CTTATACTCC AAATGCAAAT
TATAATGGTC TTGACAGCCT TGTTTATCAA GTATGTGACA ATGGTGTGCC AAGCCTTTGC
GACAGCGCTG TAGTAAGATT TGTTGTGAAT GCGGTGAATG ACGCACCAGT AGCAGTTGAT
GATAATGTGA CCGTAACCGA AGATGTACCA GCGACAGGCA ATGTATTGAC CAATGATACA
GATGTAGAGG GTAATACGCT GACGGCTTCG CTGGTAACAG CGCCAGTGAA CGGAACGATC
GTGCTGAACG CAGATGGTAG CTTCACCTAT ACGCCGAATG CGAACTATAA TGGTTTAGAT
AGCCTGGTTT ACCAGGTATG TGACAATGGT GTACCTAGTC TTTGTGATAG TGCTGTGGTA
AGATTTACAG TAAATGCGGT GAATGACGCA CCGGTAGCAG TTGATGATAA TGTGACCGTA
ACCGAGGATG TACCAGCGAC AGGCAATGTA TTGACGAATG ATACAGATGT AGAGGGTAAT
ACGTTGACGG CTTCGCTGGT AACAGCGCCA GTGAACGGAA CGATCGTGCT GAATGCCGAT
GGTAGCTTCA CGTATACACC GAATGCGAAC TACAATGGTC TGGATAGCTT GGTTTACCAG
GTATGTGACA ATGGTGTACC TAGTCTGTGT GATAGTGCTA TAGTAAGATT TACAGTGAAT
GCGGTGAATG ATGCACCGGT AGCTGTGGAT GATAATATAA CAGTGACAGA GGATGTACCA
GCGACAGGCA ATGTAATGAC TAATGATACG GATGTAGAGG GTAATACTTT GACAGCTTCA
CTGGTTACCG CACCTGTAAA TGGTACGATC GTACTTAACG CCGATGGTAG CTTCACGTAT
ACACCGAATG CGAACTACAA TGGTTTGGAT AGCTTGGTTT ACCAGGTATG TGACAATGGT
GTACCAAGTC TTTGCGATAG TGCTGTGGTA AGATTTACAG TAAATGCGGT GAATGATGCA
CCGGTAGCTG TGGATGATAA TATAACAGTG ACAGAAGATT TACCAGCAAC AGGTAATGTA
CTGACGAATG ATACGGATGT AGAGGGTAAT ACGCTGACGG CTTCACTGGT TACCGCACCT
GTAAATGGTA CGATCGTGCT GAATGCAGAT GGTAGCTTCA CGTATGCACC AAATGCAAAC
TATAATGGTC TTGATAGCCT TGTTTACCAG GTATGTGACA ATGGGGTGCC AAGCCTTTGT
GATAGTGCTG TAGTGAGATT CACAGTAAAT GCGGTGAATG ACGCACCGGT AGCTGTGGAC
GATAATGTGA CCGTAACCGA GGACGTACCA GCAACAGGCA ATGTGTTGAC GAATGATACG
GATGTAGAGG GTAATACGCT AACGGCTTCG CTGGTAACAG CGCCAGTGAA CGGAACGATC
GTGCTGAACG CCGACGGTAG CTTCACGTAT ACACCAAATG CAAACTATAA TGGTTTGGAT
AGCCTGGTTT ATCAGGTATG TGACAATGGT GTACCTAGTC TTTGTGATAG TGCTGTTGTA
AGATTTACAG TAAATGCGGT GAATGACGCA CCGGTAGCTG TGGATGATAA TGTGACCGTA
ACCGAAGATG TACCAGCGAC AGGCAATGTA TTGACCAATG ATACAGATGT AGAGGGTAAT
ACGTTGACGG CTTCACTGGT AACAGCGCCA GTGAACGGAA CGATCGTGCT GAACGCCGAC
GGTAGCTTCA CGTATACACC AAATGCAAAC TATAATGGTT TGGATAGCCT GGTTTATCAG
GTATGTGACA ATGGTGTACC TAGTCTTTGT GATAGTGCTG TGGTAAGATT TACAGTAAAT
GCGGTGAATG ATGCACCGGT AGCTGTGGAT GATAATGTAA CAGTGACAGA GGATGTACCA
GCGACAGGCA ATGTATTGAC GAATGATACG GATGTAGAGG GTAATACCCT GACGGCTTCA
TTGGTGACAG CGCCGGTGAA TGGAACGATC GTACTGAATG CGGATGGTAG CTTCACGTAT
ACTCCAAATG CAAATTATAA TGGTTTGGAT AGCTTGGTTT ACCAGGTATG TGACAATGGT
GTACCTATTC TGTGTGATAG TGCTATAGTA AGATTTACAG TGAATGCGGT GAATGATGCA
CCGGTAGCTG TGGATGATAA TATAACAGTG ACAGAGGATG TACCAGCGAC AGGCAATGTA
ATGACTAATG ATACGGATGT AGAGGGTAAT ACTTTGACAG CTTCACTGGT TACCGCACCT
GTAAATGGTA CGATCGTACT TAACGCCGAT GGTAGCTTCA CGTATACACC GAATGCGAAC
TACAATGGTT TGGATAGCTT GGTTTACCAG GTATGTGACA ATGGTGTACC TAGTCTTTGT
GATAGTGCTG TAGTAAGATT TACAGTAAAT GCGGTGAATG ACGCACCGGT AGCCGTGGAT
GATAATGTGA CAGTAACCGA GGATGTACCA GCGACAGGGC AATGTATTGA CGAATGA
 
Protein sequence
MVEFYCRGLL RRLKIWCLLI TAIIFTRTGA RAEGSKELNQ SGGYRAYLNS ASATSVNNLF 
PTMGTMKVYV NVGERIFVGS SAQGIGSGTI NLRAPNGVTY TTGTSTTTGR ISNRTQEVNG
PNVLTLTTGY TPGIFTVGAG QAGVWEIDFV PPNAAAANNP TAIVSTGNWT QPTGTSMIAA
FDVSVRNAAN TAFVPGRLYT NIFTANLGAA NATFNAILRV LTNDGYIYTV NNNGQAGFGF
SFVANNKGFR TTTGDPSYKS VDDLTNLRLK DPRTADTETD ITHKIFFNTP AVDLPASAPS
VSGTTWLLTT PPVISASILT FTGVEGTPGV AGTSPAGGNI TFTATYAANY AVDIDINGNG
VYTDAVDRRL TGSAVVGTNS AYWDGNNGQG VKVLSGTNTY NSRVVLFAGE VHFPFIDVEN
NPTGIIITRT NGSGSPSDIV YWDDSQLTVN GTPSNPISTA TTGISSTTNG HKFGSTAYSG
TDFGNENGID TWSYLTSTPT ATPLIITLRE ADLEVVSITK SNATPCQGAT VTYTTAVRNN
GPNNVVGAIY EFNFPANLTN VTVTPTLTSG VAVVTGGTTT ATQYTATLSM NNAAVVTFTI
TGTISSFPTG GTLSVTSAIM RPQDVTDPDA TNPDAAVPTD PQSECDALPS GVGCNNIKTD
ATTVSQTPTA SVAGPAQTLC AATSATLAAN TPTVGTGIWS QVSGPGTAVI TNTSSPTSTV
TGLVTGTYVF RWTISNGSCT PSTSDVSITV QAALAGNTIT APATTTFCGS GDPAIITGST
PTGGNSSYTY QWQQSTDNTT YTNISGATAQ SYDPPVQSTT TYFRRLITSG ACTTASASNV
VTVTIQSAIT NNTITAPATT TFCSTGDAAI ITGATPAGGS GTFTYQWQSS TDNTTFTNIA
GATALSYDPP ATSATTYYRR QVTSGACSSA STSNVVTITI QAALTAGAIA ASQEFCVSGD
PVAFTQTTAP TGGSGTYTYQ WQSSVTSAST GFTDISGATA VVYDAAAINQ TTYYRRITRS
GVCSDVISNV LTVTVNAALT PGVIAGNQTF CTSGDPAAFT QTTAPAGGNG TFSYQWQSSV
TSTTAGFSDI AGATANIYDA PSLSQTTYFR RITRSGTCAD VTSNVLTVTV NPSLSNNTIA
ASQTICSGST PAALTGSTPA GGNGTYTYLW EVSVSGGAFT TAPGTSNLQN YTPSAPLTQT
TQYRRTVTSD GCATSLSNVI QVTVNGSTTV SNAGPDQGPL NATTVTLAAN APATGTGTWT
QVSGPNTANI VNPSANNTSV TGLVAGTYTF RWTITNPPCT PSTDDVLIII NTAPVAGNDV
VTTPEDVAVN INVLSNDSDV DGTLNTGSVA IVNQPTHGTV SVAANGVVTY TPNANYNGTD
VFTYTVRDNL GTISNTATVS INITPVNDPP VAVDDDINLT EDITVTIPAP GVLGNDYDPD
GDQLTAVIVT PVTVGTLVLN GNGSLTYTPP ANFNGIATFT YRVCDGSGAC DTATVRLEVG
NENDAPVAVN DSYTVDEDTP LDVAAAGVLS NDTDADNDAL SATLVTPPAS GTLTLNSNGS
FRYVPAPNFN GVVSFVYSAC DASGACSNAT VTIAVNSVND APVANDDAYV TDEDKVLDVV
VPGVLSNDVD VDGNTLTVSL VTTPASGTVT LNPNGRLIYT PAQDFNGVVS FIYRACDNGT
PQLCDTALVT ITVRPVNDTP VVANDTYTLN EDTPLNIAAP GLLANDTDVD GNTLTASIVT
NPAHGTVTVN ADGSFMYMPA ADYNGTDVFT YKACDGSGAC ATGTVTLTIT AVNDAPGAGD
VSFSAREDIP LTINSPGLLG ASTDKEGGTL TAAIVTQPAN GTITVNPNGS FTYIPNPNFN
GTDVFTFSVC DNGTPQLCDT ATATISVAAE NDAPVAGDDT YNATEDTPLT VAAPGVLSND
TDPDGDPLTV AVLAGPANGT LTLNPNGNFT YTPRSNYNGT DTYTYRVCDG NGGCDTGAVT
INIAAVNDAP VIGQIGYTVT EDVPLTVNAP GVLFNDTDPD GDPLTAVLQT PPAHGTLTLN
PNGSFTYAPA ANFNGIDSFL YRACDPSNAC ATGVVILTVQ PVNDRPVAVD DNYTTSEETT
LTIAAPGVLA NDTDVDGDVL TSSILGNPVH GSVTLNSNGA FVYIPNPDFN GVDSFTYRAC
DGSGVCDTGM VSITVTPVND TPLVVNDVYT ISEDNVLTVA PTGVLFNDRD KEGDALAASL
LAPPSSGTVV LNANGGFVYT PAPNFNGTVT FTYLACDNGT PSLCDTGTVT INVTPVNDAP
DGVDDAYTLQ EDVPLTIAAP GLLANDTDPD GDLLQVTGIF RQPVHGTVVV NANGSFTYTP
AKDYNGTDQF VYNVCDNNIP SACDTAVVTL TINGDNDAPV ATDDNYTTPE DVPLNIAAPG
ILFNDTDADG DPLTITGVVL NPANGTVTVN ANGGFVYTPN PDYRGLDTFV YRVCDNAGGC
DTGVVRIVVS PVNDAPVTSL ETYTTPEDVP LNVNAFNGVL SNDTDVDGDS LRVTLLNTTT
HGMLTLSQDG SFSYVPARDY NGNDFFTYNV CDPSGACASD TAYIIITPVN DTVIARDDIL
NGDEDVVING DVSLNDDDAD GDPLTFTLLV QPARGTIVFN SNGTFTYTPT LDSTGLDSAI
YRVCDPFGAC DTARIYFNVG DENDPPVANG NAYTMNEDEI LNVAAPGILA NDTDPDLGTQ
LNASVVNGPV NGRLTIWSDG SFSYKPNPNY NGTDQFSYSA CDANGACDTA IVNITINPVN
DAPNAVSDTV TTDEDTPVNG NVLTNDTDPE GNELTASLVS GPSSGTLVLN ANGTFTYTPG
TNFNGTDIFQ YQVCDAGPLC DTAFVTIIVN PVNDPPVTEN DAYTVAEDNT LTVPAASGVL
SNDSDADGEV LVSTLVTTTN GTLTLNPDGS FVYRPNRDFN GTDGFTYQAC DLSGACAQGS
VTITVTPVND APIAVNDYFT RSEDTVLTFP PSVILANDID VDGDVLTGRP IGNLQHGSYV
SNPDGTYTYT PAPNFNGLDS IQYEVCDGAG LCDTGVIILN ITPVNDPPVA NPDAYETQED
VVLQIPATAG VLRNDTDPDG DALVSTIVDP ANGSLTLNSD GSFSYRPNLN FNGLDSFSYR
ACDLGGLCDT ANVRITVVPV NDRPIAVNDY FVRSEDTTIT FPPSVILAND IDVDGDPLTG
RPIGNLQNGT YVGNPDGTYT YTPAPNFNGL DSIQYEVCDG AGLCDTGVIV LEITPVNDRP
VAQDDQFSVN EDGSLTVNPP GVLSNDVDVD GDPLAVSVLT IPAHGTVTLN RDGSLTYTPA
ANYNGSDSLL YSVCDPSGAC DTGIVRFSVV AVADPPLPGN DAYTTNEDTQ LTVVAPGVLA
NDTDPDGFPL VTTLETQAVN GTVVMNSDGS FTYTPNADFN GIDRFTYQVC DTSGGTTQCA
SGTVTISVLP VNDAPVGQPD IYVFDEDSTI AIGTPGVLAN DLNVDGDVLT ATIVTTVAHG
QLRLNQNGGF TYIPNKDYNG RDSAVYNVCD PLGACDTAKI LFIINPVNDR PVAVDDQFTR
SEDTVITFTP QVVLVNDYDP DRDALQGRPI GSPIHGSYTA NPDGTYTYRP DLNFNGLDSV
QYEVCDPYGA CDTGYIRLTI TPVNDVPVAQ PDFYQTDEDI VLSVPAPGVK GNDSDVDGDE
LSIAIQTPAS HGRVTLNGDN SFLYVPDPNF NGIDSFIYRA CDPGGLCDTA LVTITVNSVN
DAPVALDNIY ALPEDSLMTG NVLDNDTDQD GDPLTASLIS TTTNGTLLFN ANGTFTYTPD
PGYNGPDQAV YRVCDPADAC DTALLSFIVT PVNDAPLAVD DSVSVAEDTP ATGNVLTNDS
DPEGDALTAS LITAPVNGIV VLNADGSFTY APNPNYNGAD ILVYRVCDNG VPGLCDSAVV
RFTITAVNDA PVAVDDSVNV TEDVPATGNV LSNDTDIEGN TLTASLVTAP VNGTVVLNAD
GNFTYTPNAN YNGLDSLVYQ VCDNGVPSLC DSAVVRFTIT AVNDAPVAVV DTVNVIEDTP
VTGNVLTNDI DVEGNSLTAS LVTAPVNGTI VLNADGSFTY TPNANYNGLD SLVYQVCDNG
VPSLCDGSVV RFTVNAVNDA PVAIPDTVVV TEDVPVTGNV LTNDIDVEGN SLTASLVTAP
VNGTIVLNAD GSFTYTPNAN YNGLDSLVYQ VCDNGVPSLC DSAVVRFVVN AVNDAPVAVD
DNVTVTEDVP ATGNVLTNDT DVEGNTLTAS LVTAPVNGTI VLNADGSFTY TPNANYNGLD
SLVYQVCDNG VPSLCDSAVV RFTVNAVNDA PVAVDDNVTV TEDVPATGNV LTNDTDVEGN
TLTASLVTAP VNGTIVLNAD GSFTYTPNAN YNGLDSLVYQ VCDNGVPSLC DSAIVRFTVN
AVNDAPVAVD DNITVTEDVP ATGNVMTNDT DVEGNTLTAS LVTAPVNGTI VLNADGSFTY
TPNANYNGLD SLVYQVCDNG VPSLCDSAVV RFTVNAVNDA PVAVDDNITV TEDLPATGNV
LTNDTDVEGN TLTASLVTAP VNGTIVLNAD GSFTYAPNAN YNGLDSLVYQ VCDNGVPSLC
DSAVVRFTVN AVNDAPVAVD DNVTVTEDVP ATGNVLTNDT DVEGNTLTAS LVTAPVNGTI
VLNADGSFTY TPNANYNGLD SLVYQVCDNG VPSLCDSAVV RFTVNAVNDA PVAVDDNVTV
TEDVPATGNV LTNDTDVEGN TLTASLVTAP VNGTIVLNAD GSFTYTPNAN YNGLDSLVYQ
VCDNGVPSLC DSAVVRFTVN AVNDAPVAVD DNVTVTEDVP ATGNVLTNDT DVEGNTLTAS
LVTAPVNGTI VLNADGSFTY TPNANYNGLD SLVYQVCDNG VPILCDSAIV RFTVNAVNDA
PVAVDDNITV TEDVPATGNV MTNDTDVEGN TLTASLVTAP VNGTIVLNAD GSFTYTPNAN
YNGLDSLVYQ VCDNGVPSLC DSAVVRFTVN AVNDAPVAVD DNVTVTEDVP ATGQCIDE