Gene Francci3_2459 details

Gene Information       Plasmid Coverage information       Fosmid Coverage information       Sequence       

Gene Information

Locus tagFrancci3_2459 
Symbol 
ID3905071 
TypeCDS 
Is gene splicedNo 
Is pseudo geneNo 
Organism nameFrankia sp. CcI3 
KingdomBacteria 
Replicon accessionNC_007777 
Strand
Start bp2866869 
End bp2880338 
Gene Length13470 bp 
Protein Length4489 aa 
Translation table11 
GC content70% 
IMG OID637879789 
Productamino acid adenylation 
Protein accessionYP_481555 
Protein GI86741155 
COG category[Q] Secondary metabolites biosynthesis, transport and catabolism 
COG ID[COG1020] Non-ribosomal peptide synthetase modules and related proteins 
TIGRFAM ID[TIGR01733] amino acid adenylation domain 


Plasmid Coverage information

Num covering plasmid clones
Plasmid unclonability p-value
Plasmid hitchhikingNo 
Plasmid clonabilitynormal 
 

Fosmid Coverage information

Num covering fosmid clones
Fosmid unclonability p-value0.765153 
Fosmid HitchhikerNo 
Fosmid clonabilitynormal 
 

Sequence

Gene sequence
ATGAAACGCT CCGCGCTGTC GGAAGTATGG CCGCTCTCAC CGTTGCAGGA GGGGTTGCTG 
TTCCACGCCA CGTTCGACGA GCAGGCTGTG GACGTCTACT CCGGGCAGCA CGTCATGGAG
CTGGAGGGAC CGCTGGACGC CGAGGTCCTG CGCGCGTCGG GGCAGGCGAT GCTGGACCGG
CACGCCAACC TGCGGGCCGG GTTCCGGCAG ACGGCCGGGC TTGCCCAGCC GGTCCAGGTC
ATCGCCGCCA GGGTCGCGCT GCCATGGCGT GAGGCGGACG TGTCGGCGCT GCCTTCGGCC
GGAGCCGAGG CGGAGGCCGA CCGGCTGGCC GCCGAGGACC TGGACCGCGG ATTCGACCCG
GCCGTACCTC CGCTGCTGCG GTTCCTGCTG ATCCGGTTCG GTGCGCGGCG CCACCGCCTG
GTGATCACCA ACCATCACAT CCTGCTGGAC GGCTGGTCGC TGCCGATCTT CAAACGCGAG
CTGTTCGGGG TGTACCGGGC GGGCGGCGAC TCCAGCGGGC TGAAGCCCGT GCCGCCTTAC
CGTGACTACC TGGTATGGCT GAGCAGGCAG GACCGCCAGG CCGCGCGAGC GGCCTGGCGC
CGTGAGCTGG ACGGCAAGCA GGAGCCAACC AGAGTCGTGG TGGCGGACCC GGGCCGGGAT
CCGGTAATGA CCGAGCTCAC CGAGCTGCGC CTGGGCCCCG AGCCGACCGG AGCGCTGCGC
GAGCTGGCCC AGGCCCACGG GGTGACGCTG AACACGGTCG TGCAGGGGGC GTGGGCGATG
CTGGTCAGCC GCCTGGCCGG CCGGTCCGAC GTGGTGTTCG GTGCGGTCGT CGCGGGTCGT
CCGCCCGAGC TGCCCGGGGT GGAGGACATG CTGGGCCTGT TCATCAACAC GCTGCCGGTC
CGGGTGCCGC TGGATCCGGC CCAGCGGGTC TGCGACATGC TGGCGGCCTT GCAGGCCCGG
CAGTCCGCGT TGACGGCTCA CCAGTACCTC GGCCTGGCCG AGATCCAGCG CGAGGCCGGG
CCCGGCGCGG TCTTCGACAC GCTCGTGGTC TACGAGAACT ATCCGTTCGA CCCGACGGTG
GCACCCGCGG CACCCGCGGC GGCCGACCCG GACAGCCTGC GGGTCACCTC GCGCGGTGGC
CGGCAGGCCG CGCACTATCC CCTCACCCTG GGCATACGGC CTGGCCGCGA CGGGCTGGCG
CTGCACGTGG ACTACCGGCC CGACCTGTTC GACCAGCGGA CGGCCGCGGA GCTGCTGGCC
CGGTTGGTAC GGATCCTGGA GGCTGTGGCG GCGGATCCGG GGGTGTTGGT GGGTCGGGTG
CCGGTGTTGG GTGCGGCTGA GTGGGTGCGG GTGGTGGAGG AGTGGAATGA CACTGGGGTT
GGGGTTGGGG TGGGGACGTT GCCGGGGGTG TTTGGGGGGT GGGTGGCTGC GGGGCGGGAT
GTGGTGGCGG TGGTGTCGGG GGGTGTGCGG GTGACGTATG GGGAGTTGGA GGTGGCGGCG
AATCGGGTGG CGCGGGATTT GGTGGCGGCT GGGGTGCGGT CTGGTGATCG GGTTGGGGTG
GTGATGGAGC GGTCGGTGGA GTTGGTGGCG GTGTTGGTGG GGGTGGTGAA GGTGGGGGCG
GCGTATGTGC CGGTGGATGT GGAGTGGCCG GTGGTGCGGG TGGGGCGGGT GCTGGCTGAG
GCGGGGGTGC GGGTGGTGGT GGCTGATGTG GGGGTGTCTG ATCTGCCGGG GTCTGTCGGG
GTGGTGTGGG CGGGTGGCTG GGTGGATGGG GAGGGGGAGT GTGGGCCGCC GGCGGTGCGG
GTGGGTGCGG ATGATGTGGC GTATGTGATG TATACGTCGG GGTCGACGGG GGTGCCGAAG
GGTGTGGCGG TGACGCATGC GGGTGTGGTC GGGTTGGCGG CGGATCGGTG TTGGTCGCGG
GAGGTTCATG GGCGGGTGTT GTTTCATGCG TCGCATGCGT TTGACGCGTC GACGTGGGAG
TTGTGGGTGG CGTTGTTGTC GGGGGGTCAG GTGGTGGTGG CGCCGGCCGG GCGGGTCGAC
GCTGGGGTGC TGAAGGGGTT GATTTCGGAT TTTGGGCCGA CGGTGGTGCA TGTGACGGCG
GGGTTGTTTG CGGCGGTGGC GGAGGAGGCG CCGGGGTGTT TTGTGGGGGT GCGTGAGGTG
GTGACGGGTG GGGATGTGGT GAGTGCGGCG GCGGTGGTGC GGGTGGTGGA GGCGTGTCCG
GGGGTGGTGG TGCGGCAGTT GTATGGGCCG ACGGAGGTGA CGGTGTGTGC GACGGTGTTT
GAGGTGCGGC CGGGGGATGA GGTTGCCTCG GTGGTGCCGA TTGGCCGTCC GATGGATAAC
ACCCGGGTGT TTGTGTTGGA TCGGTTTTTG CAGCCGGTGC CGCCGGGGGT GACGGGTGAG
TTGTATGTGG CGGGTGTGGG GTTGGCGCGT GGGTATTTTG GCCGGCCTGG GTTGACGGGG
GAGCGGTTTG TGGCGTGTCC GTTTTCCGGG TCTGGGGAGC GGATGTATCG GACGGGGGAT
TTGGGGCGGT GGACGGGGGA GGGGCAGTTG GTGTTCGCCG GTCGGGTGGA TGGGCAGGTG
AAGGTTCGTG GTTTTCGGAT TGAGTTGGGT GAGGTGGAGG CGGTGTTGGG GTTGTATCCG
GGGGTGGGGC GGTGTGTGGT GGTGGTGCGT GAGGATGAGC CGGGGCAGAA ACGGTTGGTC
GCCTATGTCG TCGCCTCCGA GGGGGAGGCG CTCGACACCG TCCAGATCCG CGACTTTGTG
GCGGGTTTGT TGCCGGAGTA TATGGTGCCG GCGGTGGTGG TGGTGTTGTC TGGGTTGCCG
TTGACTGGTC AGGGGAAGGT GGATCGGGGT GCGTTGCCGG TTCCGGATTT CGCGGGTCGG
GTGGGGGGTC GTTCGCCGCG TACCGCGGTG GAGGAGGTGT TGTGTGGTTT GTTTGCGGAG
GTGTTGCGGT TGGAGCGGGT CGGGGTCGAG GACAGTTTCT TCGATCTTGG TGGTGACTCT
CTGCTCGCGA TGCGGCTGAT TGCCCGGGTG CGGGGGGCGC TCGGGGCTGA GGTCAGCATC
CACGACCTGT TCACGGCGCA GACCCCGGCC GGTGTCGCCA GGCTGGTCGG CGGCGACGGT
ACCGCTCGTA CCGCCCTGGT GGCGGGCCGG CGGCCCGCGG TGCTGCCGCT GTCGTTCGGC
CAGGCGCGGA TGTGGTTCCT GAACCGGTTG CAGGAGGGCA GCGCGGTCTA CAACATGCCG
ATGGCGCTGC GGCTGCGCGG TGACCTGGAC CGGGCGGCGT TGCGCGCGGC GTTGGCCGAC
GTCGCGACTC GGCACGAGAG CCTGCGGACG GTGTTCCCCG ACTCGGATGG GCTGCCCTTC
CAGCAGATCC TGGCGGGCGG CCCCGAGCTC GTGGTGCAGG ACACCGATGA GCGGGAACTA
CCCGGCCTGC TGGCGGCCGA GGCGAGTCGT CCGTTCGACG TGCGCCACGA GCTGCCATGG
CGGGCGTCCT TGTTCGCGCT GTCCCCGCAG GAGCACATGC TGCTCCTGGT GATGCACCAC
ATCGCGGCCG ACGGCTGGTC GATGGGGGTG CTGACCCGCG ACCTGTCGGC GGCCTATGCG
GCGCGACTGT CCGGTCAGGA ACCGTCGTGG GCGCCCTTGC CGGTGCAGTA CGCCGACTTC
GCGGTCTGGC AGCGCGAAGT GCTCGGCAGT GAGGACGACC CGGACAGCCT GATCAGCAGG
CAACTGGCGT ACTGGCGGTC GACCCTGGCT GAGCTTCCTG CCGAGCTGAC CCTGCCGGTC
GACCGCCAGC GCCCGCCCGT GGCCTCCTTC GCCGGCGGCT CGGTGCCGCT GCGGCTCGGC
CCGCAGGTGC ACGCGCGGCT CACCGGGCTG GCCCAGGACG AGCGGGCCAC GCTGTTCATG
GTGATGCAGG CGGCGATTGC GGTACTGCTG TCAGGGCTCG GCGCGGGCAC CGACATCGCG
CTGGGCACCC CGGTGGCCGG TCGCGGCGAC GCCGCCGTGG ACGATCTGAT CGGGTTCTTC
GTCAACACGC TGGTGCTGCG CACCGACCTC GGCGGCGACC CGTCCTTTGC CGAGCTGCTC
GGCCGGGTGC GGGAGATGAA CCTGGCGGCG TACGCCCATC AGGACGTGCC GTTCGAGCGG
CTGGTGGAGG AGCTGCAACC GGCCCGCTCG CTGTCCCGGC ACCCGCTGTT CCAGGTGATG
CTGACCTTCC AGAACACCCA CCAGGACGGG GGTTGGGAGC TGCCCGGCCT GTCGGTACGG
CCGGAGCGCT CTGGCTCGGA CGTGGCCAAG TTCGACCTGT CGTTCAGCCT GGCCGAGAAC
CGCACTCCCG ACGGGGAGCT CGCCGGGATC AGCGGGGCGG TCGGCTACTC GGCCGACCTG
TTCGACCAGC GGACGGCCGA GGAGACGGCG AACCGGCTGG TGCGGGTGCT GGAGGCGGTG
GCTGCCGATC CCACGCTCCG GGTCAGCCAG GTGCCGCTCC TCGACGAGAC CGAGCGGGCC
CGGGTGGTGG ATGGGTGGAA TGAGACGGGG GTGGTGGTGC CGGAGGTGAC GTTGTCGGAG
TTGTTTGAGG CGCAGGTGCG GCGGAGTCCG GGTGCGGTGG CGTTGGTGTG TGAGGGGCGG
GTGGTGTCGT ATGGGGAGTT GGAGGTGGCG GCGAATCGGT TGGCGTGGCG TTTGGTGGGG
TTGGGGGTGG GTGCGGAGCG GGTGGTGGCG GTGGCGGTGG CGCGGTCGGT GGAGTTGGTG
GTGGCGTTGT TGGCGGTGGT GAAGGCGGGG GGTGCGTATC TGCCGGTTGA TCCGGAGTAT
CCGGCGTCGC GGGTGGGGTT GATGTTGGCT GATGCGGATC CGGTGGTGGT GTTGTGTACG
GCGGAGACGG TGGGGGGTTT GCCGGAGCAT CCGGCTGTGC GGCTGATGGT GGATGACGGT
GGGGTGGTGC GGGATTGTCC GGGGACGTCT CCTGGTGTTG TGGTGCGGCC GGGGTGTCCG
GCGTATGTGA TGTATACGTC GGGGTCGACG GGTGTGCCGA AGGGGGTGGT GGTGTCGCAT
CGGGGGATTG TGAACCGGTT GTTGTGGATG CAGGGTGAGT ATGGGTTGGG TGGTGATGAC
CGGGTTCTGC AGAAGACGTC GTCGGGGTTT GACGTGTCGG TGTGGGAGTT TTTCTGGCCG
CTGGTTACGG GTGCGTGTCT GGTGGTGGCG CGGCCTGGTG GTCATCGTGA TCCGCGTTAT
CTGGTGGATC TGGTGGTGGC TGAGCGGGTG ACGACGGTGC ATTTTGTGCC GTCGATGCTG
GGGTTGTTTC TGGATGAGGA GGGTGCGGCT TTGTGTGGGG GGCTTCGGCG GGTGGTGTGT
AGTGGTGAGG TTTTGCCGGG CGAGTTGGTG GAGCGGTTTC AGGGGGTGTT GCCGGGGGTG
GGGTTGCATA ATCTTTATGG TCCGACTGAG GCGTCGGTGG ATGTGTCGTT CTGGGCGTGT
CCGCCGGGGG TGTCGGGGGT GGTGCCGATC GGGGGGCCGA TCTGGAATGT TCGGTTGTTT
GTGTTGGATG GTTTTCTGCG GCCGGTTCCG CCGGGGGTGG TGGGGGAGTT GTATATCGCT
GGTGTGGGGT TGGCGCGTGG GTATGTGGGT CGTTCGTCGT TGACGGGGGA GCGGTTTGTG
GCGTGTCCGT TTTCTGGGTC TGGGGAGCGG ATGTATCGGA CGGGGGATTT GGTGCGGTGG
CGGGGTGATG GTGTGTTGGT GTATGTGGGG CGGGTTGATG CGCAGGTGAA GATTCGTGGG
TTGCGGATCG AGTTGGGTGA GGTTGAGGCT GTTTTGGCGG GGGATGGGGC GGTGGGTCGG
GTTGCGGTGG TGGTCCGGGA GGATCAGCCT GGTCATCGGT ATCTTGTCGC CTACGTGGTG
GCGGCGGCGG GTCGGGGTGT GGATGCTGCC GGGTTGCGGG AGTTCGCCGC GCGGCGGTTG
CCGGAGTACA TGGTGCCGGC GGCGGTGGTG GAGTTGGCGG AGTTGCCGTT GACGCTGAGC
GGGAAGCTTG ACCGTAAGGC TCTGCCCGCT CCGGATTTCG CGGGTCTGGT CACCGGGCGT
GCTCCTCGTA CTCCCGCCGA GGAGCTGCTG TGCGGCCTGT TCGCTGAGAC CCTGCACCTG
GACCGGGTCG GCGCCGACGA CGACTTCTTC AACCTCGGCG GCGACTCCCT GCTGGCCATG
CGACTGATCG CCCGCGTGCA GGCCGTGCTG GACGTCGAGG TGAACATCCG CGAGCTGTTC
GCCGCGCCGA CCCCGGCGGG CATCGCCAGG CTGGCCTCCG GCGGCGGGAG CGCCCGTACC
CCCCTGGTGG CCGGGCAGCG GCCCGAGGAG ATCCCGCTGT CGTTCGGGCA GACCCGCATG
TGGTTCCTCA ACCGGTTGCA GGAGGGCAGC GCGGTCTACA ACATGCCGAT GGCGCTGCGG
CTGCGCGGTG ACCTGGACCG GGACGCGCTG CGAGCCGCGC TGAAGGACGT GGCACAGCGG
CACGAGACCC TGCGCACGGT GTTCCCCGAC CGGGACGGGG TGCCCTTCCA GAAGATCCTG
GACGGCGGCC CCGAGCTCGT GGTGCGTGCG ACCAGCGAGC GGGACCTCGC GGACCTGCTG
GCGGCCGAGG CGGCACGTGG CTTCGACGTA CGCAGCGAGC CGCCGTGGCG GGCCGAGCTG
CTCGTCCTGG CCGAGCGCGA GCACGTCCTG CTGCTGGTCG TGCATCACAT CGCGGCCGAC
GGCTGGTCGA TAGGAGTGCT CACCCGTGAC CTGTCCACGG CCTACGCGGC GCGACTCGCC
GGCCGGGAGC CGTCATGGGC GGCGCTGCCG GTCCAGTACG CCGACTTCTC GGCCTGGCAG
CGCCAGATCC TGGGCAGCGA GGACGACCCG GACAGCCTGA TCAGCAGGCA ACTGGCGTAC
TGGCGGCAGT CCCTGGCCGG TCTTCCTGCC GAGCTGACGC TGCCGGTCGA CCGTCCGCGC
CCGGCCGTGG CCTCCTTCAC CGGCGGCACT GTCCCGCTGC GCGTCAGCGC CGAGGCCCAC
GCCAGGCTGG CGGGGATCGC CCGGGACCGG AAGGCCACGA TGTTCATGGT GGTGCAGGCG
GCGGTCGCGC TGCTGCTGTC CCGCCTGGGC GCGGGCACCG ACATCCCGCT CGGCACCGTC
ATCGCGGGCC GGGGCGACCC TGCGTTGGAT GGCCTGGTCG GCTTCTTCGT CAACACGCTG
GTGCTGCGCA CCGATGCCGG CGGCGACCCG TCGTTCAGTG ACCTGGTCGC CCGGGTTCGC
GAGGTGAACC TGGCCGCCTA CGCCCACCAG GACGTGCCGT TCGAGCGGCT GGTGGAGGAG
CTGCAACCGG ACCGATCGCT GGCCCGGCAC CCGCTGTTCC AGGTCATGAT GACCTTCCAG
ACCACCCACC AGGACGGCGG CTGGGAGCTG CCGGGCCTGT CCGTCCAACC ACAGCGGTCG
AGCTCCGACG CCGCCAGGTT CGACCTGTCC TTCACCGTCG GGGAACACCA CACCGCCGGC
GGCGCACCCG CCGGGCTGGA CGGGGCGGTC GGCTACTCGG CCGACCTGTT CGACCGGGCG
ACGGCCGAGA AGCTGGCTGG GCGGCTGGTG CGGCTGCTGG AAACGGTCGC CGCCGACCCC
GCGCTGCGGG CGAGCCGGGT GCCGGTCATG GACGAGGCCG AGTGGGCCCA GGTCGTGCAC
GCCTGGAACG ACACCGCCTG GAACGACACC GCGCTCAAGG TCTCGGACCG GACGCTGCCC
GAGTTGTTCG AGGCCCAGGT GCGGCGCAGC CCGGACGCCG TCGCGGTGGT CTTCCAGGAC
GTAGGCCTCA CCTATGCGGA GCTGGATGCG GCGGCGGGCC GACTTGCCGC GCGGCTGACC
GAGCAGGGCG CCGGGCCGGA GCGGGTCGTC GCCGTGGCCC TGCCGCGGTC CGCTGAGATG
CTGGTGGCGC TGCTGGCGGT GCTGAAGACC GGCGCGGCCT ACCTCCCGGT AGACGTGGGA
TACCCGTCCT CGCGGGTGGC GTTCATGCTG GCCGACGCCG ATCCCGCCGC CGTGGTCTGC
ACGGCCGAGA CCGCCCGGGC GCTGCCCGGC CACCCGGCCG TACGGACGGT CCTGGACGAC
CCACGGACCG CCGAGGCCCC GGCGGCCCGG CAGCCGACCG CGTCAGGCCG GATCGACCCG
CGGCACCCGG CATATGTGAT CTACACCTCG GGCTCCACCG GAACACCCAA GGGCGTGGTC
ATCTCACACC GCAACCTGGT GACGTTCCTC GCCGCGATGC GAATCCGCCC CGGCCTCACC
GAGGCCGACG TACTGCTGGC CGTGACGACG CTGGGCTTCG ACATCGCCGG GCTCGAGCTG
TTCCTGCCGC TGGTCGTGGG CGGGCGCGTG GTGGTGGCCG AACGCGAGGT GGCCCTGGAC
CCCAGGAGGC TGGCGGCGGA GATCGTACGG CACAGCGCGA CGGTGCTGCA GGCTACGCCG
GTGACCTGGC GGATGCTCGT CGACGACGGC TGGGCGGGCT CTCCCGGGCT GAAGGCTCTG
TGCGGCGGCG AGGCCCTCCC TCCGGACCTG GCCGAGGCGA TGATCGAGCG CTGCGCGCAG
GTGTGGAACA TGTACGGCCC GACCGAGACC ACGATCTGGT CGACCTGCCG GCAGTTGACG
GCGGGCGGCG GCGTCAGCCT GGGCACACCG ATCGCCGGTA CCCGGACCTA TGTGCTGGAT
GATCTGCTGC AGCCGGTGCC GCCGGGGGTG GTCGGTGAGC TTTATCTTGC GGGTCCGGGG
CTGGCTCGTG GTTACTGGGC TCGTGCGGGG TTGACCGGTG AGCGGTTTGT GGCGTGTCCG
TTTTCCGGGT CTGGGGAGCG GATGTACCGG TCGGGGGATC TGGTTCGGTG GACTGCTGCT
GGTGAGTTGG TGTTTGTGGG GCGGGCGGAC ACGCAGCTTA AGATTCGTGG GTTTCGGGTT
GAGGTGGGTG AGGTTGAGGC GGTTTTGGCG GTGTTTCCGG GGGTGACTCG GGTGGTGGTG
GTGGCTCGGG AGGATCGGCC GGGTCACAGG TATCTGGTGG GTTATGTGGT GCCGGGGGAT
GTTGATGGTC GTGCGGTGCG GGAGTTCGCG GCGGAGCGGT TGCCGGAGTA TCTGGTTCCG
GCGGGGGTTG TTGCGTTGCC GGCGTTGCCG GTGACGCCTA ATGGCAAGCT TGATCGTGGG
GCGTTGCCGG CGCCGGATTT CGGTGGGTTG GTGACTGGGG GGGCGCCGCG TACCGCGGTC
GAGGAGGTGT TGTGTTCGTT GTTTGCGGAG GTGTTGCGGC TTGATCGGGT GGGGGTCGAC
GACGGGTTCT TCGAGCTGGG TGGCGATTCC CTGCTCGCGA TGCGGCTGAT CGCCCGCGTG
CAGGCCGTGC TGGACGTCGA GGTGAACATC CGAGCGCTCT TCGCCGCGCC GACGCCGGCG
GGCGTCGCCC GGCTGCTCGA CGGCGGCGGA CGGCCCCGGG CGGCGCTGGT CCGGGCGGTC
CGCCCGGCGG TGGTTCCGCT GTCGTACGGC CAGACCCGGA TGTGGTTCCT CAACCGCTTC
CAAGAGGGTG GGGCGGTCTA CAACATGCCG TTCGCGCTGA GGCTCACCGG CGAGCTCGAC
GTGGCGGCCC TGCGGGCGGC GCTGGGCGAC GTCGCGTTGC GACACGAGAG CCTGCGGACG
GTGTTTCCCG ATACCGGCGG CGTTCCCCGG CAGGAGGTGC GGGAGGGCTC TCCCGTGTTG
TCGGTGGTGG AGGTGGCGGC GGAGGATGTG CCGTTGTTGC TGCGGGCGGA GGTGGGGCGG
GGTTTTGATG TGGGGCGGGA GTTGCCGTGG CGGGTGTCGT TGTTCGTGGT GTCCGCGCGG
GAGCATGTTC TGGTGGTGGT GGTGCATCAT ATTGCGGCGG ATGGCTGGTC GATGGGGGTG
TTGGGGCGTG ATTTGTCGGC GGCGTATGCG GCGCGGTTGT CGGGGCGGGC GCCGTCGTGG
GTGGGGTTGC CGGTGCAGTA TGCGGATTAT GCGTTGTGGC AGCGTGCGGT GTTGGGGAGT
GAGTCTGATC CGGGTAGTTT GTTGAGTGCG CAGTTGGGGT ATTGGCGTTC TGCTTTGGCG
GGTCTTCCGG TGGAGTTGGT GTTGCCGGTG GATCGGCCGC GTCCGGCGGT GGCGAGTTAT
CGGGGTGGGG CGGTGCCGGT GCGGGTGGGT GCGGGGGTGC ATGGGCGGTT GGTGGAGGTG
GCGCGGGCGG GGCAGGCGAC GTTGTTCATG GTGGTGCAGG CGGCGGTGGC GGTGTTGCTG
TCGCGGTTGG GTGCGGGGGT TGATATTCCG GTGGGGACGG CGGTGGCGGG TCGGGGTGCG
GCGGCGTTGG ATGATCTGGT CGGGTTTTTT GTCAATACGT TGGTGTTGCG GGTCGGTCTT
GGTGGTGATC CGTCGTTTGC TGAGGTGGTG GGTCGGGTGC GTGAGGTGGA TCTGGCTGCC
TATGCGCATC AGGATGTGCC GTTTGAGCGG TTGGTGGAGG AGGTGCAGCC GGTTCGTTCG
TTGGCCCGGC ATCCGTTGTT CCAGGTCATG CTGACCTTCC AGAACGCTCC CCGGACCTCG
GGCTGGGAAC TGCCCGGGCT TCAGGTGAGC CAGGTCAGGG CGGGCGGCGG GGGAGCGGCC
AAGTTCGACC TGTCTTTGGC GTTGACCGAG CATCGTGATG CCGAGGGTGG TGCGGCGGGG
CTGGCTGGGG TTTTGGAGTA TTCGGCTGAT CTGTTCGATC GGTCGACCGC GGAGGGGTTG
GTGGGGCGTC TGGTTCGGTT GCTTGAGGTG GTGGGGGCTG ATCCTGGTCT GCGGTTGAGT
CAGGTGGATG TGCTGGCGGA CGGTGAGTAT GACCTGGTGG TGCGGGCGTG GAACGGCTCC
GCTGTTGGTG GCTCTGCTGT TGGTGGCTCT GCTGTTGGGG TGTCGGCCAG GACGTTGCCG
GAGATGTTTC AGGCGCAGGT GGTCGCGCGG CCTGATGCGG TGGCGGTGGT CTGTGAGGAT
GTGCGGTTGA CCTATGCGGA GTTGGATGCC GCGGTGAACC GGCTGGCTCG TCTGTTGGTG
GGTTTGGGGG TGGGGCCGGA ACGGATTGTG GCGGTGGCGT TGCCCCGGTC GGTGGAGATG
GTGGTGGCGT TGCTGGCGGT GCTGAAGGCG GGGGCGGCTT ATCTGCCGGT GGATCCGGAG
TATCCGGCCG CCCGGCAGGC GTTTATGCTG GCCGATGCCG CTCCCGTGGT GACGTTGGGT
ACGGCGCGGA CCGTGGGGGC GTTGCCTGAG CACGGGGCGG TCAGGGTTGT CGTGGACGCC
CCGGATACGG TTCGTGTGCT GGCTGGGCTG CCTGGTACGG CGGTGCGGGA TGCCGAGCGG
GTCCGGTCGT TGCGGCCGGG GCATCCGGCG TATGTGATCT ATACGTCGGG GTCGACGGGT
ACGCCGAAGG GTGTGCTGAT TCCGCAGCGT AATGTGGCTG CCCTCATCGA GACGGCGGGT
CGGGTGTACG GGCTGGGCGC CGATGATGTG TGGAGTTTGT TCCACTCCTA TGCCTTCGAT
TTTTCGGTGT GGGAGATGTT CGGTGCGTTG CTGCTCGGTG GCCGGGTTGT GGTGGTGGCG
CACTCGGTGA GTCGGTCGCC GCGGGAGTTC GTTGAGTTGC TGAGCCGGAC GGGTGTGACG
GTGCTCAGCC AGACTCCGTC GGCGTTCTAT CAGGTGATCG GTGAGTTGGC TGCTGCCGGG
GTCGGTTCCT CGTTGCGGTA TGTGGTGTTC GGTGGTGAGG CGCTGGAACC TGCCCGGTTG
CGGCAGTGGT ATGACCGGTA TCCCGGCGAC GTCCCGGTGT TGGTCAACAT GTACGGCATT
ACCGAGACGA CGGTCCATGT CACGCACATC GCGTTGGACC GGGAGCGGGT GGTGGCGGGG
ACGGGCAGTG TGGTGGGTGG CCCGTTGCCG GGTGTCCGGA CGTATGTGTT GGACGAGTTC
CTGCGGCCGG TGCCTCCCGG GGTGGTCGGT GAGCTTTATG TGGCGGGTGC CGGGCTGGCC
CGTGGCTATC TCAATCGTCC CGCGTTGACC GGGGAGCGGT TCGTGGCCTG CCCGTTCGGG
GGGTCGGGGG AGCGCATGTA CCGCACGGGT GACCTGGCCC GGTGGACCGG CGATGGTGGG
CTGGTGTTCG CCGGGCGGGC GGATGCGCAG GTGAAGATCC GTGGTTTCCG GATCGAGCCC
GGCGAGATCG AGGCCGTGCT GTCCGGGCAT CCCGCCGTCG ACCAGGTCGC CGTCGTGATG
CGTGAGGACC AGCCCGGCCA CCGGCACCTC GTGGCCTATC TCGTGCCACA CCAGGAGATC
GGCGCGGCGG AGATCCGCGC CTTCGTGGCC GGGCGGCTGC CCGAGTACAT GGTCCCCGCG
GTGGTGGTCG AGGTGGCGGA GCTGCCGCTG ACCGCCAACG GCAAGCTGGA CCGCGCGGCG
TTGCCCGCCC CCGACTTCGG TGCTCTGGCG ACCGGGCGGG GGCCGCGCAC CGCGGTCGAG
GAGCGGTTGT GCGCCCTGTT CGCCGAGGTC CTGGACCTGG CGCGGGTCGG GGCCGACGAC
GGCTTCTTCG ACCTCGGCGG CGACTCGCTG CTGGCCATGC GGCTGATCGC TCGCATCCGG
GAGGTGCTGG GCACCGAGTT GAACGTCCGC ACGCTGTTCG CCGAGCCCAC CCCGGCCGGT
GTCGCGGCAT CCCTGGAGAC CCGCGGCGAG GACGACGACT TCGACGTCCT GCTGCCGATC
CGCACCGAGG GGACCCGGCC CGCGCTGTTC TGCGTCCACC CGGTGGAGGG CATCAGTTGG
CGCTACACGG GCCTGGCCGA CCACCTGCCC GCTGACCTGC CCATCTACGG CCTCCAGGCA
CGAGGCCTGG CCCGGACCGA GCCGTTGCCG CGGACCGTGG CGGACATGGC GGCCGACTAC
TTCGAACGGA TCCGATCCGT CCAGCCCACC GGCCCCTACC ACCTGCTCGG CTGGTCGCTG
GGCGGGGTGG TCGCCCATGC CCTCGCCACC CACATCCAGG CACGGGGCGA GCAGGTCGGC
CTCCTGGCGA TTCTCGACGG CTATCCCGCC TCCACCGCCG TACGGAGCCG GCCGGAGGAC
GGCCGGGAGG TCATGCCGAA GGTCCGCGGG AAGATGGACC AGCGGCTGGA CCGGATGATC
GAGCAGGTCG TCGGCCGTGG GGACGTCGGC CGCGGGGACG TCGACGGCGA GCGGCTGCGC
AGGATCCGCT CGGTGCTCGA CAACACCATG AGGCTGGGCG CGGAGTTCAC TCCGGATGTC
CTGCACGGCG ACCTGCTGCT GTTCGTCGCG CTGCTTGACC GGTTGCCCTC CCAGCCCGCA
GCCGAGGCGC CCACCCTGTG GCGGCCCTAC GTCGACGGGC GGATCGACGG TCACGAAATC
TCAGGAGCCC ACCAGGAGCT CATGCAGGCA GAACATCTCG CGGAGATCGC ACGGGTGATC
ACCGAGAAGC TGGCACGACA CGAGAGGTGA
 
Protein sequence
MKRSALSEVW PLSPLQEGLL FHATFDEQAV DVYSGQHVME LEGPLDAEVL RASGQAMLDR 
HANLRAGFRQ TAGLAQPVQV IAARVALPWR EADVSALPSA GAEAEADRLA AEDLDRGFDP
AVPPLLRFLL IRFGARRHRL VITNHHILLD GWSLPIFKRE LFGVYRAGGD SSGLKPVPPY
RDYLVWLSRQ DRQAARAAWR RELDGKQEPT RVVVADPGRD PVMTELTELR LGPEPTGALR
ELAQAHGVTL NTVVQGAWAM LVSRLAGRSD VVFGAVVAGR PPELPGVEDM LGLFINTLPV
RVPLDPAQRV CDMLAALQAR QSALTAHQYL GLAEIQREAG PGAVFDTLVV YENYPFDPTV
APAAPAAADP DSLRVTSRGG RQAAHYPLTL GIRPGRDGLA LHVDYRPDLF DQRTAAELLA
RLVRILEAVA ADPGVLVGRV PVLGAAEWVR VVEEWNDTGV GVGVGTLPGV FGGWVAAGRD
VVAVVSGGVR VTYGELEVAA NRVARDLVAA GVRSGDRVGV VMERSVELVA VLVGVVKVGA
AYVPVDVEWP VVRVGRVLAE AGVRVVVADV GVSDLPGSVG VVWAGGWVDG EGECGPPAVR
VGADDVAYVM YTSGSTGVPK GVAVTHAGVV GLAADRCWSR EVHGRVLFHA SHAFDASTWE
LWVALLSGGQ VVVAPAGRVD AGVLKGLISD FGPTVVHVTA GLFAAVAEEA PGCFVGVREV
VTGGDVVSAA AVVRVVEACP GVVVRQLYGP TEVTVCATVF EVRPGDEVAS VVPIGRPMDN
TRVFVLDRFL QPVPPGVTGE LYVAGVGLAR GYFGRPGLTG ERFVACPFSG SGERMYRTGD
LGRWTGEGQL VFAGRVDGQV KVRGFRIELG EVEAVLGLYP GVGRCVVVVR EDEPGQKRLV
AYVVASEGEA LDTVQIRDFV AGLLPEYMVP AVVVVLSGLP LTGQGKVDRG ALPVPDFAGR
VGGRSPRTAV EEVLCGLFAE VLRLERVGVE DSFFDLGGDS LLAMRLIARV RGALGAEVSI
HDLFTAQTPA GVARLVGGDG TARTALVAGR RPAVLPLSFG QARMWFLNRL QEGSAVYNMP
MALRLRGDLD RAALRAALAD VATRHESLRT VFPDSDGLPF QQILAGGPEL VVQDTDEREL
PGLLAAEASR PFDVRHELPW RASLFALSPQ EHMLLLVMHH IAADGWSMGV LTRDLSAAYA
ARLSGQEPSW APLPVQYADF AVWQREVLGS EDDPDSLISR QLAYWRSTLA ELPAELTLPV
DRQRPPVASF AGGSVPLRLG PQVHARLTGL AQDERATLFM VMQAAIAVLL SGLGAGTDIA
LGTPVAGRGD AAVDDLIGFF VNTLVLRTDL GGDPSFAELL GRVREMNLAA YAHQDVPFER
LVEELQPARS LSRHPLFQVM LTFQNTHQDG GWELPGLSVR PERSGSDVAK FDLSFSLAEN
RTPDGELAGI SGAVGYSADL FDQRTAEETA NRLVRVLEAV AADPTLRVSQ VPLLDETERA
RVVDGWNETG VVVPEVTLSE LFEAQVRRSP GAVALVCEGR VVSYGELEVA ANRLAWRLVG
LGVGAERVVA VAVARSVELV VALLAVVKAG GAYLPVDPEY PASRVGLMLA DADPVVVLCT
AETVGGLPEH PAVRLMVDDG GVVRDCPGTS PGVVVRPGCP AYVMYTSGST GVPKGVVVSH
RGIVNRLLWM QGEYGLGGDD RVLQKTSSGF DVSVWEFFWP LVTGACLVVA RPGGHRDPRY
LVDLVVAERV TTVHFVPSML GLFLDEEGAA LCGGLRRVVC SGEVLPGELV ERFQGVLPGV
GLHNLYGPTE ASVDVSFWAC PPGVSGVVPI GGPIWNVRLF VLDGFLRPVP PGVVGELYIA
GVGLARGYVG RSSLTGERFV ACPFSGSGER MYRTGDLVRW RGDGVLVYVG RVDAQVKIRG
LRIELGEVEA VLAGDGAVGR VAVVVREDQP GHRYLVAYVV AAAGRGVDAA GLREFAARRL
PEYMVPAAVV ELAELPLTLS GKLDRKALPA PDFAGLVTGR APRTPAEELL CGLFAETLHL
DRVGADDDFF NLGGDSLLAM RLIARVQAVL DVEVNIRELF AAPTPAGIAR LASGGGSART
PLVAGQRPEE IPLSFGQTRM WFLNRLQEGS AVYNMPMALR LRGDLDRDAL RAALKDVAQR
HETLRTVFPD RDGVPFQKIL DGGPELVVRA TSERDLADLL AAEAARGFDV RSEPPWRAEL
LVLAEREHVL LLVVHHIAAD GWSIGVLTRD LSTAYAARLA GREPSWAALP VQYADFSAWQ
RQILGSEDDP DSLISRQLAY WRQSLAGLPA ELTLPVDRPR PAVASFTGGT VPLRVSAEAH
ARLAGIARDR KATMFMVVQA AVALLLSRLG AGTDIPLGTV IAGRGDPALD GLVGFFVNTL
VLRTDAGGDP SFSDLVARVR EVNLAAYAHQ DVPFERLVEE LQPDRSLARH PLFQVMMTFQ
TTHQDGGWEL PGLSVQPQRS SSDAARFDLS FTVGEHHTAG GAPAGLDGAV GYSADLFDRA
TAEKLAGRLV RLLETVAADP ALRASRVPVM DEAEWAQVVH AWNDTAWNDT ALKVSDRTLP
ELFEAQVRRS PDAVAVVFQD VGLTYAELDA AAGRLAARLT EQGAGPERVV AVALPRSAEM
LVALLAVLKT GAAYLPVDVG YPSSRVAFML ADADPAAVVC TAETARALPG HPAVRTVLDD
PRTAEAPAAR QPTASGRIDP RHPAYVIYTS GSTGTPKGVV ISHRNLVTFL AAMRIRPGLT
EADVLLAVTT LGFDIAGLEL FLPLVVGGRV VVAEREVALD PRRLAAEIVR HSATVLQATP
VTWRMLVDDG WAGSPGLKAL CGGEALPPDL AEAMIERCAQ VWNMYGPTET TIWSTCRQLT
AGGGVSLGTP IAGTRTYVLD DLLQPVPPGV VGELYLAGPG LARGYWARAG LTGERFVACP
FSGSGERMYR SGDLVRWTAA GELVFVGRAD TQLKIRGFRV EVGEVEAVLA VFPGVTRVVV
VAREDRPGHR YLVGYVVPGD VDGRAVREFA AERLPEYLVP AGVVALPALP VTPNGKLDRG
ALPAPDFGGL VTGGAPRTAV EEVLCSLFAE VLRLDRVGVD DGFFELGGDS LLAMRLIARV
QAVLDVEVNI RALFAAPTPA GVARLLDGGG RPRAALVRAV RPAVVPLSYG QTRMWFLNRF
QEGGAVYNMP FALRLTGELD VAALRAALGD VALRHESLRT VFPDTGGVPR QEVREGSPVL
SVVEVAAEDV PLLLRAEVGR GFDVGRELPW RVSLFVVSAR EHVLVVVVHH IAADGWSMGV
LGRDLSAAYA ARLSGRAPSW VGLPVQYADY ALWQRAVLGS ESDPGSLLSA QLGYWRSALA
GLPVELVLPV DRPRPAVASY RGGAVPVRVG AGVHGRLVEV ARAGQATLFM VVQAAVAVLL
SRLGAGVDIP VGTAVAGRGA AALDDLVGFF VNTLVLRVGL GGDPSFAEVV GRVREVDLAA
YAHQDVPFER LVEEVQPVRS LARHPLFQVM LTFQNAPRTS GWELPGLQVS QVRAGGGGAA
KFDLSLALTE HRDAEGGAAG LAGVLEYSAD LFDRSTAEGL VGRLVRLLEV VGADPGLRLS
QVDVLADGEY DLVVRAWNGS AVGGSAVGGS AVGVSARTLP EMFQAQVVAR PDAVAVVCED
VRLTYAELDA AVNRLARLLV GLGVGPERIV AVALPRSVEM VVALLAVLKA GAAYLPVDPE
YPAARQAFML ADAAPVVTLG TARTVGALPE HGAVRVVVDA PDTVRVLAGL PGTAVRDAER
VRSLRPGHPA YVIYTSGSTG TPKGVLIPQR NVAALIETAG RVYGLGADDV WSLFHSYAFD
FSVWEMFGAL LLGGRVVVVA HSVSRSPREF VELLSRTGVT VLSQTPSAFY QVIGELAAAG
VGSSLRYVVF GGEALEPARL RQWYDRYPGD VPVLVNMYGI TETTVHVTHI ALDRERVVAG
TGSVVGGPLP GVRTYVLDEF LRPVPPGVVG ELYVAGAGLA RGYLNRPALT GERFVACPFG
GSGERMYRTG DLARWTGDGG LVFAGRADAQ VKIRGFRIEP GEIEAVLSGH PAVDQVAVVM
REDQPGHRHL VAYLVPHQEI GAAEIRAFVA GRLPEYMVPA VVVEVAELPL TANGKLDRAA
LPAPDFGALA TGRGPRTAVE ERLCALFAEV LDLARVGADD GFFDLGGDSL LAMRLIARIR
EVLGTELNVR TLFAEPTPAG VAASLETRGE DDDFDVLLPI RTEGTRPALF CVHPVEGISW
RYTGLADHLP ADLPIYGLQA RGLARTEPLP RTVADMAADY FERIRSVQPT GPYHLLGWSL
GGVVAHALAT HIQARGEQVG LLAILDGYPA STAVRSRPED GREVMPKVRG KMDQRLDRMI
EQVVGRGDVG RGDVDGERLR RIRSVLDNTM RLGAEFTPDV LHGDLLLFVA LLDRLPSQPA
AEAPTLWRPY VDGRIDGHEI SGAHQELMQA EHLAEIARVI TEKLARHER