Gene Francci3_2450 details

Gene Information       Plasmid Coverage information       Fosmid Coverage information       Sequence       

Gene Information

Locus tagFrancci3_2450 
Symbol 
ID3905062 
TypeCDS 
Is gene splicedNo 
Is pseudo geneNo 
Organism nameFrankia sp. CcI3 
KingdomBacteria 
Replicon accessionNC_007777 
Strand
Start bp2846101 
End bp2858973 
Gene Length12873 bp 
Protein Length4290 aa 
Translation table11 
GC content71% 
IMG OID637879780 
Productamino acid adenylation 
Protein accessionYP_481546 
Protein GI86741146 
COG category[Q] Secondary metabolites biosynthesis, transport and catabolism 
COG ID[COG1020] Non-ribosomal peptide synthetase modules and related proteins 
TIGRFAM ID[TIGR01720] non-ribosomal peptide synthase domain TIGR01720
[TIGR01733] amino acid adenylation domain 


Plasmid Coverage information

Num covering plasmid clones
Plasmid unclonability p-value
Plasmid hitchhikingNo 
Plasmid clonabilitynormal 
 

Fosmid Coverage information

Num covering fosmid clones11 
Fosmid unclonability p-value
Fosmid HitchhikerNo 
Fosmid clonabilitynormal 
 

Sequence

Gene sequence
ATGCCTGGTA CTGCGGACCT GACACTACCG GAGATGTTTC AGGCGCAGGT GGTCGCGCGG 
CCTGATGCGG TGGCGGTGGT CTGTGAGGAT GTGCGGTTGA CCTATGCGGA GTTGGATGCC
GCGGTGAACC GGCTGGCTCG TCTGTTGGTG GGTTTGGGGG TGGGGCCGGA ACGGATTGTG
GCGGTGGCGT TGCCCCGGTC GGTGGAGATG GTGGTGGCGT TGCTGGCGGT GCTGAAGGCG
GGGGCGGCTT ATCTGCCGGT GGATCCGGAG TATCCGGCCG CCCGGCAGGC GTTTATGCTG
GCCGATGCCG CTCCCGTGGT GACGTTGGGT ACGGCGCGGA CCGTGGGGGC GTTGCCTGAG
CACGGGGCGG TCAGGGTTGT CGTGGACGCC CCGGATACGG TTCGTGTGCT GGCTGGGCTG
CCTGGTACGG CGGTGCGGGA TGCCGAGCGG GTCCGGTCGT TGCGGCCGGG GCATCCGGCG
TATGTGATCT ATACGTCGGG GTCGACGGGT ACGCCGAAGG GTGTGCTGAT TCCGCAGCGT
AATGTGGCTG CCCTCATCGA GACGGCGGGT CGGGTGTACG GGCTGGGCGC CGATGATGTG
TGGAGTTTGT TCCACTCCTA TGCCTTCGAT TTTTCGGTGT GGGAGATGTT CGGTGCGTTG
CTGCTCGGTG GCCGGGTTGT GGTGGTGGCG CACTCGGTGA GTCGGTCGCC GCGGGAGTTC
GTTGAGTTGC TGAGCCGGAC GGGTGTGACG GTGCTCAGCC AGACTCCGTC GGCGTTCTAT
CAGGTGATCG GTGAGTTGGC TGCTGCCGGG GTCGGTTCCT CGTTGCGGTA TGTGGTGTTC
GGTGGTGAGG CGCTGGAACC TGCCCGGTTG CGGCAGTGGT ATGACCGGTA TCCCGGCGAC
GTCCCGGTGT TGGTCAACAT GTACGGCATT ACCGAGACGA CGGTCCATGT CACGCACATC
GCGTTGGACC GGGAGCGGGT GGTGGCGGGG ACGGGCAGTG TGGTGGGTGG CCCGTTGCCG
GGTGTCCGGA CGTATGTGTT GGACGAGTTC CTGCGGCCGG TGCCTCCCGG GGTGGTCGGT
GAGCTTTATG TGGCGGGTGC CGGGCTGGCC CGTGGCTATC TCAATCGTCC CGCGTTGACC
GGGGAGCGGT TCGTGGCCTG CCCGTTCGGG GGGTCGGGGG AGCGCATGTA CCGCACGGGT
GACCTGGCCC GGTGGACCGG CGATGGTGGG CTGGTGTTCG CCGGGCGGGC GGATGCGCAG
GTGAAGATCC GTGGTTTCCG GATCGAGCCC GGCGAGATCG AGGCCGTGCT GTCCGGGCAT
CCCGCCGTCG ACCAGGTCGC GGTGCTCGCC CGGGAGGACC AGCCTGACCG CAAGCGACTG
GTCGCCTACG TGGTGCCCGC CTCGGGCACC GGCTTCGATC CCGGGGAGCT CCGGGAGTTC
GTGGCCGGGC GGCTGCCCGA GTACATGGTC CCCGCGGTGG TGGTCGAGGT GGCGGAGCTG
CCGCTGACCG CCAACGGCAA GCTGGACCGC GCGGCGTTGC CCGCCCCCGA CTTCGGTGCT
CTGGCGACCG GGCGGGGGCC GCGCACCGCG GTCGAGGAGC GGTTGTGCGC CCTGTTCGCC
GAGGTCCTGG ACCTGGCGCG GGTCGGGGCC GACGACGGCT TCTTCGACCT CGGCGGCGAC
TCGCTGCTGG CCATGCGGCT GATCGCTCGC GTGCAGGCCG AGCTGAACGT CGGGATGGAC
ATCCGCGCGC TGTTCGCCGA GCCCACCCCG GCCGGTGTCG CCGGGCTGGT CGGCGAGGGC
GGCGCGGCCC GCGCCGCGTT GGTCCCGAGG CCCAGGCCCG ACGTGATCCC GCTGTCGTAC
GGCCAGGCCC GGATGTGGTT CCTCAACCGG CTCCAGGAGG GCAGCGCGGT CTACAACACG
CCGTACGCGC TTAACCTGAG CGGAGACCTC GACCGATCGG CGTTACAGGC GGCGCTGACC
GATGTCGTGC GGCGGCACGA GGCCCTGCGC ACCGTGCTCC CCGACACCGA CGGTGTCCCC
CGCCAGCAGA TCCTGCGGGA GGACCCCGAA CTCGTGATCG TCTTCGCCGC GGCGGAGGAG
CTGCCCGGTC TGCTGGCGGC CGAGGCGGGC CGCGGCTTCG ACGTCGGGCG TGAGCCGCCG
TTGCGGGCCC GGCTGTTCGC GCTGTCCGAG CGGGAGCACG TGCTGTCGCT GGTCATCCAC
CACGTCGCGA CCGACGCCTG GTCCATGAGC GTGCTGGCCA GGGACCTGCC CACGGCCTAC
GCGGCGCGGT CCCGCGGGCA GGCCCCGTCG TGGGAGCCGC TTCCGGTGCA GTACGCCGAT
TTCGCCATGT GGCAGCGTGA CCTGCTGGGC GACGAGTCCG ACCCGGACAG CCTGATCAGC
GAGCAACTGG CCTACTGGCG CGAGGCACTG GCCGACCTGC CCGCCGAGCT CGCCCTGCCC
GCCGACCGGC CGCGCCCGGC CGTGGCGAGC TTCACCGGTG GTGAGGTGCC GATCCGGATC
AGCCCCGCGG TGCACGCCCG GCTCACCGAC CTCGTGCGCG GCGGCCGGGG AACGCTGTTC
ATGGTGGTCC AGTCGGCGAT CGCGGTGCTG CTGTCCCGGC TCGGCGCGGG CACCGACATC
CCCATCGGGG CGCCGGTCGC CGGCCGCGGT GACACCGCGC TGGACGACCT GATCGGCTTC
TTCGTCAACA CCCTGCTGCT GCGTACCGAC GTCAGCGGCG ACCCCTCGTT CGAGGAACTG
CTGGCCCGGG TGCGGGAGCG GAACCTGGCC GCCTACGCCC ACCAGGACGT GCCGTTCGAG
CGGCTGGCCG AGGAGTTCCG TGGCCGCGCC CGTCACCCCG TCTTCCAGGT CCTGCTGGCC
TTTCAGAACG TGCCGCTGGA CACGCCGTGG GAACTGCCGG GACTGACTGT GCGGCCGGTC
CAGGGTGACG GGGACGCCGT CGAGTTCGAT CTGTCCTTCA GCCTGGAGGA ACGCAGGACC
GCCGCCGGGA CACCGGCCGG CATCGAGGGC GTGGTGCGCT ACTCCGCCGA CCTGTTCGAC
CGTTCGACGG TGCGGAGGCT GGCCGAACGT CTGCTGGGCG TGCTGGAGCG CGTCGCCGCC
GATCCCACGC TGCGGGTCAG CCAGGTGCCC GTGCTGGGTG CGGACGAGCG TCACCGGGTC
CTCCAGGAGT GGAACGACAC CGGGGCCGCG GTGGCCGACG GCACGCTGAC CGGGGCGTTC
GCCGCCCGGG TGGCCGAGTG TCCCGACGCG GTGGCAGTGC TGGACCGGTA CGTCACGCTG
ACCCACACGC ACCCGGACAC GGCGGCGAAC TGGGTTGCGC AGGACCGGTA CGTCACGCTG
ACCTACGCGC GCCTGGACAC GGCGGCGAAT CGGGTGGCGC GGGATTTGGT GGCGGCTGGG
GTGCGGTCTG GTGATCGGGT TGGGGTGGTG ATGGAGCGGT CGGTGGAGTT GGTGGCGGTG
TTGGTGGGGG TGGTGAAGGT GGGGGCGGCG TATGTGCCGG TGGATGTGGA GTGGCCGGTG
GTGCGGGTGG GGCGGGTGCT GGCTGAGGCG GGGGTGCGGG TGGTGGTGGC CGACGACTGG
GCGCCTGATC TGCCCGAGTC TGTCGGGGTG GTGTGGGCGG GTGGCTGGGT GGATGGGGAG
GGGGAGTGTG GGCCGCCGGC GGTGCGGGTG GGTGCGGATG ATGTGGCGTA TGTGATGTAT
ACGTCGGGGT CGACGGGGGT GCCGAAGGGT GTGGCGGTGA CGCATGCGGG TGTGGTCGGG
TTGGCGGCGG ATCGGTGTTG GTCGCGGGAG GTTCATGGGC GGGTGTTGTT TCATGCGTCG
CATGCGTTTG ACGCGTCGAC GTGGGAGTTG TGGGTGGCGT TGTTGTCGGG GGGTCAGGTG
GTGGTGGCGC CGGCCGGGCG GGTCGACGCT GGGGTGCTGA AGGGGTTGAT TTCGGATTTT
GGGCCGACGG TGGTGCATGT GACGGCGGGG TTGTTTGCGG CGGTGGCGGA GGAGGCGCCG
GGGTGTTTTG TGGGGGTGCG TGAGGTGGTG ACGGGTGGGG ATGTGGTGAG TGCGGCGGCG
GTGGTGCGGG TGGTGGAGGC GTGTCCGGGG GTGGTGGTGC GGCAGTTGTA TGGGCCGACG
GAGGTGACGG TGTGTGCGAC GGTGTTTGAG GTGCGGCCGG GGGATGAGGT TGCCTCGGTG
GTGCCGATTG GCCGTCCGAT GGATAACACC CGGGTGTTTG TGTTGGATCG GTTTTTGCAG
CCGGTGCCGC CGGGGGTGAC GGGTGAGTTG TATGTGGCGG GTGTGGGGTT GGCGCGTGGG
TATTTTGGCC GGCCTGGGTT GACGGGGGAG CGGTTTGTGG CGTGTCCGTT TTCCGGGTCT
GGGGAGCGGA TGTATCGGAC GGGGGATTTG GGGCGGTGGA CGGGGGAGGG GCAGTTGGTG
TTCGCCGGTC GGGCGGACGC GCAGGTCAAG ATCCGTGGTT TTCGGATCGA ACCGGGTGAG
GTGGAGGCGG TGCTGGTCAT GCACCCGGGC GTCAGCCAGG GCGCGGTCAT CGCGCGCGCG
GACCAGCCGG GGCAGAAACG GTTGGTCGCC TATGTCGTCG CCTCCGACGG GGAGACGCTC
GACACCGTCC AGATCCGCGA CTTCGTGGCG GGCCTGCTGC CCGACCACAT GATCCCTTCA
GCCGTGGTCG TGCTCGACGC GCTGCCGCTG ACCGCCAACG GCAAGGTCGA CCGTGCCGCC
CTGCCCGCCC CCGACTTCGC CGGCCTGGTG ACCGGCCGGG AGCCGCGCAC CTCGGTCGAG
GAATCGCTGT GCACCCTGTT CGCCGAGGTG CTGCGCCTGG AGCGGGTCGG GGCCGACGAC
GACTTTTTCG ACCTCGGCGG TGACTCCCTG CTGGCCATGC AGCTGATCGC ACGGATCAGG
AACCTGCTGC GGACGGCGCT GACCATCGGC GAGCTGATGG CCGAGCCGAC ACCCGCCGGG
GTCGCCACGC TGGTGCGGGC CGGCGGCGAC CCGGCGGCCG ACGAGCCGGT GCTCGCGCCC
GTGCAACGGC CCGAGGCGGT GCCGCTGTCG TTCGGCCAGG CCCGGATGTG GTTCCTCAAC
CGGCTCGAGG ACGGCGAGGC GCTCTACAAC ATCCCGGTGC AGCTGCGGCT GCGCGGCGAC
CTGGACCGGA CCGCGCTGTG GGCCGCGCTC GGCGACGTGG TCACACGGCA CGAGAGCCTG
CGGACGGTGT TCCCCGACCC CGACGGCATC CCGCGGCAGC AGATCCTGAC CGCTGAGGCC
GCACGCCCCA CGCCTGTGGT CGTACCGACC GACGAGGACG AGCTGCCCAG CCGGCTGACG
GCCGAGGCCA CCCGGGGCTT CGACGTGAGC CGCGACCTGC CGGTACGGGC CACGCTGTTC
GCCGTGCCCG ACGGCAGCCA CGTGCTGTCA CTCGTCGTCC ATCACATCGC CGCGGACGGC
TGGTCGATGG GGGTGTTCGC CCGGGATCTG GCCACGGCCT ACGCGGCGCG GCGGAACGGG
CAGGCCCCGC CGTGGGCGCC GCTGCCCGTG CAGTACGCCG ACTACTCCAT CTGGCAGCGC
GAGGTCGCGG CCGGCGAGGA CCGGTCGGAC GCGCACCTGG CGTACTGGCG GCAGGCGCTG
GCCGACCTGC CCGCCGAGCT GAACCTGCCG GTGGACCGGC CCCGCCCCGC CCTGCCCGGC
TTCCAGGCCG GATCCGTGCC CATCCGGCTC GGCGCGCGGA CACACGCCCG CCTGGCCGAC
GTGGCCAGGG GCCAGGCTGC GACGCTGTTC ATGGCGGTGC AGGCGGCCGT AGCGCTGTTG
CTGTCCAAGC TGGGCGCGGG CAGCGACATC CCGCTGGGCA CGGCAGTGGC CGGCCAGGGG
AACGCCGCGC TGGACGACCT GATCGGTTTC TTCATCAACA CCCTCGTCCT GCGCACCGAT
GTCGGCGGTG ACCCGACCTT CGTCGAACTC GTTGGCCGGG TCCGCGAGGG CGACCTGGCC
GCCTTCGCCC ACCAGGACGT GCCCTTCGAG CGGCTGGTCG AGGAATTTCA CCCGGCCCGA
TCCCTGGCCC GCCACCCGCT GTTCCAGGTG ATGCTCGGCT TCCGGAGCAC CCCGCAGCGG
GAGTGGCACC TGGCCGGTCT CGACACCCAG GTGATGCCGT CGCAGGCCGC CACCGCCAAG
TTCGACCTGT CCTTCGACCT CGCCGAGTAC CGCGATGAGG CGGGCGCGGC GGCGGGCATC
GACGGGGAAC TGCACTACTC GGCCGACCTG TTCGACCGGC GGACGGCCGA GGACCTCGTC
GTACGGCTGG TCCGGGTGGT TGAGGCGGTC GCGGACGACC CGCACCTGCG GGTCAGCCAG
GTCGACGTGC TGGACGACGC GGAGCGGGCC AGGATCGTCG GCGAGTGGAA CGACACCGGC
GTACCCCTCG GCCACACCAG GCTCACCGCG GCGTTCGATG CCCAGGTGGC CGCCCGCCCG
GACGCGGTGG CGGTGGCGGC AGGAGATGTG CGGCTGTCGT ACGCGCGGCT GGCGCAGGCC
GCGGACCGGG TCGCGCACAG GTTGGCGGTG GCGGGCGTAC AGCCGGGTGA CCTGGTCGGC
GTGGCGCTGG AGCGCTCGGC CGAGCTGGTG GCGGTGCTCA TCGGGGTGCT CAGGGCGGGC
GCGGCCTACG TGCCGGTCGA CCTGGAGTGG CCTTCGGCCC GGGTGGCGCA GGTGCTGGCC
GGGACCGGTG TGGTGGTGGC CTCGGCGGGG TTCGCCGCGC CGCCGGGCGT GGGCGTGGTG
CCGGTGGGCG ACTGGGTGCT GTCCGGGCCG CCGCTGACGC CGCCGTACGT CGTGGCAGGC
CACGGCGACC TAGCGTACGT GATGTATACC TCGGGATCGA CGGGCGTACC GAAGGGCGTG
GCGGTGACGC ACGCCGGGGT CGTCTCCCTG GCCGCCGACC GGCACTGGTC CGGCGGGGCT
GATCAGCGCG TGCTGTTCCA CGCCCCGCAC GCCTTCGACG CCTCGACATG GGAGCTGTGG
GTGCCGCTGC TGGCGGGCGG CCAGGTCGTG ATCGCCCCGC CGGGACCGCT GGATGCCGCC
GGGCTGGCCG AGTTGATCTC CGGTGCCGGG CTGACGGCCG TGCACGTGAC CGCCGGTCTG
CTCGCGGCGC TGGCCGAGGA GGACCCCGGC TGTTTCGCCG GGCTGCCCGA GCTGCTGACC
GGCGGGGACG TGGTCAGCGC CACCGCCGTC GCTCGCGTCG CGGCCGCGTG CCCGGACACC
GTCGTGCGGC ACCTGTACGG CCCGACCGAG ATCACCATGT GCGCGACCGT GTTCGACATC
CGGCCGGGGG AGGAGGTCCC CGGGCCGCTG CCGATCGGGC ATCCGCTGGA CAACACCCGG
ACCTATGTGC TGGATGATCT GCTGCAGCCG GTGCCGCCGG GGGTGGTCGG TGAGCTTTAT
CTTGCGGGTC CGGGGCTGGC TCGTGGTTAC TGGGCTCGTG CGGGGTTGAC CGGTGAGCGG
TTTGTGGCGT GTCCGTTTTC CGGGTCTGGG GAGCGGATGT ACCGGTCGGG GGATCTGGTT
CGGTGGACTG CTGCTGGTGA GTTGGTGTTT GTGGGGCGGG CGGACACGCA GCTTAAGATT
CGTGGGTTTC GGGTTGAGGT GGGTGAGGTT GAGGCGGTTT TGGCGGTGTT TCCGGGGGTG
ACTCGGGTGG TGGTGGTGGC TCGGGAGGAT CGGCCGGGTC ACAGGTATCT GGTGGGTTAT
GTGGTGCCGG GGGATGTTGA TGGTCGTGCG GTGCGGGAGT TCGCGGCGGA GCGGTTGCCG
GAGTATCTGG TTCCGGCGGG GGTTGTTGCG TTGCCGGCGT TGCCGGTGAC GCCTAATGGC
AAGCTTGATC GTGGGGCGTT GCCGGCGCCG GATTTCGGTG GGTTGGTGAC TGGGGGGGCG
CCGCGTACCG CGGTCGAGGA GGTGTTGTGT TCGTTGTTTG CGGAGGTGTT GCGGCTTGAT
CGGGTGGGGG TCGACGACGG GTTCTTCGAG CTGGGTGGCG ATTCCCTGCT CGCGATGCGG
CTGATCGCGC GGATCCGGGA GACGCTGGAC GTCGAGGTGA ACATCCGCAA GCTGTTCGTC
ACGCCGACGC CGGCGGGCGT CGCCCGGCTG CTCGACGGCG GCGGACGGCC CCGGGCGGCG
CTGGTCCGGG CGGTCCGCCC GGCGGTGGTT CCGCTGTCGT ACGGCCAGAC CCGGATGTGG
TTCCTCAACC GGCTTGAGGG CGGCGCGGCG GTCTACAACA TTCCGCTGGT CCTGCGGCTG
CGCGGCGACC TCGACGTGGC GGCCCTGCGG GCGGCGCTGG GCGACGTCGC GTTGCGACAC
GAGAGCCTGC GGACGATATT TCCTGACGTT GGCGGAACGC CACAATCGCG GATCTTGACG
GGTGAGGCCG GCTCTCCCGT GCTGTCGGTG GTGGAGGTGG CGGCGGAGGA TGTGCCGTTG
TTGCTGCGGG CGGAGGTGGG GCGGGGTTTT GATGTGGGGC GGGAGTTGCC GTGGCGGGTG
TCGTTGTTCG TGGTGTCCGC GCGGGAGCAT GTTCTGGTGG TGGTGGTGCA TCATATTGCG
GCGGATGGCT GGTCGATGGG GGTGTTGGGG CGTGATTTGT CGGCGGCGTA TGCGGCGCGG
TTGTCGGGGC GGGCGCCGTC GTGGGTGGGG TTGCCGGTGC AGTATGCGGA TTATGCGTTG
TGGCAGCGTG CGGTGTTGGG GAGTGAGTCT GATCCGGGTA GTTTGTTGAG TGCGCAGTTG
GGGTATTGGC GTTCTGCTTT GGCGGGTCTT CCGGTGGAGT TGGTGTTGCC GGTGGATCGG
CCGCGTCCGG CGGTGGCGAG TTATCGGGGT GGGGCGGTGC CGGTGCGGGT GGGTGCGGGG
GTGCATGGGC GGTTGGTGGA GGTGGCGCGG GCGGGGCAGG CGACGTTGTT CATGGTGGTG
CAGGCGGCGG TGGCGGTGTT GCTGTCGCGG TTGGGTGCGG GGGTTGATAT TCCGGTGGGG
ACGGCGGTGG CGGGTCGGGG TGCGGCGGCG TTGGATGATC TGGTCGGGTT TTTTGTCAAT
ACGTTGGTGT TGCGGGTCGG TCTTGGTGGT GATCCGTCGT TTGCTGAGGT GGTGGGTCGG
GTGCGTGAGG TGGATCTGGC TGCCTATGCG CATCAGGATG TGCCGTTTGA GCGGTTGGTG
GAGGAGGTGC AGCCGGTTCG TTCGTTGGCC CGGCATCCGT TGTTCCAGGT CATGCTGACC
TTCCAGAACG CTCCCCGGAC CTCGGGCTGG GAACTGCCCG GGCTGGTGGT CGAGCGGCAC
GGCTCCGGGG AGATCGAGAC CGCCAAGTTC GACCTGTCTT TGGCGTTGAC CGAGCATCGT
GATGCCGAGG GTGGTGCGGC GGGGCTGGCT GGGGTTTTGG AGTATTCGGC TGATCTGTTC
GATCGGTCGA CCGCGGAGGG GTTGGTGGGG CGTCTGGTTC GGTTGCTTGA GGTGGTGGGG
GCTGATCCTG GTCTGCGGTT GAGTCAGGTG GATGTGCTGG CGGACGGTGA GTATGACCTG
GTGGTGCGGG CGTGGAACGG CTCCGCTGTT GGTGGCTCTG CTGTTGGTGG CTCTGCTGTT
GGGGTGTCGG CCAGGACGTT GCCGGAGATG TTTCAGGCGC AGGTGGTCGC GCGGCCTGAT
GCGGTGGCGG TGGTCTGTGA GGATGTGCGG TTGACCTATG CGGAGTTGGA TGCCGCGGTG
AACCGGCTGG CTCGTCTGTT GGTGGGTTTG GGGGTGGGGC CGGAACGGAT TGTGGCGGTG
GCGTTGCCCC GGTCGGTGGA GATGGTGGTG GCGTTGCTGG CGGTGCTGAA GGCGGGGGCG
GCTTATCTGC CGGTGGATCC GGAGTATCCG GCCGCCCGGC AGGCGTTTAT GCTGGCCGAT
GCCGCTCCCG TGGTGACGTT GGGTACGGCG CGGACCGTGG GGGCGTTGCC TGAGCACGGG
GCGGTCAGGG TTGTCGTGGA CGCCCCGGAT ACGGTTCGTG TGCTGGCTGG GCTGCCTGGT
ACGGCGGTGC GGGATGCCGA GCGGGTCCGG TCGTTGCGGC CGGGGCATCC GGCGTATGTG
ATCTATACGT CGGGGTCGAC GGGTACGCCG AAGGGTGTGC TGATTCCGCA GCGTAATGTG
GCTGCCCTCA TCGAGACGGC GGGTCGGGTG TACGGGCTGG GCGCCGATGA TGTGTGGAGT
TTGTTCCACT CCTATGCCTT CGATTTTTCG GTGTGGGAGA TGTTCGGTGC GTTGCTGCTC
GGTGGCCGGG TTGTGGTGGT GGCGCACTCG GTGAGTCGGT CGCCGCGGGA GTTCGTTGAG
TTGCTGAGCC GGACGGGTGT GACGGTGCTC AGCCAGACTC CGTCGGCGTT CTATCAGGTG
ATCGGTGAGT TGGCTGCTGC CGGGGTCGGT TCCTCGTTGC GGTATGTGGT GTTCGGTGGT
GAGGCGCTGG AACCTGCCCG GTTGCGGCAG TGGTATGACC GGTATCCCGG CGACGTCCCG
GTGTTGGTCA ACATGTACGG CATTACCGAG ACGACGGTCC ATGTCACGCA CATCGCGTTG
GACCGGGAGC GGGTGGTGGC GGGGACGGGC AGTGTGGTGG GTGGCCCGTT GCCGGGTGTC
CGGACGTATG TGTTGGACGA GTTCCTGCGG CCGGTGCCTC CCGGGGTGGT CGGTGAGCTT
TATGTGGCGG GTGCCGGGCT GGCCCGTGGC TATCTCAATC GTCCCGCGTT GACCGGGGAG
CGGTTCGTGG CCTGCCCGTT CGGGGGGTCG GGGGAGCGCA TGTACCGCAC GGGTGACCTG
GCCCGGTGGA CCGGCGATGG TGGGCTGGTG TTCGCCGGGC GGGCGGATGC GCAGGTGAAG
ATCCGTGGTT TCCGGATCGA GCCCGGCGAG ATCGAGGCCG TGCTGTCCGG GCATCCCGCC
GTCGACCAGG TCGCCGTCGT GATGCGTGAG GACCAGCCCG GCCACCGGCA CCTCGTGGCC
TATCTCGCCG GGACCGCCGG GACCGCCGGA ACCGCCGGGG ACGGCTCGGA CCTCCGGGAC
TTCGCGGCCG GGCTGTTGCC GGACTACATG GTTCCTTCCG CGGTAGTGCT GCTGGACGCG
TTGCCGTTGA CGGTCAACGG CAAGCTGGAC CGGGACGCGC TGCCGGCTCC CGACTTCGCG
GGCCTGGCCG GTGGCCGGGA GCCCCGGACG CCCGTCGAGG AGGCGCTGTG CGCGCTGTTC
GCCGAGCTGC TGCACCTGGA GTACGTCGGG GCCGACGACA GCTTCTTCGA CCTCGGCGGC
GACTCGATCA TGTCGATGCA GCTGGTGGCC CGGGCCCGCC GTGCGGGCAT GGTGATCACG
CCCAGGCAGG TGTTCGAGGA CAAGACGCCC GCCCGCCTCG CGCTGGTGGC GGAGAGCAGG
CCCGCCGGAC CGGCGGTCGA CGACCTGGCC GTCGGTGAGG TCCCGTTGAT CCCGGTGATG
CGTTGGGTGG CCGAGCGGAC CGGGCTGCGC CGGTTCTCCC AGTCGGTGCT GACGATCGTG
CCGGCTGGGC TGGGCGAGGG CCGGTTGGTC ACGGCGGTCC AGGCTCTGGT GGACCGGCAC
GACGCGCTGC GGGCGCGGCT GGTGTGCCCC GGCCCGGACG TCGCCTCGTG GCGGCTGGAC
ATTCCGCCGC CTGGTCTGGA CGCCTCCTCG TCGGTGCACC GGGTGGACGC CGCCGGTCTG
ACCGGGCCCG AGCTGACCTC GCTGGTGGCC GCGGTGGGCC GGTCGGCGGC GCGGCGGCTC
GATCCGGAGG CCGGGGTGAT GCTGCAGGTG GTGTGGCTGG ATCGGGGGCC GGATGCCCCC
GGCCGGGTGC TGCTGGTGGC GCACCACCTG GTGGTCGACG GGGTGTCGTG GCGGGTGCTG
CTGCCGGACC TGGCGGCGGC CTGTACGGGG GCTTCGCTGG AGCCGGTGGG CACCTCGTTC
CGCCGGTGGG CGGGGCTGCT GGCCGGCTCG GCGGACGACC CGGCGCGGGT GGCGGAACTG
CCTGGGTGGC AGCGGTTGCT GGCCGATCCC GAGCCGCCGC TGGGCGGGCG TCCCCTGGAC
CCCGCTCGCG ACACGGTGTC GAGCGTACGG CGGGTGTCGG TCCCGGTGCC GCGTGACGTG
ACGGCGGCGC TGCTGACAAC CGTACCCGCG GTGTTCCACG CCGGGATCGA CGACGTGCTG
CTGACAGGTC TGTCGCTGGC GGTGACCGAA TGGCGCGGGG TGCCAGGCCC GGTGCTGGTG
GATGTGGAGG GGCACGGGCG CGAGCCGCTG GCCGATGACG TGGATCTGTC GCGTACGGTC
GGCTGGTTCA CCAGCGTGCA TCCCGTCCGG CTGGACCCGG GTCGGGTGGA CTTCGCCGAG
GTACGGGCGG GTGGCGATGC CGCGGGCGTG GTGATCAAGC GGGTGAAGGA GCAGGTGCGG
GCGGTGCCGG GCGATGGCCT GGGCTTCGGC GTGCTGCGCT ATCTCAACGT GGTCACGGGA
CCGGCGCTGG CCGCGCCACC GGTGCCGCAG ATCGGGTTCA ACTACCTGGG CCGGTTCACC
ACCTCGGCCA GGCAGGAGGA GTGGCAGCCG GTGGCGCTGG GCGGGGACAT GCCCGAGCGG
ATGCCCGTCG CGCACGCGCT GGAGGCGGAC GGGATCGTCG AAGACGGGCC CGACGGGCCC
GAGCTCACCG TGTCGCTGTC GTGGCCTGCC GGTCTTCTCG AGCCGGACGC GGTGCGGGAG
CTGACCGACG GGTGGGTGGC GATGCTGACC GGGCTGGCCG CTCAGGCGGG CCGCCCGGGG
GCCGGCGGGC ACAGCCCGTC CGACTTTCCG CTGCTCAGCC TGGCCCAGCA GCAGCTTGAG
GAGCTGGAAG CGGAAATCGC GATGGAGGAC TAG
 
Protein sequence
MPGTADLTLP EMFQAQVVAR PDAVAVVCED VRLTYAELDA AVNRLARLLV GLGVGPERIV 
AVALPRSVEM VVALLAVLKA GAAYLPVDPE YPAARQAFML ADAAPVVTLG TARTVGALPE
HGAVRVVVDA PDTVRVLAGL PGTAVRDAER VRSLRPGHPA YVIYTSGSTG TPKGVLIPQR
NVAALIETAG RVYGLGADDV WSLFHSYAFD FSVWEMFGAL LLGGRVVVVA HSVSRSPREF
VELLSRTGVT VLSQTPSAFY QVIGELAAAG VGSSLRYVVF GGEALEPARL RQWYDRYPGD
VPVLVNMYGI TETTVHVTHI ALDRERVVAG TGSVVGGPLP GVRTYVLDEF LRPVPPGVVG
ELYVAGAGLA RGYLNRPALT GERFVACPFG GSGERMYRTG DLARWTGDGG LVFAGRADAQ
VKIRGFRIEP GEIEAVLSGH PAVDQVAVLA REDQPDRKRL VAYVVPASGT GFDPGELREF
VAGRLPEYMV PAVVVEVAEL PLTANGKLDR AALPAPDFGA LATGRGPRTA VEERLCALFA
EVLDLARVGA DDGFFDLGGD SLLAMRLIAR VQAELNVGMD IRALFAEPTP AGVAGLVGEG
GAARAALVPR PRPDVIPLSY GQARMWFLNR LQEGSAVYNT PYALNLSGDL DRSALQAALT
DVVRRHEALR TVLPDTDGVP RQQILREDPE LVIVFAAAEE LPGLLAAEAG RGFDVGREPP
LRARLFALSE REHVLSLVIH HVATDAWSMS VLARDLPTAY AARSRGQAPS WEPLPVQYAD
FAMWQRDLLG DESDPDSLIS EQLAYWREAL ADLPAELALP ADRPRPAVAS FTGGEVPIRI
SPAVHARLTD LVRGGRGTLF MVVQSAIAVL LSRLGAGTDI PIGAPVAGRG DTALDDLIGF
FVNTLLLRTD VSGDPSFEEL LARVRERNLA AYAHQDVPFE RLAEEFRGRA RHPVFQVLLA
FQNVPLDTPW ELPGLTVRPV QGDGDAVEFD LSFSLEERRT AAGTPAGIEG VVRYSADLFD
RSTVRRLAER LLGVLERVAA DPTLRVSQVP VLGADERHRV LQEWNDTGAA VADGTLTGAF
AARVAECPDA VAVLDRYVTL THTHPDTAAN WVAQDRYVTL TYARLDTAAN RVARDLVAAG
VRSGDRVGVV MERSVELVAV LVGVVKVGAA YVPVDVEWPV VRVGRVLAEA GVRVVVADDW
APDLPESVGV VWAGGWVDGE GECGPPAVRV GADDVAYVMY TSGSTGVPKG VAVTHAGVVG
LAADRCWSRE VHGRVLFHAS HAFDASTWEL WVALLSGGQV VVAPAGRVDA GVLKGLISDF
GPTVVHVTAG LFAAVAEEAP GCFVGVREVV TGGDVVSAAA VVRVVEACPG VVVRQLYGPT
EVTVCATVFE VRPGDEVASV VPIGRPMDNT RVFVLDRFLQ PVPPGVTGEL YVAGVGLARG
YFGRPGLTGE RFVACPFSGS GERMYRTGDL GRWTGEGQLV FAGRADAQVK IRGFRIEPGE
VEAVLVMHPG VSQGAVIARA DQPGQKRLVA YVVASDGETL DTVQIRDFVA GLLPDHMIPS
AVVVLDALPL TANGKVDRAA LPAPDFAGLV TGREPRTSVE ESLCTLFAEV LRLERVGADD
DFFDLGGDSL LAMQLIARIR NLLRTALTIG ELMAEPTPAG VATLVRAGGD PAADEPVLAP
VQRPEAVPLS FGQARMWFLN RLEDGEALYN IPVQLRLRGD LDRTALWAAL GDVVTRHESL
RTVFPDPDGI PRQQILTAEA ARPTPVVVPT DEDELPSRLT AEATRGFDVS RDLPVRATLF
AVPDGSHVLS LVVHHIAADG WSMGVFARDL ATAYAARRNG QAPPWAPLPV QYADYSIWQR
EVAAGEDRSD AHLAYWRQAL ADLPAELNLP VDRPRPALPG FQAGSVPIRL GARTHARLAD
VARGQAATLF MAVQAAVALL LSKLGAGSDI PLGTAVAGQG NAALDDLIGF FINTLVLRTD
VGGDPTFVEL VGRVREGDLA AFAHQDVPFE RLVEEFHPAR SLARHPLFQV MLGFRSTPQR
EWHLAGLDTQ VMPSQAATAK FDLSFDLAEY RDEAGAAAGI DGELHYSADL FDRRTAEDLV
VRLVRVVEAV ADDPHLRVSQ VDVLDDAERA RIVGEWNDTG VPLGHTRLTA AFDAQVAARP
DAVAVAAGDV RLSYARLAQA ADRVAHRLAV AGVQPGDLVG VALERSAELV AVLIGVLRAG
AAYVPVDLEW PSARVAQVLA GTGVVVASAG FAAPPGVGVV PVGDWVLSGP PLTPPYVVAG
HGDLAYVMYT SGSTGVPKGV AVTHAGVVSL AADRHWSGGA DQRVLFHAPH AFDASTWELW
VPLLAGGQVV IAPPGPLDAA GLAELISGAG LTAVHVTAGL LAALAEEDPG CFAGLPELLT
GGDVVSATAV ARVAAACPDT VVRHLYGPTE ITMCATVFDI RPGEEVPGPL PIGHPLDNTR
TYVLDDLLQP VPPGVVGELY LAGPGLARGY WARAGLTGER FVACPFSGSG ERMYRSGDLV
RWTAAGELVF VGRADTQLKI RGFRVEVGEV EAVLAVFPGV TRVVVVARED RPGHRYLVGY
VVPGDVDGRA VREFAAERLP EYLVPAGVVA LPALPVTPNG KLDRGALPAP DFGGLVTGGA
PRTAVEEVLC SLFAEVLRLD RVGVDDGFFE LGGDSLLAMR LIARIRETLD VEVNIRKLFV
TPTPAGVARL LDGGGRPRAA LVRAVRPAVV PLSYGQTRMW FLNRLEGGAA VYNIPLVLRL
RGDLDVAALR AALGDVALRH ESLRTIFPDV GGTPQSRILT GEAGSPVLSV VEVAAEDVPL
LLRAEVGRGF DVGRELPWRV SLFVVSAREH VLVVVVHHIA ADGWSMGVLG RDLSAAYAAR
LSGRAPSWVG LPVQYADYAL WQRAVLGSES DPGSLLSAQL GYWRSALAGL PVELVLPVDR
PRPAVASYRG GAVPVRVGAG VHGRLVEVAR AGQATLFMVV QAAVAVLLSR LGAGVDIPVG
TAVAGRGAAA LDDLVGFFVN TLVLRVGLGG DPSFAEVVGR VREVDLAAYA HQDVPFERLV
EEVQPVRSLA RHPLFQVMLT FQNAPRTSGW ELPGLVVERH GSGEIETAKF DLSLALTEHR
DAEGGAAGLA GVLEYSADLF DRSTAEGLVG RLVRLLEVVG ADPGLRLSQV DVLADGEYDL
VVRAWNGSAV GGSAVGGSAV GVSARTLPEM FQAQVVARPD AVAVVCEDVR LTYAELDAAV
NRLARLLVGL GVGPERIVAV ALPRSVEMVV ALLAVLKAGA AYLPVDPEYP AARQAFMLAD
AAPVVTLGTA RTVGALPEHG AVRVVVDAPD TVRVLAGLPG TAVRDAERVR SLRPGHPAYV
IYTSGSTGTP KGVLIPQRNV AALIETAGRV YGLGADDVWS LFHSYAFDFS VWEMFGALLL
GGRVVVVAHS VSRSPREFVE LLSRTGVTVL SQTPSAFYQV IGELAAAGVG SSLRYVVFGG
EALEPARLRQ WYDRYPGDVP VLVNMYGITE TTVHVTHIAL DRERVVAGTG SVVGGPLPGV
RTYVLDEFLR PVPPGVVGEL YVAGAGLARG YLNRPALTGE RFVACPFGGS GERMYRTGDL
ARWTGDGGLV FAGRADAQVK IRGFRIEPGE IEAVLSGHPA VDQVAVVMRE DQPGHRHLVA
YLAGTAGTAG TAGDGSDLRD FAAGLLPDYM VPSAVVLLDA LPLTVNGKLD RDALPAPDFA
GLAGGREPRT PVEEALCALF AELLHLEYVG ADDSFFDLGG DSIMSMQLVA RARRAGMVIT
PRQVFEDKTP ARLALVAESR PAGPAVDDLA VGEVPLIPVM RWVAERTGLR RFSQSVLTIV
PAGLGEGRLV TAVQALVDRH DALRARLVCP GPDVASWRLD IPPPGLDASS SVHRVDAAGL
TGPELTSLVA AVGRSAARRL DPEAGVMLQV VWLDRGPDAP GRVLLVAHHL VVDGVSWRVL
LPDLAAACTG ASLEPVGTSF RRWAGLLAGS ADDPARVAEL PGWQRLLADP EPPLGGRPLD
PARDTVSSVR RVSVPVPRDV TAALLTTVPA VFHAGIDDVL LTGLSLAVTE WRGVPGPVLV
DVEGHGREPL ADDVDLSRTV GWFTSVHPVR LDPGRVDFAE VRAGGDAAGV VIKRVKEQVR
AVPGDGLGFG VLRYLNVVTG PALAAPPVPQ IGFNYLGRFT TSARQEEWQP VALGGDMPER
MPVAHALEAD GIVEDGPDGP ELTVSLSWPA GLLEPDAVRE LTDGWVAMLT GLAAQAGRPG
AGGHSPSDFP LLSLAQQQLE ELEAEIAMED