Gene Franean1_0217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0217
Symbol
ID	5668642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	264473
End bp	265507
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	66%
IMG OID	641239146
Product	fructose-bisphosphate aldolase
Protein accession	YP_001504590
Protein GI	158312082
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0191] Fructose/tagatose bisphosphate aldolase
TIGRFAM ID	[TIGR00167] ketose-bisphosphate aldolases [TIGR01520] fructose-bisphosphate aldolase, class II, yeast/E. coli subtype

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.113705
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCATCG CCAGCCCAGA CGTCTACGCC GAGATGCTCA GCCGGGCGAA GTCGAACGCC 
TACGCCTACC CCGCCATCAA CGTGACCTCG TCGCAGACCC TCAATGCCGC GCTCCGGGGT 
TTCGCGGAAG CCGGCAGCGA CGGAATCGTC CAGGTGTCGA CCGGCGGCGC CGAGTTCCTC 
TCGGGAACGA CCATCAAGAA CATGGTGCTG GGCGCGGAAG CGCTCGCCGA ATACGCGCAC 
CACGTCGCCA AGGCATACCC GGTGAACATC GCGCTGCACA CGGACCACTG CCCCGCCGAC 
AAGCTGGACA CCTACATCCG CCCGCTGATC GCCATCTCGA AGGAGCGTGT GGCGCAGGGC 
CGCGACCCGC TTTTCCAGTC CCACATGTGG GACGGTTCGG CGGTCGAGCT CGAGGAGAAC 
CTCAAGATTG CCGACGAGCT GCTCGCCGAC TGTCGCGCGG CGCGCATCGT GCTGGAAGTC 
GAAATCGGTG TCGTCGGTGG TGAGGAGGAC GGCGTCGTAG GCGCCATCGA CGAGAAGCTC 
TACACCACCC CCGGTGACAT GTTCCGCACC GCCGAGGTTC TCGGCACCGG AGAAAAGGGC 
AGCTACATGC TGGCCGCGAC GTTCGGCAAC GTGCACGGCG TCTACAAGCC GGGGAACGTC 
AAGCTCCGGC CCTCGATCCT GCGCGAGGGT CAGCAGCACG TGGCCGAGAA GCTCGGCCTG 
GCCGCCGACG CGAAGCCGTT CAACCTGGTC TTCCATGGCG GCAGTGGGTC GGACCTCTCC 
GAGATCCGCG AAACGCTCGA CTACGGCGTC ATCAAGATGA ACGTGGACAC CGACACCCAG 
TACGCGTTCA CCCGGCCGAT CGTCGACCAC ATGCTCCGCA ACTACGACGG TGTCCTCAAG 
GTGGACGGTG AGGTCGGGGT CAAGAAGGCC TACGACCCGC GCACCTACGG CAAGGCCGCC 
GAAACCGCCA TGGCCGCCCG GGTCGCCCAG GCCTGTGACG ACCTGCGGTC CGCCGGCCGG 
TCGATCGGGG TCTGA

Protein sequence

MPIASPDVYA EMLSRAKSNA YAYPAINVTS SQTLNAALRG FAEAGSDGIV QVSTGGAEFL 
SGTTIKNMVL GAEALAEYAH HVAKAYPVNI ALHTDHCPAD KLDTYIRPLI AISKERVAQG 
RDPLFQSHMW DGSAVELEEN LKIADELLAD CRAARIVLEV EIGVVGGEED GVVGAIDEKL 
YTTPGDMFRT AEVLGTGEKG SYMLAATFGN VHGVYKPGNV KLRPSILREG QQHVAEKLGL 
AADAKPFNLV FHGGSGSDLS EIRETLDYGV IKMNVDTDTQ YAFTRPIVDH MLRNYDGVLK 
VDGEVGVKKA YDPRTYGKAA ETAMAARVAQ ACDDLRSAGR SIGV