Gene Francci3_4364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4364
Symbol
ID	3907336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	5211977
End bp	5213014
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	66%
IMG OID	637881695
Product	fructose-bisphosphate aldolase
Protein accession	YP_483439
Protein GI	86743039
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0191] Fructose/tagatose bisphosphate aldolase
TIGRFAM ID	[TIGR00167] ketose-bisphosphate aldolases [TIGR01520] fructose-bisphosphate aldolase, class II, yeast/E. coli subtype

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00568724
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCATCG CCACGCCAGA CGTATATGCC GAGATGCTCG ACCGGGCGAA GGCCCAGTCC 
TTCGCCTACC CCGCGATCAA CGTGACCTCG TCGCAGTCCC TGAACGCCGC GCTGCGGGGC 
TTCACCGAAG CCGGCAGTGA CGGCATCGTG CAGGTGTCCA CCGGCGGTGC CGAGTACCTG 
TCCGGCTCGA CGGTGAAGAA CATGGTCCTC GGCGCGGAGG CACTGGCCGA GTTCGCCCAC 
CACGTCGCGA AGGCGTATCC GGTCAACATC GCCCTGCACA CCGACCACTG CCCGGCCGAC 
AAGCTTGACA CCTACATCCG CCCCTTGATC GCGATCTCGA AGAATCGGGT GGCCCAGGGA 
CGCGAGCCGC TCTTCCAGTC GCACATGTGG GACGGCTCGG CGGTCCCCCT CGAGGAGAAC 
CTCAAGATCG CCGAAGAACT ACTCGCGGAC GCCGCCGCCG CGAAGATCGT TCTCGAGGTC 
GAGATCGGGG TCGTCGGCGG CGAGGAGGAC GGCGTCGTCG GCGCGATCGA CGAGAAGCTC 
TACACGACGC CGGAGGACAT GTGGCGGACG GCCGAGGTGC TCGGCACCGG CGCGAAGGGG 
CGCTACCTGC TCGCCGCCAC CTTCGGCAAC GTGCACGGTG TGTACAAGCC CGGAAACGTC 
AAGCTACGCC CGACGATTCT GCACGAAGGA CAGGAGTACG TCGCCAGGAA GCTCGGGCTG 
CCAGCCGGCG CGAAGCCGTT CAACCTCGTC TTTCACGGCG GTAGCGGGTC GGCTCTCACC 
GAAATCCGCG AGACCCTCGA CTACGGGGTG GTCAAGATGA ACGTGGACAC GGACACCCAG 
TACGCATTCA CCCGCCCCAT CGTGGACCAC GTGTTCAAAA ACTATGACGG CGTTCTCAAG 
GTGGACGGTG AGGTCGGCGT GAAGAAGGCG TACGACCCGC GTACCTACGG AAAGCTCGCG 
GAGAGCAGCA TGGCGGCCCG CGTCGCCCAG GCGTGTGAGG ACCTCCGTTC CGCCGGCACC 
AGCCTCGGGC GGGCATAG

Protein sequence

MPIATPDVYA EMLDRAKAQS FAYPAINVTS SQSLNAALRG FTEAGSDGIV QVSTGGAEYL 
SGSTVKNMVL GAEALAEFAH HVAKAYPVNI ALHTDHCPAD KLDTYIRPLI AISKNRVAQG 
REPLFQSHMW DGSAVPLEEN LKIAEELLAD AAAAKIVLEV EIGVVGGEED GVVGAIDEKL 
YTTPEDMWRT AEVLGTGAKG RYLLAATFGN VHGVYKPGNV KLRPTILHEG QEYVARKLGL 
PAGAKPFNLV FHGGSGSALT EIRETLDYGV VKMNVDTDTQ YAFTRPIVDH VFKNYDGVLK 
VDGEVGVKKA YDPRTYGKLA ESSMAARVAQ ACEDLRSAGT SLGRA