Gene Francci3_2487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2487
Symbol
ID	3904865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2933440
End bp	2934429
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	72%
IMG OID	637879817
Product	transketolase
Protein accession	YP_481583
Protein GI	86741183
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.511484
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.976548
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCG CGACCATGGT GCGGGCCCTC AACGCCGCGC TGCGCGACTC GCTGCGCGAG 
GACGCGCGCG TCCACATCCT CGGCGAGGAC GTTGGCACTC TCGGCGGCGT CTTCCGAGTC 
ACCGACGGCT TGGCTGCCGA ATTCGGCGCG CAACGCTGCC TGGACACCCC CCTGGCCGAG 
GCAGGCATCC TCGGTACCGC CGTGGGCATG GCCATGTACG GCCTGCGGCC CGTCGTGGAG 
CTGCAGTTCG ACGCCTTCGC CTACCCCGCG TTCGAGCAGC TCGCGTCGCA TGTGGCCAAG 
ATGCGTAACC GCACGGCCGG GAAGACCACG CTGCCGATCA CCATCCGCAT CCCGTACGGC 
GGCGGCGTCG GCGGCGTCGA GCACCACAGC GACTCCAGCG AGGCCTACTA CGCGCACACC 
CCCGGCCTGC ACGTCGTCAC CCCCGCCACC GTCGCCGACG GCTACGGGCT GCTCCGCTCG 
GCGATTGCCT CGGACGACCC GGTGGTGTTC CTGGAGCCCA AGCGGCTCTA CTGGTCCACG 
GACGAGCGGT CCACGGACGA CTTCTCTGCG GCCGAGGTGC CGCCGATCGG CCGGGCGGTG 
GTCCGCCGGA CCGGTACCTC GGCGACCCTC CTGACCTACG GCCCCTCGCT CCCCGTGTGC 
CTCCAGGCGG CGGCGGCCGC GCGCTCGGAG GGCTGGGACC TGGCGGTGGT CGACCTGCGC 
TCGCTGGTCC CCTTCGACGA CGAGACGGTC TGCGAGGCGG TCCGCGCCAC CGGGCGCGCC 
GTTGTGGTCC ACGAGGCCGC GGGTTTCGGC GGGGTCGGTG CGGAGATCGC TGCCCGCGTC 
AGCGAGCGGT GCTTCCACCA CCTTGCCGCC CCCGTCCTGC GGGTCACCGG CTTCGACATC 
CCTTACCCGC CCCCCATGCT CGAACATCAC TACCTTCCCA GCGTCGACCG CATCCTCGAC 
GCCGTCGCCC GACTCCAGTG GGAGCAGTGA

Protein sequence

MSAATMVRAL NAALRDSLRE DARVHILGED VGTLGGVFRV TDGLAAEFGA QRCLDTPLAE 
AGILGTAVGM AMYGLRPVVE LQFDAFAYPA FEQLASHVAK MRNRTAGKTT LPITIRIPYG 
GGVGGVEHHS DSSEAYYAHT PGLHVVTPAT VADGYGLLRS AIASDDPVVF LEPKRLYWST 
DERSTDDFSA AEVPPIGRAV VRRTGTSATL LTYGPSLPVC LQAAAAARSE GWDLAVVDLR 
SLVPFDDETV CEAVRATGRA VVVHEAAGFG GVGAEIAARV SERCFHHLAA PVLRVTGFDI 
PYPPPMLEHH YLPSVDRILD AVARLQWEQ