Gene Franean1_0773 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0773
Symbol
ID	5669189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	901685
End bp	902863
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	77%
IMG OID	641239701
Product	4-diphosphocytidyl-2-C-methyl-D-erythritol kinase
Protein accession	YP_001505137
Protein GI	158312629
COG category	[I] Lipid transport and metabolism
COG ID	[COG1947] 4-diphosphocytidyl-2C-methyl-D-erythritol 2-phosphate synthase
TIGRFAM ID	[TIGR00154] 4-diphosphocytidyl-2C-methyl-D-erythritol kinase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.272276
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCTCGAT CGCATCCGGG TCGACGCGCC ACCGAACCCG GCCGCCCCCT GCCGACCGTC 
ACCGTTCGCG CTCCCGCCAA GGTCAACCTC CACCTCGGGG TGGGCCCACG CCGGCCCGAC 
GGCTACCACG AGGTGACGAC GATCCTGCAG GCCGTCGCGC TGTACGACGA CATCACCGCG 
ACGTCGGTCC CCCCGGAGTC ACTCTCCGGG CCCGAGGGCG CCGGCCCGGT GTTCACCGAC 
GAGGACCCGA TCGCGGTCAC GGTCGGCGTC GCCGGCGAGG GCGCGCGGCC GGCAACGTCA 
GACGACGCGG ACGGCGCTGG CGACGGCCCG GGTGGTTCCC CGGGTGACAC CGGCGCCGAG 
CCGTCCGTCT CGGTGGTGCC GACCGGTAAG GACAACCTGG CTGTCCGCGC CGCCTACCTG 
GTCGCCGAGG CCGCCGGGAT CCGCGGCGAG GCCGTCCACC TGACGCTGTC GAAGGGCATC 
CCGGTCGCCG CCGGGATGGC CGGCGGCAGC GCCGACGCGG CCGCGGCCCT GCTCGCCTGC 
GACACGCTGT GGGGCGCCGG CCTCGACCGC GAGACCCTTG TCGCGCTGGC CGCCAAGCTG 
GGCAGCGACG TCCCGTTCCC GCTCACCGGT GGGACGGCGC TGGGCACCGG CCGCGGTGAG 
CAGCTCACCG ACGTTCTCGG GCGCGGCGAG TACCACTGGG TGTTCGCGCT CGCCGACGGC 
GGGCTGTCGA CGCCCGCCGT CTACGGCGAG TTCGACCGGC TCTCCGAGGG CAGGCTGCGC 
ACCGGGCCCA CGCCCGCGGA CGCCGTCCTG AGCGCCCTGC GCAGCGGGGA CCCGGCGGAG 
CTCGGAGCCG CCCTGGTCAA CGACCTGCAG CCGGCGGCGC TGCGGCTGCG CCCGTCCCTG 
CGGCGGGTAC TGGAGAGCGG GCTGGAGCTG GGCGCGATCG GCGCGATCGT GAGCGGATCC 
GGGCCGACCT GCGCTTTCCT CACCCGCGAC GCGGCGGCGA GCGTCTCGCT CGCCGCGAGC 
CTCGCCGGCA TGGGCGTCGC GCGCGCCGTC CGACGGGCCC ACGGCCCGGT CGCCGGAGCA 
CGGGTGATCG GCCCGGCGGA CCCGGCCGGT CCGGGTGGGG AGCCGGGCAG CTCCACGGCG 
CAGTCCCCGC CGCTCTCCCC CTCGTCGTCA CCGGCGTGA

Protein sequence

MPRSHPGRRA TEPGRPLPTV TVRAPAKVNL HLGVGPRRPD GYHEVTTILQ AVALYDDITA 
TSVPPESLSG PEGAGPVFTD EDPIAVTVGV AGEGARPATS DDADGAGDGP GGSPGDTGAE 
PSVSVVPTGK DNLAVRAAYL VAEAAGIRGE AVHLTLSKGI PVAAGMAGGS ADAAAALLAC 
DTLWGAGLDR ETLVALAAKL GSDVPFPLTG GTALGTGRGE QLTDVLGRGE YHWVFALADG 
GLSTPAVYGE FDRLSEGRLR TGPTPADAVL SALRSGDPAE LGAALVNDLQ PAALRLRPSL 
RRVLESGLEL GAIGAIVSGS GPTCAFLTRD AAASVSLAAS LAGMGVARAV RRAHGPVAGA 
RVIGPADPAG PGGEPGSSTA QSPPLSPSSS PA