Gene RPC_4356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4356
Symbol
ID	3970833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4856491
End bp	4857411
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	70%
IMG OID	637927465
Product	4-diphosphocytidyl-2-C-methyl-D-erythritol kinase
Protein accession	YP_534198
Protein GI	90425828
COG category	[I] Lipid transport and metabolism
COG ID	[COG1947] 4-diphosphocytidyl-2C-methyl-D-erythritol 2-phosphate synthase
TIGRFAM ID	[TIGR00154] 4-diphosphocytidyl-2C-methyl-D-erythritol kinase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.915644
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0109051
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGGG CGGCTGAGTT GAGCGACGTG ATGTCGGTGC AGGCGCTGCA CGATGAGGCG 
CGTGCCAAGG TCAATCTGAC GCTGCGGGTG CTGGGCCGCC GCGTCGACGG CTATCACGAG 
TTGGAAAGCG TGGTGGCGTT CGCCGACTGC GCCGACCGGC TGACGCTGCA AGCCGGATCC 
GAACTCAGCC TCACCGCCAC CGGGCCGCGC GTCCAGGAAT GCGGCGACAA TGCCGACAAC 
CTGGTGATCA AGGCGGCGCG GCTGCTCGGA GAACGCGTCG CCGATCTGCG CACGGGAAGC 
TTCGCGCTCG ACAAGCAGCT GCCGATCGCC GCCGGCATCG GCGGCGGGTC GGCGGATGCC 
GCGGCGGCGT TGCGGCTGTT GGCCCGCGCC AACGATCTGG CGCTGGACGA TCCCCGACTG 
ATCGATGCCG CGCGAAAGAC CGGCGCCGAC GTGCCGGTGT GCCTAGCCTC AAAATCCTGC 
ATCATGACCG GGATCGGCGA AACCCTGCTG CCGCTGGCGC TGCCGCGGCT GCCGGTGGTG 
ATGGTCAATC CGCGCGTCGC GGTCGCCACC AAGGACGTGT TCGCGGCGCT CGGGCTGCGC 
AGCGGTCAGT TGCGGGTCGG CGTCACCGAC GTCGTCACCG CGCCGAAATG GCCGGACCAG 
GCCGCACCGC TCGATGCCTG GATCGCGGTG CTCGCCGCCG GCATCAACGA TCTCGAAGCG 
CCGGCGAAGA AGCTGCAGCC GGTGATCGGC GAGGTTTTGA AGCTGCTCGG CAAGGCCCGG 
GGCGCGCGGC TGGCGCGGAT GTCGGGGTCG GGTGCCACCT GTTTTGCGAT CTTTGCCGAC 
GCCGCCGCAG CCGAGGCCGC GGCGCAAAGC GTCAGCGCAG CGCATCCCGA CTGGTGGGTG 
CACGCCGGGA CGCTGGGCTG A

Protein sequence

MARAAELSDV MSVQALHDEA RAKVNLTLRV LGRRVDGYHE LESVVAFADC ADRLTLQAGS 
ELSLTATGPR VQECGDNADN LVIKAARLLG ERVADLRTGS FALDKQLPIA AGIGGGSADA 
AAALRLLARA NDLALDDPRL IDAARKTGAD VPVCLASKSC IMTGIGETLL PLALPRLPVV 
MVNPRVAVAT KDVFAALGLR SGQLRVGVTD VVTAPKWPDQ AAPLDAWIAV LAAGINDLEA 
PAKKLQPVIG EVLKLLGKAR GARLARMSGS GATCFAIFAD AAAAEAAAQS VSAAHPDWWV 
HAGTLG