Gene RPD_1788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1788
Symbol
ID	4022270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2002191
End bp	2003792
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	69%
IMG OID	637961982
Product	4-diphosphocytidyl-2C-methyl-D-erythritol synthase
Protein accession	YP_568925
Protein GI	91976266
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG0303] Molybdopterin biosynthesis enzyme [COG2068] Uncharacterized MobA-related protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.148843
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.17866
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGATTCG GCCCGCGACG CCCGGCGGAT GCGATCGGCG GCGTCACCGT GCATTCGCTG 
CGGCAGAACG GATTGCTGCT GAAGAAGGGC ACCTCAATCG GTCCAGCCGA AGTAGCGGCG 
CTGGAGCACG CTGGTGTCGC CGAGATCGTC GTGGTGCAGC TCGAGCCGGG TGACGTCTCC 
GAGGATGTCG CCGCCGCTGA TGTGGCGCAG GCGGTCGCCG GCGACGGCGT CAGTGTCGAG 
CGCGCCTTCA CCGGCCGCGC CAATCTCTTT GCAAAGCGTC CGGGCGTGCT GGTGGTCGAG 
CGTGCCGTGG TGGATCGTGT CAACGCCATC GACGAGGCGA TCACCTTCGC GACGCTTGCC 
GCGTTCAAGC CGGTGGTCGA AGGCGAGATG ATCGCGACCG TCAAGCTGAT CCCGTTCGGC 
GTCGAAGGAA AGCTCCGCGA CGCCGCGGTG CTGGCCGCGC AAGGCGGCGC GTTGCGTGTC 
GCGCCCTACA TGGTCAAGCG CGTCGGCGTA GTGTCGACCC AGTTGCCGGG CCTCGCGCCG 
AAAGTGATCG ACAAGACGCT GCGCGTCACA GCGGAGCGGC TGGCGCCGGC CGGTGCCGTG 
ATCATCGCCG AGCGCCGCAT CGCCCATGAT GAAGCCGCGT TGTCGGCGGC GCTGAAGGAG 
CTGCTCGGGC TCGGCGCCGA ACTGGTGGTC GTGTTCGGCG CCTCCGCGAT CGCCGATCGG 
CGGGACGTGA TCCCGGCCGC GATCGGCGCC ATCGGCGGCA CGATCGAGCA TTTCGGGATG 
CCGGTCGACC CCGGCAATCT GCTGCTGATC GGCAGCGCGT CGGGCGTGCC GGTGCTCGGG 
GCGCCGGGTT GCGCGCGCTC GCCGGTCGAG AACGGCTTCG ACTGGGTGCT GATGCGGCTG 
CTCGCGGGGC TTCAGGTGAC GCGCGCGGAC ATCACCGGCA TGGGCGTCGG CGGCCTGTTG 
ATGGAAATCG TGACGCGGCC GCAGCCGCGC CTGCCGCTGA CCGAAGGCGG TCGCAACGTC 
GCCGCGATCG TGCTCGCCGC CGGCCGCTCG ACCCGGATGG GCGGACCGAA CAAACTGCTC 
GCGGAGCTGA ACGGCACGCC GTTGGTGCGG ATCGTCGCCG AACAGGTGAT GGCGTCGAAG 
GCGTCGCGCG CGATCGTCGT CACTGGGCAC CAGGCCGACA AGGTCGAGGC GGCGCTGTCC 
GGCCTCGACG TCTCGTTCGT GCACAACCCC GCCTTTGCCG AAGGCCTGGC CTCGTCGGTG 
AAGGCCGGCA TCGCCGCGGT CGCCGACGAT GCGGATGGCG CGGTGGTCTG TCTCGGCGAT 
ATGCCGCTGA TCGATTCCCT CTTGATCGAC CGGCTGATCG GTGCGTTCGA TCCGGATCGC 
GGCGGGCTGA TCGTGGTGCC GGTCGCGGAT GGTCGGCGCG GCAATCCGGT GTTGTGGTCG 
CGTCGCTTCT TCAGCGAGCT GATGACGCTC GACGGCGACA TCGGCGCGCG CCATCTGATC 
GCCAAACACG GCGAGGCCGT GACCGAAGTG CCAGTCGACG GCCACGCTGC GTTTCTCGAC 
ATCGACACGC CGCAGGCGCT GGAGGAAGCT CGGCGCGGCT AG

Protein sequence

MRFGPRRPAD AIGGVTVHSL RQNGLLLKKG TSIGPAEVAA LEHAGVAEIV VVQLEPGDVS 
EDVAAADVAQ AVAGDGVSVE RAFTGRANLF AKRPGVLVVE RAVVDRVNAI DEAITFATLA 
AFKPVVEGEM IATVKLIPFG VEGKLRDAAV LAAQGGALRV APYMVKRVGV VSTQLPGLAP 
KVIDKTLRVT AERLAPAGAV IIAERRIAHD EAALSAALKE LLGLGAELVV VFGASAIADR 
RDVIPAAIGA IGGTIEHFGM PVDPGNLLLI GSASGVPVLG APGCARSPVE NGFDWVLMRL 
LAGLQVTRAD ITGMGVGGLL MEIVTRPQPR LPLTEGGRNV AAIVLAAGRS TRMGGPNKLL 
AELNGTPLVR IVAEQVMASK ASRAIVVTGH QADKVEAALS GLDVSFVHNP AFAEGLASSV 
KAGIAAVADD ADGAVVCLGD MPLIDSLLID RLIGAFDPDR GGLIVVPVAD GRRGNPVLWS 
RRFFSELMTL DGDIGARHLI AKHGEAVTEV PVDGHAAFLD IDTPQALEEA RRG