Gene RPB_3672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3672
Symbol
ID	3911474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4212307
End bp	4213908
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	69%
IMG OID	637885574
Product	4-diphosphocytidyl-2C-methyl-D-erythritol synthase
Protein accession	YP_487278
Protein GI	86750782
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG0303] Molybdopterin biosynthesis enzyme [COG2068] Uncharacterized MobA-related protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTCG GGCCGCGCCG TCCGGCCGAT GCGATCGGCG GCGTCACCGT GCATTCGCTG 
CGGCAGAACG GATTGCTGCT GAAGAAGGGC ACCGCGATCG GTCCGGCCGA AGTCGACGCG 
CTGGAGCGCG CCGGCGTCGG TGAAATTGTC GTCGTTCAAC TCGAGTCGGG TGATGTCTCG 
GAGGACGTCG CAGCAGCGGA CGTGGCGCAG GCCGTCGCCG GCGACGGTGC CAGCGTCGAG 
CGCGCCTTCA CCGGCCGCGC CAATCTGTTC GCGCAGCGGC CCGGCGTGCT GGTGGTTGAT 
CGCGCCGCGG TCGATCGGGT CAATGCGGTC GACGAGGCGA TCACCTTCGC GACGCTGCCG 
GCGTTCAAGC CGGTGGTCGA AGGCGAGATG ATCGCGACCG TCAAGCTGAT CCCGTTCGGC 
GTCGAGGGGA GACTGCGCGA CGCCGCGGTG GCGGCTGCAC GAGGCTCCGC GCTGCAGGTC 
GCGCCCTATG TCATCAAGCG TGTCGGCATC GTGTCGACGC AACTGCCCGG CCTCGCGTCC 
AAGGTGATCG ACAAGACGCT GCGCGTCACC GCCGAGCGGC TGGCGCCGGC GGGTGCCGAG 
ATCATCGCCG AGCGCCGCAT CGCTCATGAC GAATCTGCGC TCGCAACGGC GCTGCAGGAA 
TTGCTCGGCC TCGGCGCCGA GCTGGTGATC GTGTTCGGCG CCTCGGCGAT CGCAGACCGC 
CGCGACGTCA TCCCGGCGGC GATCGGCGCC ATCGGCGGGC AGGTCGAGCA CTTCGGTATG 
CCGGTCGATC CCGGCAATCT GCTGCTGATC GGCAGCGCGT CGGGCGTCCC GGTGCTGGGT 
GCGCCGGGCT GTGCGCGCTC GCCGGTCGAG AACGGCTTCG ACTGGGTGCT GATGCGGCTG 
CTGGCGGGAT TGCCCGTGAC GCGCGCCGAT ATCACCGGCA TGGGTGTCGG CGGGTTGCTG 
ATGGAGATCG TGACCCGACC GCAGCCGCGC GTGCCGGTAG CCGAAGGTGG CCGCAATGTC 
GCGGCGATCG TGCTCGCCGC CGGCCGCTCG ACCCGGATGG GCGGGCCGAA CAAGCTGCTC 
GCCGAACTGA ACGGCACGCC GCTGGTGCGG ATCGTGACCG AGCAGGTATT GGCGTCGAAG 
GCATCGCGCG CGGTCGTGGT CACCGGGCAT CAGGCCGACA AGGTCGAGGC GGCGCTGTCC 
GGGCTCGATG TGTCGTTCGT CCATAACCCG GCGTTCGCCG AAGGGCTGGC GTCGTCGGTC 
AAAGCCGGTA TCGCCGCTGT GCCGGACGAT GCCGATGGCG CGATTGTTTG TCTCGGCGAC 
ATGCCGCTGA TCGATTCCGA ACTGATCGAC CGGCTGATCG ACGCGTTCGA TCCGGATCGC 
GGCGGGCTGA TCGTGGTGCC GGTCGCAGAT GGCCGCCGCG GCAATCCAGT GCTGTGGTCG 
CGGCGGTTCT TCGCCGAGCT GATGACGCTC GACGGCGACA TCGGCGCGCG CCACCTGATC 
GCCAAGCATG CCGAGGCGGT GACCGAAGTG CCGGTCGATG GCCACGCTGC GTTTCTCGAT 
ATCGATACGC CGCAGGCGCT CGAGGATGCC CGCCGGGGCT GA

Protein sequence

MKFGPRRPAD AIGGVTVHSL RQNGLLLKKG TAIGPAEVDA LERAGVGEIV VVQLESGDVS 
EDVAAADVAQ AVAGDGASVE RAFTGRANLF AQRPGVLVVD RAAVDRVNAV DEAITFATLP 
AFKPVVEGEM IATVKLIPFG VEGRLRDAAV AAARGSALQV APYVIKRVGI VSTQLPGLAS 
KVIDKTLRVT AERLAPAGAE IIAERRIAHD ESALATALQE LLGLGAELVI VFGASAIADR 
RDVIPAAIGA IGGQVEHFGM PVDPGNLLLI GSASGVPVLG APGCARSPVE NGFDWVLMRL 
LAGLPVTRAD ITGMGVGGLL MEIVTRPQPR VPVAEGGRNV AAIVLAAGRS TRMGGPNKLL 
AELNGTPLVR IVTEQVLASK ASRAVVVTGH QADKVEAALS GLDVSFVHNP AFAEGLASSV 
KAGIAAVPDD ADGAIVCLGD MPLIDSELID RLIDAFDPDR GGLIVVPVAD GRRGNPVLWS 
RRFFAELMTL DGDIGARHLI AKHAEAVTEV PVDGHAAFLD IDTPQALEDA RRG