Gene RPB_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2026
Symbol
ID	3909840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2303502
End bp	2304929
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	67%
IMG OID	637883920
Product	D-lactate dehydrogenase (cytochrome)
Protein accession	YP_485645
Protein GI	86749149
COG category	[C] Energy production and conversion
COG ID	[COG0277] FAD/FMN-containing dehydrogenases
TIGRFAM ID	[TIGR00387] glycolate oxidase, subunit GlcD

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0174906
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.155014
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCCTGA CCATCACCAA CACGCCGAAG CGCGCCGAGC CGCAGGCCGT GGCCAGCGCC 
ATTGAAGCGC TCGCGGCGCG GTTCGGCAAC CGTCTCGTCA CGTCGCTCGC GGTTCGCGAA 
CAGCACGGCC ACACCACCAC CTGGCTGCCG AACCAGCCGC CGGACGCGGT GGTGATGGCG 
CAGGAGACGG CGGACATCCA GGACGTGGTG CGCATTTGTG CCAAATACCG CGTGCCGGTG 
ATCGCGTTCG GCACCGGCAC CTCGCTGGAG GGCCACGTCA ACGCCCCGGC TGGCGGCATT 
TCGATCGACC TGCGCGACAT GAACAAGATC CTCAGCGTTC ATGCCGAGGA TCTCGACTGC 
GTGATCCAGC CCGGCGTCAC CCGCAAGGCT CTGAACGAGG ACCTTCGCGA CCAGGGCCTG 
TTCTTCCCGA TCGATCCGGG CGCCGACGCC TCGATCGGCG GCATGGCGGC GACGCGCGCC 
TCCGGCACCA ATGCGGTCCG CTACGGCACC ATGCGCGACA ACGTGCTGGC GCTGAAAGTC 
GTTCGCGGCG ACGGCGAGAT CATCACCACC GGCACCCGCG CCAAAAAGTC CGCCGCCGGC 
TACGACCTGA CGCATCTGTT CGTCGGCAGC GAGGGCACGC TCGGCATCAT TTCGGAACTG 
ACCATCAAGC TGCGCGGCAT CCCCGAGGTG ATCGCGGCGG CCTCGTGCTC GTTTTCGTCG 
GTCACCGACG CCTGCCAGGC GGTGATCCTG GCGATCCAGA CCGGCATCCC GCTGGCGCGG 
ATCGAGCTGC TCAGCGAGTC CCAGGTCAGG GCCGTCAACG CCTATTCCAA GCTGACGCTG 
CCGGAGACGC CGCTGCTGCT GCTGGAATTC CACGGCAGCG AGGTCGAGGT CGGCGAGCAG 
TCGAAGAATT TCGGCGCGAT CGCCAAGGAT TGCGGCGGCG GCGACTTCAC CTGGACGACG 
CGGCCCGAAG ACCGCAACAA GCTCTGGCAG GCCCGGCACG ACGCCTATTG GTCGGTGCGG 
GCGCTGCGGC CCGGCGACGG CGTCGGCGTG GTCGCCACCG ATGTCTGCGT GCCGATCTCC 
CGGCTGGCCG ATTGCGTCGC CGAGACTGAG CAGGACATGG CGCGGCTCGG CCTGCTGGCG 
CCGATCGTCG GCCATGTCGG CGACGGCAAT TTCCATTGCT CGCTGCTATG CGACGTCAAC 
GACGCCGACG AGATGGCGCG CGCCGATGAG TTCATGCACC GTCTGGTCGA GCGGGCGCAG 
GCAATGGACG GCACCTGCAC CGGCGAACAC GGCATCGGTC AGGGCAAGCA GAAATATCTT 
CAAGCCGAAC TCGGCATCGA GGCGCTGCAG GCGATGCGCG CGATCAAGCA GGCGCTTGAC 
CCGCAAAACA TCTTCAATCC CGGCAAGATC CTGCCGCAAG GGCTTTGA

Protein sequence

MGLTITNTPK RAEPQAVASA IEALAARFGN RLVTSLAVRE QHGHTTTWLP NQPPDAVVMA 
QETADIQDVV RICAKYRVPV IAFGTGTSLE GHVNAPAGGI SIDLRDMNKI LSVHAEDLDC 
VIQPGVTRKA LNEDLRDQGL FFPIDPGADA SIGGMAATRA SGTNAVRYGT MRDNVLALKV 
VRGDGEIITT GTRAKKSAAG YDLTHLFVGS EGTLGIISEL TIKLRGIPEV IAAASCSFSS 
VTDACQAVIL AIQTGIPLAR IELLSESQVR AVNAYSKLTL PETPLLLLEF HGSEVEVGEQ 
SKNFGAIAKD CGGGDFTWTT RPEDRNKLWQ ARHDAYWSVR ALRPGDGVGV VATDVCVPIS 
RLADCVAETE QDMARLGLLA PIVGHVGDGN FHCSLLCDVN DADEMARADE FMHRLVERAQ 
AMDGTCTGEH GIGQGKQKYL QAELGIEALQ AMRAIKQALD PQNIFNPGKI LPQGL