Gene RPB_4226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4226
Symbol
ID	3912034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4802195
End bp	4803190
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	67%
IMG OID	637886129
Product	D-isomer specific 2-hydroxyacid dehydrogenase, NAD-binding
Protein accession	YP_487828
Protein GI	86751332
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.800657
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.563491
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAGTCG CCATTCTCGA CGATTACTTC GACACGCTGC GCACGCTGAA CTGCTTCGGC 
CGGCTGCAAG GCCACGACGT CACGGTGTTC AACGATCACG TCCAGGACAC CGATGCGCTG 
GCTTCGCGGC TGCGCGACAC CGAGGCGCTG GTGCTGATCC GCGAGCGGAC GCAGATTCGT 
GCCGCCCTGC TGGAGAAGCT GCCGCGGTTG AAGCTGATCA GCCAGCGCGG CGTCTATCCC 
CACATCGATG TCGACGCCTG CACGCGGCTC GGAATCGTCG TGTCGTCGAA CATGAGCGCC 
GGCGCGCCGT CCTATGCGGC GGCGGAATTG ACCTGGGGCC TGGTGCTGGG GGCGATGCGG 
CAGATCCCGC AGCAGATGGC GGCGCTGAAG GCCGGCGTCT GGCAGATCGG CGTCGGTCAC 
ACGCTGCGTG ACAAGACGCT CGGCATCTAC GGCTACGGCC GGATCGGCCG CGTCGTGGCG 
GGCTACGGCC GCGCCTTCGG CATGACCGTG CTGGTCTGGG CGCGCGAGCC CAATCTCGCC 
GAGGCGCGCG CCGACGGTTA TCAGATCGCC GGCAGCAAGG AAGACTTGTT TGCCCACAGT 
GACGTGCTGT CGCTGCACAT GCGCTTGATC GACGCCACCC GCGGCATCGT CACGCGCGCG 
GATCTGGCGC GGATGAAGCC GACGGCGCTG CTGGTCAACA CCAGCCGCGC CGGACTGATC 
GAGCAGGGGG CCCTCGTCGC GGCGCTCCGC GCCGGGCGTC CCGGCATGGC GGCGATCGAT 
GTGTTCGACA CCGAGCCGCT GCGCGATCCG CAGGATCCGC TACTGGCGAT GGACAACGTC 
GTTGCCACGC CGCATATCGG CTACGTGTCG CGTGACGAAT ACGAGCTGCA ATTCGGCGAT 
ATCTTCGAGC AGATCGTCGC CTATGCGGCG GGCGAGCCGA TCAATGTGGT CAACCCCGCA 
TCACTGTCCT CGTCGCGGTC CTCGTCGCGG CGCTGA

Protein sequence

MKVAILDDYF DTLRTLNCFG RLQGHDVTVF NDHVQDTDAL ASRLRDTEAL VLIRERTQIR 
AALLEKLPRL KLISQRGVYP HIDVDACTRL GIVVSSNMSA GAPSYAAAEL TWGLVLGAMR 
QIPQQMAALK AGVWQIGVGH TLRDKTLGIY GYGRIGRVVA GYGRAFGMTV LVWAREPNLA 
EARADGYQIA GSKEDLFAHS DVLSLHMRLI DATRGIVTRA DLARMKPTAL LVNTSRAGLI 
EQGALVAALR AGRPGMAAID VFDTEPLRDP QDPLLAMDNV VATPHIGYVS RDEYELQFGD 
IFEQIVAYAA GEPINVVNPA SLSSSRSSSR R