Gene RPD_2047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2047
Symbol
ID	4022529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2294807
End bp	2296000
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	64%
IMG OID	637962240
Product	3-hydroxyisobutyrate dehydrogenase
Protein accession	YP_569183
Protein GI	91976524
COG category	[I] Lipid transport and metabolism
COG ID	[COG2084] 3-hydroxyisobutyrate dehydrogenase and related beta-hydroxyacid dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.996651
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.228122
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTTCT CCTCCGCCGA TCCGCGCCAG ACCGAACATA TGGGGTGGTT GGGTTCAAGG 
ACAGAATTCA ACTCTCACCC GCCCTCGCCA TCGTTACGGC TGGTCTTACA GCAGCGGATG 
ATCTCGGCGA AACGGTCTTT TGCACTGCAA GAGATACGGC CCCAGCAATT CGATCGAAGA 
CAATTGCCCC CGTCAGCCCC TTGCCCGTCG AGCCTCGCGG CCTATGCTGA CTCACCTGCC 
GCGGGCCTGC ATCAGGCTAC GCTGACTGCC TCAACTCGAT TCGGCCGGCA TTCGATCGGG 
CCGCGCAATC TGAAGGGTAC AGACATGGCC AAAGTCGCTT TCCTCGGTCT CGGCGTGATG 
GGTTTTCCGA TGGCCGGACA TCTCGTCAAA AAGGGAGGGC ACGACGTCAC CGTCTATAAT 
CGTACCGCCG CAAAAGCAAA GAGCTGGGCC GATCAGTTTG GAGGCCGCAC GGCGGCGACG 
CCGGCTGAAG CGGCCAAGGA TCAGGACTTC GTGATGGCCT GCGTCGGCAA CGACCACGAC 
TTGCGGGCAG TGACCACAGG CGACGACGGC GCGTTCGCGG CGATGAAATC CGGCGCGATC 
TTCGTCGATC ACACCACCGC GTCCGCCGAG GTCGCGCGCG AGCTGGATGC GGCCGCGACC 
AAGGCCGGCT TCGCCTTCAT TGATGCGCCG GTGTCGGGCG GCCAGGCCGG CGCCGAGAAC 
GGCGTCCTGA CGGTGATGTG CGGCGGCAGC GACGGGGCCT ATGCCAAGGC CGAGCCGGTG 
ATCGCGTCCT ATGCGCGGAT GTGCAAGCTG CTCGGACCGG CCGGCTCCGG CCAGCTCACC 
AAGATGGTCA ATCAGATCTG CATCGCCGGG CTGGTCCAGG GGCTGTCGGA AGGCATCCAC 
TTCGCCAAGA AGGCGGGCCT CGACGTCAAC GCCGTGATCG ACACCATCTC CAAGGGCGCC 
GCGCAGTCCT GGCAGATGGA GAACCGGCAC AAGACGATGA ACGACGGCAA ATACGATTTC 
GGCTTCGCGG TCGAATGGAT GCGCAAGGAC CTGTCGATCT GCCTGGCCGA GTCCCGCCGC 
AACGGCGCCA GCCTGCCGGT GACCGCGCTG GTGGATGCCT TCTACGCCGA AGTCGAAAAG 
ATCGGCGGAC GCCGTTGGGA CACCTCCAGC CTGCTGGCAC GGCTCGAACG CTGA

Protein sequence

MDFSSADPRQ TEHMGWLGSR TEFNSHPPSP SLRLVLQQRM ISAKRSFALQ EIRPQQFDRR 
QLPPSAPCPS SLAAYADSPA AGLHQATLTA STRFGRHSIG PRNLKGTDMA KVAFLGLGVM 
GFPMAGHLVK KGGHDVTVYN RTAAKAKSWA DQFGGRTAAT PAEAAKDQDF VMACVGNDHD 
LRAVTTGDDG AFAAMKSGAI FVDHTTASAE VARELDAAAT KAGFAFIDAP VSGGQAGAEN 
GVLTVMCGGS DGAYAKAEPV IASYARMCKL LGPAGSGQLT KMVNQICIAG LVQGLSEGIH 
FAKKAGLDVN AVIDTISKGA AQSWQMENRH KTMNDGKYDF GFAVEWMRKD LSICLAESRR 
NGASLPVTAL VDAFYAEVEK IGGRRWDTSS LLARLER