Gene RPB_3807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3807
Symbol
ID	3911610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4345173
End bp	4346225
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	68%
IMG OID	637885708
Product	acetoin dehydrogenase (TPP-dependent) beta chain
Protein accession	YP_487412
Protein GI	86750916
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACGA GTTTCGCCGC CGCCATCCGT GATGGCCTCG CCACGGCGCT CGCCGCCGAC 
GACAGCGTCA TCTGCTTCGG GCTCGGCACC GACGATCCCA AAGGCGTGTT CGGTACTACG 
CTCGATTTGC ACAAGCAATT CGGCCCGGAC CGGGTGTTCG ACATGCCGAC CTCGGAAGCG 
GCGATGACCG GGATCGCGAT CGGCGCCGCG CTGAACGGGC TGCGCCCGGT GATGACGCAT 
CAGCGGCTCG ACTTCGCGCT GCTGTCGCTC GATCAATTGG TCAACAACGC CGCCAAATGG 
CGCTTCATGT TCGGCGGCGC CCGCGGCGTG CCGATCACCA TCCGGATGAT CATCGGCCGC 
GGCTGGGGCC AGGGGCCGAC GCATTCGCAG AGCCTGCAAT CCTGGTTCGC GCATATTCCC 
GGGCTGAAAG TGGTGATGCC GACCACCGCC GAGGACGCCA AGGGCCTGCT GCTGGCCTCG 
ATCTTCGACG ACGATCCGGT GATCTTCCTC GAGCATCGCT GGCTGCACAA TATGAATGGC 
GAGGTGCCCG CCGGCGACGT CCGCGAACCG CTCGGCAAGG CGCGCGTGGT GCGTAGCGGT 
GACGCGGTGA CGATCGTGGC GATGAGCTAC ATGACGGTGG AGGCGCTGCA CGCGGTCGAT 
CACCTCGCCG CGCAGGGCAT CAGTTGTGAG CTGATCGATC TGCGCACGAT CCGCCCGCTG 
GACTGGCCGG CGGTGATCGC CTCGGTGCAC AAGACCGGCC GGCTGCTGGC GCTCGACCCC 
GGCCATCTCA CCGGCGGCGT CGCCGGCGAG ATCGTGGCGC GGATCGCGAC CGATCATTTC 
AGCAGCCTGA CATGCGCGCC GCAGCGGCTC GCCGCGCCCG ACGTGCCGGA AGCGACCAGC 
CCGGCGCTGA CCAAGAATTA TCACGTCCGC GCCGAGCACA TCGCCGAGGC CGTCGGCCGG 
ATGCTCGGCC GCGAGGTCGA GACCGCGTCG CTCGTTTCCA GACGCCAGTT CCCGCACGAC 
GTGCCGGGCG ACTGGTTCTC CGGGCCGTTC TGA

Protein sequence

MSTSFAAAIR DGLATALAAD DSVICFGLGT DDPKGVFGTT LDLHKQFGPD RVFDMPTSEA 
AMTGIAIGAA LNGLRPVMTH QRLDFALLSL DQLVNNAAKW RFMFGGARGV PITIRMIIGR 
GWGQGPTHSQ SLQSWFAHIP GLKVVMPTTA EDAKGLLLAS IFDDDPVIFL EHRWLHNMNG 
EVPAGDVREP LGKARVVRSG DAVTIVAMSY MTVEALHAVD HLAAQGISCE LIDLRTIRPL 
DWPAVIASVH KTGRLLALDP GHLTGGVAGE IVARIATDHF SSLTCAPQRL AAPDVPEATS 
PALTKNYHVR AEHIAEAVGR MLGREVETAS LVSRRQFPHD VPGDWFSGPF