Gene Rsph17029_1609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1609
Symbol
ID	4897296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1691426
End bp	1692925
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	68%
IMG OID	640112200
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_001043491
Protein GI	126462377
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0517581
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGAAC TCAGCCACTG GATCGACGGC AAGCGCGTGA AGGGCACCTC CGGCCGCTTC 
GCCGATGTCT TCAACCCGGC CACCGGCGAG GTGCAGGCGC GCGTGCCGCT CGCCTCGAAG 
GACGAACTCG ACGCCGCCGT GGCCTCGGCC GCCGCCGCCC AGCCGAAATG GGCCGCCACC 
AACCCGCAGC GCCGCGCCCG CGTGATGATG GAGGTCGTGC GCCTCCTCAA CCGCGACATG 
GACAAGCTGG CCGAGGCGCT CTCGCGCGAG CACGGCAAGA CCATCCCCGA CGCCAAGGGC 
GACGTGCAGC GCGGCCTCGA GGTGATCGAA TTCTGCATCG GCGCGCCGCA TCTGCTGAAG 
GGCGAGTTCA CCGACAGCGC GGGCCCCGGC ATCGACATGT ATTCGATGCG CCAGCCGCTC 
GGCGTGGCTG CGGGCATCAC GCCCTTCAAC TTCCCGGCAA TGATCCCGCT GTGGAAGATG 
GGCCCCGCGC TTGCCGCCGG CAACGCCTTC ATCCTGAAGC CGTCCGAGCG CGATCCGTCC 
GTGCCGCTGA TGCTGGCCGA GATCTTCCAG GAGGCGGGCC TGCCCGACGG CGTCCTGCAG 
GTGGTGAACG GCGACAAGGA GTCGGTCGAC GCGATCCTCG ACAACCCGAC CATCGCGGCG 
GTGGGCTTCG TGGGCTCGAC CCCGATCGCG GAATATATCT ATTCCCGCGG CTGCGCGAAC 
GGCAAGCGCG TGCAGTGCTT CGGCGGTGCC AAGAACCACA TGATCATCAT GCCGGATGCC 
GACCTCGATC AGGCGGCCGA TGCGCTGGTG GGCGCGGGCT ACGGCGCTGC AGGCGAGCGC 
TGCATGGCGA TCTCGGTCGC GGTCCCGGTG GGCGACGAGA CGGCCGATGC GCTCATCGAG 
CGGCTGATCC CGCGCATCGA GAAGCTGAAG GTCGGCCCCT ACACCGCCGG CAACGACGTG 
GATTACGGCC CGGTCGTGAC CGCCGCCGCG CGCGAGAACA TCCTGCGCCT CGTGCAGTCG 
GGCGTGGATC AGGGCGCGAA GCTCGTGGTT GACGGTCGCA ACTTCTCGCT CCAAGGCTAC 
GAGAAGGGCT TCTTCGTCGG TCCGCACCTC TTCGACCATG TCCGGCCCGA CATGGACATC 
TACCGCAAGG AGATCTTCGG CCCGGTCCTC TCGACCGTCC GCGCGGCCTC TTACGAAGAG 
GCGCTGAGCC TTGCCATGGA TCATGAGTAC GGCAACGGCA CCGCGATCTA CACCCGCGAC 
GGCGACGCCG CCCGCGACTT CGCGGCGCGC GTGAATGTGG GGATGATCGG GATCAACGTG 
CCGATCCCGG TGCCGCTGGC CTACCACACC TTCGGCGGCT GGAAGAAATC GGCCTTCGGC 
GACCTGAACC AGCACGGCCC CGACTCCTTC CGCTTCTACA CCCGGACCAA GACGATCACC 
TCGCGCTGGC CCTCGGGCAT CAAGGAGGGC TCCGCCTTCA ACTTCAAGGC CATGGACTGA

Protein sequence

MEELSHWIDG KRVKGTSGRF ADVFNPATGE VQARVPLASK DELDAAVASA AAAQPKWAAT 
NPQRRARVMM EVVRLLNRDM DKLAEALSRE HGKTIPDAKG DVQRGLEVIE FCIGAPHLLK 
GEFTDSAGPG IDMYSMRQPL GVAAGITPFN FPAMIPLWKM GPALAAGNAF ILKPSERDPS 
VPLMLAEIFQ EAGLPDGVLQ VVNGDKESVD AILDNPTIAA VGFVGSTPIA EYIYSRGCAN 
GKRVQCFGGA KNHMIIMPDA DLDQAADALV GAGYGAAGER CMAISVAVPV GDETADALIE 
RLIPRIEKLK VGPYTAGNDV DYGPVVTAAA RENILRLVQS GVDQGAKLVV DGRNFSLQGY 
EKGFFVGPHL FDHVRPDMDI YRKEIFGPVL STVRAASYEE ALSLAMDHEY GNGTAIYTRD 
GDAARDFAAR VNVGMIGINV PIPVPLAYHT FGGWKKSAFG DLNQHGPDSF RFYTRTKTIT 
SRWPSGIKEG SAFNFKAMD