Gene Rsph17025_1389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1389
Symbol
ID	5083063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	1418493
End bp	1419992
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	68%
IMG OID	640482947
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_001167591
Protein GI	146277432
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGAAC TGAGCCACTG GATCGACGGC AAGCACGTCA AGGGCAGCTC GGGCCGCTTT 
GCCGATGTCT TCAACCCCGC CACCGGCGAG GTGCAGGCCC GGGTGCCGCT CGCCTCGAAG 
GCCGAACTCG ACGCCGCCGT GGCCTCGGCC GCCGAGGCGC AGGTGAAATG GGGCGCCACC 
AACCCGCAGC GCCGCGCCCG CGTGATGATG GAGGTGGTGC GCCTTCTGAA CCGCGACATG 
GACAAGCTGG CCGAGGCGCT GAGCCGCGAG CACGGCAAGA CCCTGCCCGA CGCCAAGGGC 
GACGTGCAGC GCGGGCTTGA GGTGATCGAG TTCTGCATCG GCGCGCCGCA CCTTCTGAAG 
GGCGAGTTCA CCGACAGCGC GGGCCCCGGC ATCGACATGT ATTCGATGCG CCAGCCGCTG 
GGCGTGGCCG CGGGCATCAC GCCGTTCAAC TTCCCGGCCA TGATCCCGCT CTGGAAGATG 
GGCCCGGCGC TGGCCGCGGG CAACGCCTTC ATCCTGAAGC CCTCCGAGCG CGACCCCTCG 
GTTCCCCTGA TGCTGGCCGA GATCTTCCAG GAGGCCGGCC TGCCCGATGG CGTCCTGCAG 
GTGGTGAACG GCGACAAGGA GGCGGTGGAC GCCATCCTCG ACAATCCCAC GATCGCCGCC 
GTGGGCTTCG TCGGCTCGAC CCCGATCGCG GAATACATCT ATTCCCGCGG CTGCGCGAAC 
GGCAAGCGCG TGCAGTGCTT CGGCGGCGCC AAGAACCACA TGATCATCAT GCCGGACGCC 
GACCTGGATC AGGCGGCCGA TGCGCTGGTG GGCGCGGGCT ACGGCGCGGC GGGGGAACGC 
TGCATGGCGA TCTCGGTCGC GGTGCCGGTG GGCGACGAGA CCGCCGACGC GCTGATCGAG 
CGGCTGATCC CGCGGATCGA GAAGCTGAAG GTCGGCCCCT ATACGGGCGG CAACGACGTG 
GACTACGGCC CGGTGGTCAC CGCGGCGGCG AAGGAGAACA TCCTGCGCCT TGTGAACTCG 
GGCATCGAGC AGGGCGCGAA GCTGGTGGTG GACGGGCGCA ACTTCGCGCT GCAGGGCTAC 
GAGAGCGGCT TCTTCGTCGG CCCGCATCTC TTCGACCACG TCACGCCCGA GATGGACATC 
TACCGCAAGG AGATCTTCGG CCCGGTGCTT TCGACCGTCC GCGCGGCCTC CTACGAAGAG 
GCGCTCGGCC TTGCGATGCA CCACGAATAC GGCAACGGCA CGGCGATCTT CACCCGCGAC 
GGCGACGCGG CGCGCGACTT CGCCAACCGG GTGAACGTGG GGATGATCGG GATCAACGTG 
CCGATCCCGG TGCCGCTGGC CTATCACACC TTTGGCGGCT GGAAGAAATC GGCCTTCGGC 
GACCTGAACC AGCACGGGCC GGACGCCTTC CGCTTCTACA CCCGCACCAA GACCATCACC 
TCGCGCTGGC CGAGCGGGAT CAAGGAAGGC TCGGCCTTCA ACTTCAAGGC GATGGACTGA

Protein sequence

MEELSHWIDG KHVKGSSGRF ADVFNPATGE VQARVPLASK AELDAAVASA AEAQVKWGAT 
NPQRRARVMM EVVRLLNRDM DKLAEALSRE HGKTLPDAKG DVQRGLEVIE FCIGAPHLLK 
GEFTDSAGPG IDMYSMRQPL GVAAGITPFN FPAMIPLWKM GPALAAGNAF ILKPSERDPS 
VPLMLAEIFQ EAGLPDGVLQ VVNGDKEAVD AILDNPTIAA VGFVGSTPIA EYIYSRGCAN 
GKRVQCFGGA KNHMIIMPDA DLDQAADALV GAGYGAAGER CMAISVAVPV GDETADALIE 
RLIPRIEKLK VGPYTGGNDV DYGPVVTAAA KENILRLVNS GIEQGAKLVV DGRNFALQGY 
ESGFFVGPHL FDHVTPEMDI YRKEIFGPVL STVRAASYEE ALGLAMHHEY GNGTAIFTRD 
GDAARDFANR VNVGMIGINV PIPVPLAYHT FGGWKKSAFG DLNQHGPDAF RFYTRTKTIT 
SRWPSGIKEG SAFNFKAMD