Gene Rsph17029_2672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2672
Symbol
ID	4897069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	2817736
End bp	2819214
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	68%
IMG OID	640113273
Product	succinic semialdehyde dehydrogenase
Protein accession	YP_001044546
Protein GI	126463432
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.582581
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGACT CCGTCACCGA CCTGCGCTCG CTGCTCAAGG ACCCGTCGCT GCTCGAAACC 
CGCGCCTTCG TGGCCGGCGA GTGGGTCGAT GCCGACGACG GCGCAACCTT CGAGGTGACG 
AACCCCGCCC GCGGAGACGT GATCTGCACG GTGCCCGACC TCGGCCGGGC CGAAACGGCG 
CGCGCCATCG CCGCCGCCGA GGAGGCCATG AAGGAGTGGG CCGCCCGCAC CGGCAAGGAG 
CGCGCGCAGG TCATGCGCAA GTGGTTCGAC CTGATGATGG CGAACCAGGA CGACCTCGGC 
GCGATCCTCA CCGCCGAGAT GGGCAAGCCG CTCGCCGAGG CGAAGGGCGA GATCGCCTAC 
GGCGCCTCCT TCATCGAATG GTTCGGCGAA GAGGCCAAGC GCATCTATGG CGAGACCATC 
CCCGGCCACA TGCGCGACAA GCGCATCACG GTTCTGAAGC AGCCGATCGG CGTGGTGGGC 
TCGATCACGC CGTGGAACTT CCCGAACGCC ATGATCACCC GCAAATGCGG GCCCGCGCTG 
GCGGCGGGCT GCGGCTTCGT CGCCCGTCCG GCGGCCGAGA CGCCGCTCTC GGCGCTGGCG 
CTCGCGGTTC TGGGCGAGCG GGCCGGGCTG CCCAAGGGCA TCCTCTCGGT CATCACCTCG 
AGCCGCTCCT CGGACATCGG CAAGGAGATG TGCGAGAACC CGATCGTCCG CAAGCTCACC 
TTCACCGGCT CGACCGAGGT GGGCCGCATC CTGCTGCGGC AGGCGGCCGA TCAGGTGATG 
AAATGCTCGA TGGAGCTCGG CGGCAACGCG CCCTTCATCG TCTTCGACGA TGCCGATCTC 
GACGCCGCGG TGCAGGGCGC CATGGCCTCG AAGTTCCGCA ACAACGGCCA GACCTGCGTC 
TGCGCGAACC GGATCTACGT CCAGTCGGGC GTCTATGACG CCTTCGCCGA AAAGCTCGCC 
GCCGCCGTGA AGAAGCTGAA GGTGGGCGAC GGGCTCGTCG AGGGCACCGA GGCCGGCCCG 
CTCATCAACG AGAAGGCGGT GGCCAAGGTC GAGGAACATA TCCGCGACGT GCTCGACGGC 
GGCGGTCAGG TGCTGACCGG CGGCAAGCGC CACGCGCTCG GCGGCACCTT CTTCGAGCCG 
ACGGTCGTGA CCGGCGTGAA GCAGGAGATG AAGGTTTCGA CGGAAGAGAC CTTCGGCCCG 
CTCGCCCCTC TCTTCCGCTT CGAGACCGAG GAAGAGGCGG TGGGCTACGC CAACGACACG 
ATCTTCGGCC TCGCCTCCTA CTTCTATGCG CGCGACGTGG GCCGCATCAC CCGCGTGCAG 
GAGGCGCTGG AATATGGCAT CGTCGGCGTG AACACCGGCA TCATCTCGAC CGAGGTGGCC 
CCCTTCGGCG GCGTGAAGCA ATCCGGCCTC GGCCGCGAGG GCTCGCGCCA CGGGATCGAG 
GATTACCTCG AGATGAAATA CATCTGCCTC TCGATCTGA

Protein sequence

MLDSVTDLRS LLKDPSLLET RAFVAGEWVD ADDGATFEVT NPARGDVICT VPDLGRAETA 
RAIAAAEEAM KEWAARTGKE RAQVMRKWFD LMMANQDDLG AILTAEMGKP LAEAKGEIAY 
GASFIEWFGE EAKRIYGETI PGHMRDKRIT VLKQPIGVVG SITPWNFPNA MITRKCGPAL 
AAGCGFVARP AAETPLSALA LAVLGERAGL PKGILSVITS SRSSDIGKEM CENPIVRKLT 
FTGSTEVGRI LLRQAADQVM KCSMELGGNA PFIVFDDADL DAAVQGAMAS KFRNNGQTCV 
CANRIYVQSG VYDAFAEKLA AAVKKLKVGD GLVEGTEAGP LINEKAVAKV EEHIRDVLDG 
GGQVLTGGKR HALGGTFFEP TVVTGVKQEM KVSTEETFGP LAPLFRFETE EEAVGYANDT 
IFGLASYFYA RDVGRITRVQ EALEYGIVGV NTGIISTEVA PFGGVKQSGL GREGSRHGIE 
DYLEMKYICL SI