Gene Saro_3872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3872
Symbol
ID	5077483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	+
Start bp	41255
End bp	42727
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	64%
IMG OID	640480981
Product	succinic semialdehyde dehydrogenase
Protein accession	YP_001165643
Protein GI	146275482
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.928472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGGCGTTA CGATCCCCCC GCTCGAGCGC AGCGATTTCC TGACCGGCCA ACCACTTGTC 
GACGGCACCG AGATCTGTGC CGGCTCTACC TACGCGGTCA CTAACCCGGC AACCGGCAAA 
ACGCTGGCGA ATGTCGTCAA GCTGGGCGCT GCCCAGACGC GTCGGGCAAT TGAAAGCAAT 
TCCCGCGCCT TGATCGATTG GCGCAAGCGG CCCGCTCAGG AACGCGCGCG CCTGCTGCAT 
GACTGGCTGG CGCTGGTCCG GCTCCATCGC CACGATCTTG GTTTGCTGAT GACCGCCGAA 
CAGGGCAAAC CGCTGGCCGA AGCGCTGGGC GAGGTCGATT ACGCCGCAAG TTTCATCCAG 
TGGTTCGCTG AAGAGGCGCG CCGTGTCTAT GGCGAGGTCA TTCCGGCCAG CGCTGACCGG 
CGGATCGTCG TGATCCGTCA GCCGGTCGGC GTGGCGGGCG CCATTACGCC GTGGAACTTT 
CCCGCCGCGA TGATCACCCG CAAGGTCGCG CCTGCACTGG CGGCGGGCTG CACCGTGACC 
CTCAAACCGT CCGAACTCAC CCCCATGACC GCTTTCGCTC TGGCGAAGCT CGCTCGCGAA 
GCGGGCGTTC CGCCCGGCGT GTTCAACGTG GTCTGCGGGG ATGCGCCCGA AATCGGATCG 
GTCCTGACCA GCCATCCCGA TGTTACGAAG TTCACCTTCA CCGGTTCGAC CGCGATTGGC 
AAGCTGTTGA CCGCTCAATG CGCTGCCACG CTCAAGCGGG TTTCGATGGA ACTGGGCGGC 
AATGCCCCGC TGCTGGTGTT CGACGATGCC GATCTCGATC AGGCTGTCGA GGGGGCGATC 
GCCTCGAAAT TCCGTAACAC CGGACAGACC TGCGTTTGCG CCAACCGGAT CCTCGTGCAA 
AGCGGCATTC ATGACCGCTT CGTCGAGGCG CTGGCCGCCA GGGTCTCCGC GTTCCGGGTC 
GGAAACGGCC TTGAAGGTGC AACCGACCAG GGACCGTTAA TCACCGCATC AGCCTTGGCC 
AAGGTTCAGG GACATGTCGC CGATGCCGTG GCGCAAGGTG CCCAGCTGGT CACCGGCGGC 
AAGAGACACG AGGCCGGAGA ACTGTTCTTC CAACCAACTG TGCTGACTGG AGCGAGACCG 
GCGATGCGGC TGGCGGACGA GGAGACCTTC GGGCCGGTGG CCCCGGTGTT CCGTTTCGAA 
ACCGAGGCCG AAGCGCTGGC GCTTGCCAAC GCCACGCACT CGGGGCTGGC GGCCTATGCC 
TTCACCCGCG ACATTGACCG CGCCTGGCGG GTTTCCGAAG GCCTTGAGAC CGGGATGGTC 
GGCTTGAACA GCGGCATCGT CTCGACCGAG ACCGCCCCGT TTGGCGGCAT CAAGGAATCG 
GGACTGGGCC GAGAAGGTTC GCGACACGGT ATTGAAGAAT TCCTGGAGAT GAAGACCATC 
AGTGTTGGGG TCCGGCCCGA GAGTCCGGTG TAA

Protein sequence

MGVTIPPLER SDFLTGQPLV DGTEICAGST YAVTNPATGK TLANVVKLGA AQTRRAIESN 
SRALIDWRKR PAQERARLLH DWLALVRLHR HDLGLLMTAE QGKPLAEALG EVDYAASFIQ 
WFAEEARRVY GEVIPASADR RIVVIRQPVG VAGAITPWNF PAAMITRKVA PALAAGCTVT 
LKPSELTPMT AFALAKLARE AGVPPGVFNV VCGDAPEIGS VLTSHPDVTK FTFTGSTAIG 
KLLTAQCAAT LKRVSMELGG NAPLLVFDDA DLDQAVEGAI ASKFRNTGQT CVCANRILVQ 
SGIHDRFVEA LAARVSAFRV GNGLEGATDQ GPLITASALA KVQGHVADAV AQGAQLVTGG 
KRHEAGELFF QPTVLTGARP AMRLADEETF GPVAPVFRFE TEAEALALAN ATHSGLAAYA 
FTRDIDRAWR VSEGLETGMV GLNSGIVSTE TAPFGGIKES GLGREGSRHG IEEFLEMKTI 
SVGVRPESPV