Gene TM1040_1597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1597
Symbol
ID	4078406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1707581
End bp	1709071
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	62%
IMG OID	638006910
Product	succinate semialdehyde dehydrogenase
Protein accession	YP_613592
Protein GI	99081438
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.263811
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.212402
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACGCG CGCGAAAGAG TTGCCCTATC GCGACTGACA CCAATGAGGC CGAAATGCGC 
AACTATCCCG ATCTCAAACT CTTTATCGGC GGCACATGGC GCGACACGCC TGAGACCCTC 
TCGGTTGTGA ACCCGGCCAC GGAAGAAGAG CTGGGCCGCC TGCCCTGCGC GCGGATTTCG 
GATCTTGAGG ACGCGCTGGC AGCGGCTCAA AAAGGGCTCG AGATCTGGCG TAACACCCCG 
CCGCGCAGCC GGGCGGATCT GATATTGCGC GCTGCGCGCC TTCTGCGGGA TCGGCAAGAA 
GAGATCGCGC AGTCCATTAC CGCCGAACAT GGCAAACCAC TGGCCCAGGC TCGGTTGGAA 
GTCATTCGCG GCGCAGAGTT TTTCGAGTGG GACGCGGCAG AGGCCATGCG CACTTACGGA 
CGCGTGATCC CCTCGGCGGC GGGTACAAAA ATCTCCGTGC ATCACCACCC CATTGGCGTT 
GTCGCAGCCT TTTCACCATG GAACTTCCCC ATGAGCCAGC CTGCACGCAA GATCGCGGGT 
GCCCTTGCGT CGGGCTGCTC CCTGATCCTC AAGGCAGCAG AGGAAACCCC CGCCGGGGCG 
ATCCATATTG TCCGCGCGTT TCAGGACGCG GGCCTGCCCG ATGGTGTGCT CAATCTGGTA 
TTTGGCCGCC CGGCGGAGAT TTCGGCTTAT CTCATCCCGC AGCCCTGCGT GCGGCTTGTG 
GCCCTCACCG GATCCACCGC AGTGGGCCGC CAGTTGACAG CTCTTGCCGC CCAGAGCGAC 
ACCCGCGTCC TGATGGAGCT TGGCGGGCAC GCACCGGTGA TCGTCTGCGA GGACACCGAT 
GTGCAAAAGG CAGCCCTGAG CGGCGCCATC CGCAAGATGC GCAACGCGGG ACAGGTCTGC 
ACATCGCCAA CACGGTTCTT TGTGCATCAA GACATCTTTG ATGAATTCGC GACCACCTTC 
ACCCAACGGG CGGCGGCAAC TCGTGTGGGC AACGGGATGC ACGACGGGAT AGAAATGGGA 
CCAACTGCCA ACGCCCGTCG CATTCCGGTT CTGACGGATC TGGTTAATGA CGCCCTCGCC 
CAAGGCGCAA CGCTCTGCAC CGGCGGCACG CGCGTGGGGG AAAGGGGATA TTTCTTTGCC 
CCCACGGTGC TGACACACGT GCCAGACAGC GCGCGCATCA TGCGCGAAGA GCCCTTTGGT 
CCCATCGCGG TGCTCAACAC GGTGCGCAAC CTCGACGAAG CCATCGCGCA GGCAAACGCT 
GTGGATTACG GGTTGGCAGG GTATGCTTTT ACAAATCGTG CGGACTATAT CGCGCGCATG 
ATTGACGAGG TCGAAGTGGG CAATTTCTCC ATCAATACGC TTGAGGCCTC CTTGCCGGAG 
ACCCCGTTTG GCGGAGTGAA ATCCAGTGGT TACGGGCGTG AAGGCGGCAC CGAAGGGCTT 
GAGAGCTATC TCACCACGCG CAACGTCTGG CAAAGTTCTG ACATCACCTG A

Protein sequence

MPRARKSCPI ATDTNEAEMR NYPDLKLFIG GTWRDTPETL SVVNPATEEE LGRLPCARIS 
DLEDALAAAQ KGLEIWRNTP PRSRADLILR AARLLRDRQE EIAQSITAEH GKPLAQARLE 
VIRGAEFFEW DAAEAMRTYG RVIPSAAGTK ISVHHHPIGV VAAFSPWNFP MSQPARKIAG 
ALASGCSLIL KAAEETPAGA IHIVRAFQDA GLPDGVLNLV FGRPAEISAY LIPQPCVRLV 
ALTGSTAVGR QLTALAAQSD TRVLMELGGH APVIVCEDTD VQKAALSGAI RKMRNAGQVC 
TSPTRFFVHQ DIFDEFATTF TQRAAATRVG NGMHDGIEMG PTANARRIPV LTDLVNDALA 
QGATLCTGGT RVGERGYFFA PTVLTHVPDS ARIMREEPFG PIAVLNTVRN LDEAIAQANA 
VDYGLAGYAF TNRADYIARM IDEVEVGNFS INTLEASLPE TPFGGVKSSG YGREGGTEGL 
ESYLTTRNVW QSSDIT