Gene SeD_A2388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2388
Symbol
ID	6875521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2258050
End bp	2259162
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	61%
IMG OID	642785479
Product	propanediol utilization: propanol dehydrogenase
Protein accession	YP_002216137
Protein GI	198245287
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACCT TCTCACTACA AACGCGGTTG TACAGCGGTC AGGGCAGCCT GGCGGTGCTC 
AAGCGCTTTA CCAATAAGCA CATCTGGATA ATCTGCGATG GCTTTCTGGC TCGCTCGCCG 
CTGCTGGATA CCCTGCGTAA CGCGCTGCCC GCAGATAACC GCATCAGCGT CTTTAGCGAG 
ATAACGCCGG ACCCCACCAT CCACACAGTG GTTCAGGGCA TTGCGCAAAT GCAGGCTCTG 
CAACCGCAGG TGGTGATCGG TTTTGGCGGC GGCTCGGCAA TGGACGCGGC GAAAGCGATT 
GTCTGGTTTA GCCAGCAAAG CGGCATCAAT ATCGAAACCT GCGTGGCGAT CCCGACCACC 
AGCGGCACCG GTTCGGAAGT CACCAGCGCC TGCGTAATTA GCGACCCGGA TAAAGGCATT 
AAGTATCCGC TGTTCAACAA TGCGCTGTAT CCGGATATGG CGATCCTTGA CCCGGAGCTG 
GTGGTCAGCG TTCCGCCGCA GATTACCGCC AACACCGGTA TGGACGTGCT GACCCACGCC 
CTGGAGGCCT GGGTGTCACC GCACGCCAGC GACTTTACCG ACGCGCTGGC GGAAAAAGCC 
GCCAAACTGG TGCTCCAGTA TCTGCCCACG GCGGTGGAAA AAGGCGACTG CGTGGCGACG 
CGCGGGAAAA TGCACAATGC CTCAACGCTC GCCGGGATGG CCTTCAGCCA GGCGGGGCTG 
GGGCTTAACC ACGCGATAGC CCACCAGCTC GGCGGACAGT TCCATCTGCC GCACGGGCTG 
GCCAATGCGC TGCTGCTCAC GACGGTGATC CGCTTTAACG CGGGTGACCC GCGCGCCGCC 
AAACGCTACG CGCGGCTGGC CAAAGCCTGC GGTTTTTGCC CGGCAGAAGC CAATGACGTT 
GCGGCGATCA ATGCGCTGAT TCAGCAAATC GAACTGCTTA AGCAACGCTG TGCCCTTCCC 
TCACTGGCCG TTGCGCTTAA AGAAGGAAGA TCCGACTTTT CCGCACGTAT TCCGGCGATG 
GTGCAGGCCG CGCTGGCGGA TATCACGCTG CGCACCAACC CGCGCCCGGC CAGCGCCGAG 
GAAATTCGCG AGCTGCTGGA GGAACTGCTA TGA

Protein sequence

MNTFSLQTRL YSGQGSLAVL KRFTNKHIWI ICDGFLARSP LLDTLRNALP ADNRISVFSE 
ITPDPTIHTV VQGIAQMQAL QPQVVIGFGG GSAMDAAKAI VWFSQQSGIN IETCVAIPTT 
SGTGSEVTSA CVISDPDKGI KYPLFNNALY PDMAILDPEL VVSVPPQITA NTGMDVLTHA 
LEAWVSPHAS DFTDALAEKA AKLVLQYLPT AVEKGDCVAT RGKMHNASTL AGMAFSQAGL 
GLNHAIAHQL GGQFHLPHGL ANALLLTTVI RFNAGDPRAA KRYARLAKAC GFCPAEANDV 
AAINALIQQI ELLKQRCALP SLAVALKEGR SDFSARIPAM VQAALADITL RTNPRPASAE 
EIRELLEELL