Gene SNSL254_A2229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2229
Symbol
ID	6486397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2136308
End bp	2137420
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	61%
IMG OID	642737577
Product	propanediol utilization: propanol dehydrogenase
Protein accession	YP_002041319
Protein GI	194446766
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.176556
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACCT TCTCACTACA AACGCGGTTG TACAGCGGTC AGGGCAGCCT GGCGGTGCTC 
AAGCGCTTTA CCAATAAGCA CATCTGGATA ATCTGCGATG GCTTTCTGGC GCGCTCTCCG 
CTGCTGGATA CCCTGCGTAA CGCGCTGCCC GCAGATAACC GCATCAGCGT CTTTAGCGAG 
ATAACGCCGG ACCCCACCAT CCACACAGTG GTTCAGGGCA TTGCGCAAAT GCAGGCTCTG 
CAACCGCAGG TGGTGATTGG TTTTGGCGGC GGCTCGGCAA TGGACGCGGC GAAAGCGATT 
GTCTGGTTTA GCCAGCAGAG CGGGATCAAC ATCGAAACCT GCGTGGCGAT CCCGACCACC 
AGCGGCACCG GCTCGGAAGT GACCAGCGCC TGCGTAATTA GCGACCCGGA TAAAGGCATC 
AAGTATCCGC TGTTCAACAA TGCGCTGTAT CCGGATATGG CGATCCTCGA CCCGGAGCTG 
GTGGTCAGCG TACCGCCGCA GATTACCGCC AACACCGGCA TGGACGTGCT GACCCACGCC 
CTGGAGGCCT GGGTGTCACC GCGCGCCAGC GACTTTACCG ACGCGCTAGC GGAAAAGGCC 
GCCAAACTGG TGTTCCAGTA TCTGCCCACG GCGGTGGAAA AAGGCGACTG CGTGGCGACG 
CGCGGGAAAA TGCACAACGC TTCAACGCTC GCCGGGATGG CCTTCAGCCA GGCGGGGCTG 
GGGCTTAACC ACGCGATAGC CCACCAGCTT GGCGGACAGT TTCATCTGCC GCACGGGCTG 
GCCAATGCGC TGCTGCTCAC GACGGTGATC CGCTTTAACG CGGGTGACCC GCGCGCCGCC 
AAACGCTATG CGCGGCTGGC CAAAGCCTGC GGTTTTTGCC CGGCAGAAGC CAATGACGTT 
GCGGCAATCA ATGCGCTGAT TCAGCAAATC GAACTGCTTA AGCAACGCTG CGCCCTTCCC 
TCACTGGCCG TTGCGCTTAA AGAAGGAAGA TCCGACTTTT CCGCACGTAT TCCGGCGATG 
GTGCAGGCCG CGCTGGCGGA TATCACGCTG CGCACCAACC CGCGCCCGGC CAGCGCCGAG 
GAAATTCGCG AGCTGCTGGA GGAACTGCTA TGA

Protein sequence

MNTFSLQTRL YSGQGSLAVL KRFTNKHIWI ICDGFLARSP LLDTLRNALP ADNRISVFSE 
ITPDPTIHTV VQGIAQMQAL QPQVVIGFGG GSAMDAAKAI VWFSQQSGIN IETCVAIPTT 
SGTGSEVTSA CVISDPDKGI KYPLFNNALY PDMAILDPEL VVSVPPQITA NTGMDVLTHA 
LEAWVSPRAS DFTDALAEKA AKLVFQYLPT AVEKGDCVAT RGKMHNASTL AGMAFSQAGL 
GLNHAIAHQL GGQFHLPHGL ANALLLTTVI RFNAGDPRAA KRYARLAKAC GFCPAEANDV 
AAINALIQQI ELLKQRCALP SLAVALKEGR SDFSARIPAM VQAALADITL RTNPRPASAE 
EIRELLEELL