Gene ECH74115_2138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2138
Symbol
ID	6968805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2052326
End bp	2053714
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	52%
IMG OID	643386035
Product	putative succinate semialdehyde dehydrogenase
Protein accession	YP_002270524
Protein GI	209397066
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.752498
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTA CTCCGGCAAC TCATGCAATT TCGATAAATC CTGCCACGGG TGAACAACTT 
TCTGTGTTGC CGTGGGCTGG CGCTGATGAT ATCGAAAACG CACTTCAGCT GGCGGCAGCA 
GGCTTTCGTG ACTGGCGCGA GACAAATATA GATTATCGTG CTGAAAAACT GCGTGATATC 
GGTAAGGCTC TGCGCGCCCG TAGCGAAGAA ATGGCGCAAA TGATCACCCG CGAAATGGGC 
AAACCAATCA ACCAGGCGCG CGCTGAAGTG GCGAAATCGG CGAATTTGTG TGACTGGTAT 
GCAGAACATG GTCCGGCAAT GCTGAAGGCG GAACCTACGC TGGTGGAAAA TCAGCAGGCA 
GTTATTGAGT ATCGACCGTT GGGGACGATT CTGGCGATTA TGCCGTGGAA TTTTCCGTTA 
TGGCAGGTGA TGCGTGGCGC TGTTCCCATC ATTCTTGCTG GTAACGGATA CTTACTTAAA 
CATGCGCCGA ATGTGATGGG CTGTGCTCAG CTCATTGCCC AGGTGTTTAA AGATGCGGGA 
ATCCCACAAG GCGTATATGG CTGGCTGAAT GCCGACAATG ACGGTGTCAC TCAGATGATT 
AAAGACTCGC GCATTGCTGC TATCACGGTG ACCGGAAGTG TTCGTGCTGG AGCGGCTATT 
GGTGCACAGG CTGGAGCGGC ACTGAAAAAA TGCGTACTGG AACTGGGCGG TTCGGATCCA 
TTTATTGTGC TTAACGATGC CGATCTGGAA CTGGCAGTTA AAGCGGCGGT AGCCGGACGT 
TATCAGAATA CCGGACAGGT TTGTGCAGCA GCAAAACGCT TTATTATCGA AGAGGGAATT 
GCTTCGGCAT TTACCGAACG TTTTGTGGCA GCTGCGGCAG CCTTGAAAAT GGACGATCCC 
CGTGACGAAG AGAACGCTCT CGGACCAATG GCTCGTTTCG ATTTACGTGA TGAGCTGCAT 
CATCAGGTGG AGAAAACCCT GGCGCAGGGT GCGCGTTTGT TACTGGGCGG GGAAAAGATG 
GCTGGGGCAG GTAACTACTA TCCGCCAACG GTTCTGGCGA ATGTTACCCC AGAAATGACC 
GCTTTTCGGG AAGAAATGTT TGGCCCCGTT GCGGCAATCA CCATTGCGAA AGATGCAGAA 
CATGCGCTGG AACTGGCTAA TGATAGTGAG TTCGGCCTTT CAGCGACCAT TTTTACCACC 
GACGAAACAC AGGCCAGACA GATGGCGGCA CGTCTGGAAT GCGGTGGGGT GTTTATCAAT 
GGTTATTGTG CCAGCGACGC GCGAGTGGCC TTTGGTGGCG TGAAAAAGAG TGGCTTTGGT 
CGTGAGCTTT CCCATTTCGG CTTACACGAA TTCTGTAATA TCCAGACGGT GTGGAAAGAC 
CGGATCTGA

Protein sequence

MTITPATHAI SINPATGEQL SVLPWAGADD IENALQLAAA GFRDWRETNI DYRAEKLRDI 
GKALRARSEE MAQMITREMG KPINQARAEV AKSANLCDWY AEHGPAMLKA EPTLVENQQA 
VIEYRPLGTI LAIMPWNFPL WQVMRGAVPI ILAGNGYLLK HAPNVMGCAQ LIAQVFKDAG 
IPQGVYGWLN ADNDGVTQMI KDSRIAAITV TGSVRAGAAI GAQAGAALKK CVLELGGSDP 
FIVLNDADLE LAVKAAVAGR YQNTGQVCAA AKRFIIEEGI ASAFTERFVA AAAALKMDDP 
RDEENALGPM ARFDLRDELH HQVEKTLAQG ARLLLGGEKM AGAGNYYPPT VLANVTPEMT 
AFREEMFGPV AAITIAKDAE HALELANDSE FGLSATIFTT DETQARQMAA RLECGGVFIN 
GYCASDARVA FGGVKKSGFG RELSHFGLHE FCNIQTVWKD RI