Gene EcHS_A1607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1607
Symbol
ID	5594292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1630137
End bp	1631525
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	53%
IMG OID	640920759
Product	putative succinate semialdehyde dehydrogenase
Protein accession	YP_001458315
Protein GI	157160997
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	0.764255
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATTA CTCCGGCAAC TCATGCAATT TCGATAAATC CTGCCACGGG TGAACAACTT 
TCTGTGCTGC CGTGGGCTGG CGCTGACGAT ATCGAAAACG CACTTCAGCT GGCGGCAGCA 
GGCTTTCGCG ACTGGCGCGA GACAAATATA GATTATCGTG CTGAAAAACT GCGTGATATC 
GGTAAGGCTC TGCGCGCTCG TAGCGAAGAA ATGGCGCAAA TGATCACCCG CGAAATGGGC 
AAACCAATCA ACCAGGCGCG CGCTGAAGTG GCGAAATCGG CGAATTTGTG TGACTGGTAT 
GCAGAACATG GTCCGGCAAT GCTGAAGGCG GAACCTACGC TGGTGGAAAA TCAGCAGGCG 
GTTATTGAGT ATCGACCGTT GGGGACGATT CTGGCGATTA TGCCGTGGAA TTTTCCGTTA 
TGGCAGGTGA TGCGTGGCGC TGTTCCCATC ATTCTTGCAG GTAACGGCTA CTTACTTAAA 
CATGCGCCGA ATGTGATGGG CTGTGCACAG CTCATTGCCC AGGTGTTTAA AGATGCGGGT 
ATCCCACAAG GCGTATATGG CTGGCTGAAT GCCGACAACG ACGGTGTCAG TCAGATGATT 
AAAGACTCGC GCATTGCTGC TGTCACGGTG ACCGGAAGTG TTCGTGCGGG AGCGGCTATT 
GGCGCACAGG CTGGAGCGGC ACTGAAAAAA TGCGTACTGG AACTGGGCGG TTCGGATCCG 
TTTATTGTGC TTAACGATGC CGATCTGGAA CTGGCGGTGA AAGCGGCGGT AGCCGGACGT 
TATCAGAATA CCGGACAGGT ATGTGCAGCG GCAAAACGCT TTATTATCGA AGAGGGAATT 
GCTTCGGCAT TTACCGAACG TTTTGTGGCA GCTGCGGCAG CCTTGAAAAT GGGCGATCCC 
CGTGACGAAG AGAACGCTCT CGGACCAATG GCTCGTTTTG ATTTACGTGA TGAGCTGCAT 
CATCAGGTGG AGAAAACCCT GGCGCAGGGT GCGCGTTTGT TACTGGGCGG GGAAAAGATG 
GCTGGGGCAG GTAACTACTA TCCGCCAACG GTTCTGGCGA ATGTTACCCC AGAAATGACC 
GCGTTTCGGG AAGAAATGTT TGGCCCCGTT GCGGCAATCA CCATTGCGAA AGATGCAGAA 
CATGCACTGG AACTGGCTAA TGATAGTGAG TTCGGCCTTT CAGCGACCAT TTTTACCACT 
GACGAAACAC AGGCCAGACA TATGGCGGCA CGTCTGGAAT GCGGTGGGGT GTTTATCAAT 
GGTTATTGTG CCAGCGACGC GCGAGTGGCC TTTGGTGGCG TGAAAAAGAG TGGCTTTGGT 
CGTGAGCTTT CCCATTTCGG CTTACACGAA TTCTGTAATA TCCAGACGGT GTGGAAAGAC 
CGGATCTGA

Protein sequence

MTITPATHAI SINPATGEQL SVLPWAGADD IENALQLAAA GFRDWRETNI DYRAEKLRDI 
GKALRARSEE MAQMITREMG KPINQARAEV AKSANLCDWY AEHGPAMLKA EPTLVENQQA 
VIEYRPLGTI LAIMPWNFPL WQVMRGAVPI ILAGNGYLLK HAPNVMGCAQ LIAQVFKDAG 
IPQGVYGWLN ADNDGVSQMI KDSRIAAVTV TGSVRAGAAI GAQAGAALKK CVLELGGSDP 
FIVLNDADLE LAVKAAVAGR YQNTGQVCAA AKRFIIEEGI ASAFTERFVA AAAALKMGDP 
RDEENALGPM ARFDLRDELH HQVEKTLAQG ARLLLGGEKM AGAGNYYPPT VLANVTPEMT 
AFREEMFGPV AAITIAKDAE HALELANDSE FGLSATIFTT DETQARHMAA RLECGGVFIN 
GYCASDARVA FGGVKKSGFG RELSHFGLHE FCNIQTVWKD RI