Gene EcDH1_1022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1022
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	1091041
End bp	1092489
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	58%
IMG OID
Product	succinic semialdehyde dehydrogenase
Protein accession	ACX38703
Protein GI	260448281
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTTA ACGACAGTAA CTTATTCCGC CAGCAGGCGT TGATTAACGG GGAATGGCTG 
GACGCCAACA ATGGTGAAGC CATCGACGTC ACCAATCCGG CGAACGGCGA CAAGCTGGGT 
AGCGTGCCGA AAATGGGCGC GGATGAAACC CGCGCCGCTA TCGACGCCGC CAACCGCGCC 
CTGCCCGCCT GGCGCGCGCT CACCGCCAAA GAACGCGCCA CCATTCTGCG CAACTGGTTC 
AATTTGATGA TGGAGCATCA GGACGATTTA GCGCGCCTGA TGACCCTCGA ACAGGGTAAA 
CCACTGGCCG AAGCGAAAGG CGAAATCAGC TACGCCGCCT CCTTTATTGA GTGGTTTGCC 
GAAGAAGGCA AACGCATTTA TGGCGACACC ATTCCTGGTC ATCAGGCCGA TAAACGCCTG 
ATTGTTATCA AGCAGCCGAT TGGCGTCACC GCGGCTATCA CGCCGTGGAA CTTCCCGGCG 
GCGATGATTA CCCGCAAAGC CGGTCCGGCG CTGGCAGCAG GCTGCACCAT GGTGCTGAAG 
CCCGCCAGTC AGACGCCGTT CTCTGCGCTG GCGCTGGCGG AGCTGGCGAT CCGCGCGGGC 
GTTCCGGCTG GGGTATTTAA CGTGGTCACC GGTTCGGCGG GCGCGGTCGG TAACGAACTG 
ACCAGTAACC CGCTGGTGCG CAAACTGTCG TTTACCGGTT CGACCGAAAT TGGCCGCCAG 
TTAATGGAAC AGTGCGCGAA AGACATCAAG AAAGTGTCGC TGGAGCTGGG CGGTAACGCG 
CCGTTTATCG TCTTTGACGA TGCCGACCTC GACAAAGCCG TGGAAGGCGC GCTGGCCTCG 
AAATTCCGCA ACGCCGGGCA AACCTGCGTC TGCGCCAACC GCCTGTATGT GCAGGACGGC 
GTGTATGACC GTTTTGCCGA AAAATTGCAG CAGGCAGTGA GCAAACTGCA CATCGGCGAC 
GGGCTGGATA ACGGCGTCAC CATCGGGCCG CTGATCGATG AAAAAGCGGT AGCAAAAGTG 
GAAGAGCATA TTGCCGATGC GCTGGAGAAA GGCGCGCGCG TGGTTTGCGG CGGTAAAGCG 
CACGAACGCG GCGGCAACTT CTTCCAGCCG ACCATTCTGG TGGACGTTCC GGCCAACGCC 
AAAGTGTCGA AAGAAGAGAC GTTCGGCCCC CTCGCCCCGC TGTTCCGCTT TAAAGATGAA 
GCTGATGTGA TTGCGCAAGC CAATGACACC GAGTTTGGCC TTGCCGCCTA TTTCTACGCC 
CGTGATTTAA GCCGCGTCTT CCGCGTGGGC GAAGCGCTGG AGTACGGCAT CGTCGGCATC 
AATACCGGCA TTATTTCCAA TGAAGTGGCC CCGTTCGGCG GCATCAAAGC CTCGGGTCTG 
GGTCGTGAAG GTTCGAAGTA TGGCATCGAA GATTACTTAG AAATCAAATA TATGTGCATC 
GGTCTTTAA

Protein sequence

MKLNDSNLFR QQALINGEWL DANNGEAIDV TNPANGDKLG SVPKMGADET RAAIDAANRA 
LPAWRALTAK ERATILRNWF NLMMEHQDDL ARLMTLEQGK PLAEAKGEIS YAASFIEWFA 
EEGKRIYGDT IPGHQADKRL IVIKQPIGVT AAITPWNFPA AMITRKAGPA LAAGCTMVLK 
PASQTPFSAL ALAELAIRAG VPAGVFNVVT GSAGAVGNEL TSNPLVRKLS FTGSTEIGRQ 
LMEQCAKDIK KVSLELGGNA PFIVFDDADL DKAVEGALAS KFRNAGQTCV CANRLYVQDG 
VYDRFAEKLQ QAVSKLHIGD GLDNGVTIGP LIDEKAVAKV EEHIADALEK GARVVCGGKA 
HERGGNFFQP TILVDVPANA KVSKEETFGP LAPLFRFKDE ADVIAQANDT EFGLAAYFYA 
RDLSRVFRVG EALEYGIVGI NTGIISNEVA PFGGIKASGL GREGSKYGIE DYLEIKYMCI 
GL