Gene ECH74115_3784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3784
Symbol	glyA
ID	6968615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3508737
End bp	3509990
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	53%
IMG OID	643387571
Product	serine hydroxymethyltransferase
Protein accession	YP_002272024
Protein GI	209398610
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAAGC GTGAAATGAA CATTGCCGAT TATGATGCCG AACTGTGGCA GGCTATGGAG 
CAGGAAAAAG TACGTCAGGA AGAGCACATC GAACTGATCG CCTCCGAAAA CTACACCAGC 
CCGCGCGTAA TGCAGGCGCA GGGTTCTCAG CTGACCAACA AATATGCTGA AGGTTATCCG 
GGCAAACGCT ACTACGGTGG TTGCGAGTAT GTTGATATCG TTGAACAACT GGCGATCGAT 
CGTGCGAAAG AACTGTTCGG CGCTGACTAC GCTAACGTCC AGCCGCACTC CGGCTCCCAG 
GCTAACTTTG CGGTCTACAC CGCGCTGCTG GAACCAGGTG ATACCGTTCT GGGTATGAAC 
CTGGCGCATG GCGGTCACCT GACTCACGGT TCTCCGGTTA ACTTCTCCGG TAAACTGTAC 
AACATTGTTC CTTACGGTAT TGATGCTACC GGTCATATCG ACTACGCCGA TCTGGAAAAA 
CAAGCCAAAG AACACAAACC GAAAATGATT ATCGGTGGCT TCTCTGCATA TTCCGGCGTG 
GTGGACTGGG CGAAAATGCG TGAAATCGCT GACAGCATCG GCGCTTACCT GTTCGTTGAT 
ATGGCGCACG TTGCGGGCCT GGTTGCTGCT GGCGTCTACC CGAACCCGGT TCCTCATGCT 
CACGTTGTTA CTACCACCAC TCACAAAACC CTGGCGGGTC CGCGCGGCGG TCTGATCCTG 
GCGAAAGGTG GTAGCGAAGA GCTGTACAAA AAACTGAACT CTGCCGTTTT CCCTGGTGGT 
CAGGGCGGTC CGTTGATGCA CGTAATCGCC GGTAAAGCGG TTGCTCTGAA AGAAGCGATG 
GAGCCTGAGT TCAAAACTTA CCAGCAGCAG GTCGCTAAAA ACGCTAAAGC GATGGTAGAA 
GTGTTCCTGG AACGCGGCTA CAAAGTGGTT TCCGGCGGTA CTGATAACCA TCTGTTCCTG 
GTTGATCTGG TCGATAAAAA CCTGACCGGT AAAGAAGCAG ACGCCGCTCT GGGCCGTGCT 
AACATCACCG TCAACAAAAA CAGCGTACCG AACGATCCGA AGAGCCCGTT TGTGACCTCC 
GGTATTCGCG TGGGTACTCC GGCAATTACG CGTCGCGGCT TCAAAGAAGT AGAAGCGAAA 
GAACTGGCTG GCTGGATGTG TGACGTGCTG GACAGCATCA ATGATGAAGC CGTTATCGAG 
CGCATCAAAG GTAAAGTTCT CGACATCTGC GCACGTTACC CGGTTTACGC ATAA

Protein sequence

MLKREMNIAD YDAELWQAME QEKVRQEEHI ELIASENYTS PRVMQAQGSQ LTNKYAEGYP 
GKRYYGGCEY VDIVEQLAID RAKELFGADY ANVQPHSGSQ ANFAVYTALL EPGDTVLGMN 
LAHGGHLTHG SPVNFSGKLY NIVPYGIDAT GHIDYADLEK QAKEHKPKMI IGGFSAYSGV 
VDWAKMREIA DSIGAYLFVD MAHVAGLVAA GVYPNPVPHA HVVTTTTHKT LAGPRGGLIL 
AKGGSEELYK KLNSAVFPGG QGGPLMHVIA GKAVALKEAM EPEFKTYQQQ VAKNAKAMVE 
VFLERGYKVV SGGTDNHLFL VDLVDKNLTG KEADAALGRA NITVNKNSVP NDPKSPFVTS 
GIRVGTPAIT RRGFKEVEAK ELAGWMCDVL DSINDEAVIE RIKGKVLDIC ARYPVYA