Gene ECH74115_0164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0164
Symbol	hemL
ID	6967187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	177782
End bp	179062
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	56%
IMG OID	643384240
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_002268763
Protein GI	209399556
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAAGT CTGAAAATCT TTACAGCGCA GCGCGCGAGC TGATCCCTGG CGGTGTGAAC 
TCCCCTGTTC GCGCCTTTAC TGGCGTGGGC GGCACTCCAC TGTTTATCGA AAAAGCGGAC 
GGCGCTTATC TGTACGATGT TGATGGCAAA GCCTATATCG ATTATGTCGG TTCCTGGGGG 
CCGATGGTGC TGGGCCATAA CCATCCGGCG ATCCGCAATG CCGTGATTGA AGCCGCCGAG 
CGTGGTTTAA GCTTTGGTGC ACCAACCGAA ATGGAAGTGA AAATGGCGCA ACTGGTGACC 
GAACTGGTCC CGACCATGGA TATGGTGCGC ATGGTGAACT CCGGCACTGA AGCGACAATG 
AGCGCCATCC GCCTGGCCCG TGGTTTTACC GGTCGCGACA AAATTATTAA ATTTGAAGGT 
TGTTACCACG GTCACGCTGA CTGCCTGCTG GTGAAAGCCG GCTCTGGCGC ACTCACGTTA 
GGCCAGCCAA ACTCGCCGGG CGTTCCGGCA GATTTCGCCA AACATACCTT AACCTGTACT 
TATAACGATC TGGCTTCTGT ACGCGCCGCG TTTGAGCAAT ACCCGCAAGA GATTGCCTGT 
ATTATCGTCG AGCCGGTGGC AGGCAATATG AACTGTGTTC CACCGCTGCC AGACTTCCTG 
CCAGGTCTGC GCGCGCTGTG CGACGAATTT GGCGCGTTGC TGATCATCGA TGAAGTAATG 
ACCGGTTTCC GCGTAGCGCT AGCTGGCGCA CAGGATTATT ACGGTGTGGA ACCGGATCTC 
ACTTGCCTGG GCAAAATCAT CGGCGGTGGA ATGCCGGTAG GCGCATTCGG TGGTCGTCGT 
GATGTAATGG ATGCGCTGGC CCCGACGGGT CCGGTCTATC AGGCGGGTAC GCTTTCCGGT 
AACCCGATTG CGATGGCAGC CGGTTTCGCC TGTCTGAATG AAGTCGCGCA GCCGGGCGTT 
CACGAAACGC TGGATGAGCT GACAACACGT CTGGCAGAAG GTCTGCTGGA AGCGGCAGAA 
GAAGCCGGAA TTCCGCTGGT GGTAAACCAC GTTGGCGGCA TGTTCGGTAT TTTCTTTACC 
GACGCCGAGT CCGTGACGTG CTATCAGGAT GTGATGGCCT GTGACGTCGA GCGTTTTAAG 
CGTTTCTTCC ATATGATGCT GGATGAAGGT GTTTACCTGG CACCGTCAGC GTTTGAAGCG 
GGCTTTATGT CTGTGGCGCA CAGCATGGAA GATATCAATA ACACCATCGA TGCTGCACGT 
CGGGTGTTTG CGAAGTTGTG A

Protein sequence

MSKSENLYSA ARELIPGGVN SPVRAFTGVG GTPLFIEKAD GAYLYDVDGK AYIDYVGSWG 
PMVLGHNHPA IRNAVIEAAE RGLSFGAPTE MEVKMAQLVT ELVPTMDMVR MVNSGTEATM 
SAIRLARGFT GRDKIIKFEG CYHGHADCLL VKAGSGALTL GQPNSPGVPA DFAKHTLTCT 
YNDLASVRAA FEQYPQEIAC IIVEPVAGNM NCVPPLPDFL PGLRALCDEF GALLIIDEVM 
TGFRVALAGA QDYYGVEPDL TCLGKIIGGG MPVGAFGGRR DVMDALAPTG PVYQAGTLSG 
NPIAMAAGFA CLNEVAQPGV HETLDELTTR LAEGLLEAAE EAGIPLVVNH VGGMFGIFFT 
DAESVTCYQD VMACDVERFK RFFHMMLDEG VYLAPSAFEA GFMSVAHSME DINNTIDAAR 
RVFAKL