Gene EcE24377A_0159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0159
Symbol	hemL
ID	5589671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	174945
End bp	176225
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	56%
IMG OID	640923888
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_001461325
Protein GI	157155177
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAGT CTGAAAATCT TTACAGCGCA GCGCGCGAGC TGATCCCTGG CGGTGTGAAC 
TCCCCTGTTC GCGCCTTTAC TGGCGTGGGC GGCACTCCAC TGTTTATCGA AAAAGCGGAC 
GGCGCTTATC TGTACGATGT TGATGGCAAA GCCTATATCG ATTATGTCGG TTCCTGGGGG 
CCGATGGTGC TGGGCCATAA CCATCCGGCT ATCCGCAATG CCGTGATTGA AGCCGCCGAG 
CGTGGTTTAA GCTTTGGTGC ACCGACCGAA ATGGAAGTGA AAATGGCGCA ACTGGTGACC 
GAACTGGTCC CGACCATGGA TATGGTGCGC ATGGTGAACT CCGGCACTGA AGCGACGATG 
AGCGCCATCC GCCTGGCCCG TGGTTTTACC GGTCGCGACA AAATCATTAA ATTTGAAGGT 
TGTTACCACG GTCACGCTGA CTGCCTGCTG GTGAAAGCCG GTTCTGGCGC ACTCACGTTA 
GGCCAGCCAA ACTCGCCGGG TGTTCCGGCA GATTTCGCCA AACATACCTT AACCTGTACT 
TATAACGATC TGGCTTCTGT ACGCGCCGCG TTTGAGCAAT ACCCGCAAGA GATTGCCTGT 
ATTATCGTCG AGCCGGTGGC AGGCAATATG AACTGCGTTC CACCGCTGCC AGAGTTCCTG 
CCAGGTCTGC GCGCGCTGTG CGACGAATTT GGCGCATTGC TGATCATCGA TGAAGTAATG 
ACTGGCTTCC GCGTAGCGCT AGCTGGCGCA CAGGATTATT ACGGTGTGGA ACCGGATCTC 
ACCTGCCTGG GCAAAATCAT CGGCGGTGGA ATGCCGGTAG GCGCATTCGG TGGTCGTCGT 
GATGTAATGG ATGCGCTGGC CCCGACGGGT CCGGTCTATC AGGCGGGTAC GCTTTCCGGT 
AACCCAATTG CGATGGCAGC GGGTTTCGCC TGTCTGAATG AAGTCGCGCA ACCGGGCGTT 
CACGAAACGT TGGATGAGCT GACATCACGT CTGGCAGAAG GTCTGCTGGA AGCGGCAGAA 
GAAGCCGGAA TTCCGCTGGT CGTTAACCAC GTTGGCGGCA TGTTCGGTAT TTTCTTTACC 
GACGCCGAGT CCGTGACGTG CTATCAGGAT GTGATGGCCT GTGACGTGGA ACGCTTTAAG 
CGTTTCTTCC ATATGATGCT GGATGAAGGT GTTTACCTGG CACCGTCAGC GTTTGAAGCG 
GGCTTTATGT CCGTGGCGCA CAGCATGGAA GATATCAATA ACACCATCGA TGCTGCACGT 
CGGGTGTTTG CGAAGTTGTG A

Protein sequence

MSKSENLYSA ARELIPGGVN SPVRAFTGVG GTPLFIEKAD GAYLYDVDGK AYIDYVGSWG 
PMVLGHNHPA IRNAVIEAAE RGLSFGAPTE MEVKMAQLVT ELVPTMDMVR MVNSGTEATM 
SAIRLARGFT GRDKIIKFEG CYHGHADCLL VKAGSGALTL GQPNSPGVPA DFAKHTLTCT 
YNDLASVRAA FEQYPQEIAC IIVEPVAGNM NCVPPLPEFL PGLRALCDEF GALLIIDEVM 
TGFRVALAGA QDYYGVEPDL TCLGKIIGGG MPVGAFGGRR DVMDALAPTG PVYQAGTLSG 
NPIAMAAGFA CLNEVAQPGV HETLDELTSR LAEGLLEAAE EAGIPLVVNH VGGMFGIFFT 
DAESVTCYQD VMACDVERFK RFFHMMLDEG VYLAPSAFEA GFMSVAHSME DINNTIDAAR 
RVFAKL