Gene EcHS_A3987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3987
Symbol	ilvE
ID	5591058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3980897
End bp	3981826
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	55%
IMG OID	640923092
Product	branched-chain amino acid aminotransferase
Protein accession	YP_001460563
Protein GI	157163245
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01122] branched-chain amino acid aminotransferase, group I

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACGA AGAAAGCTGA TTACATTTGG TTCAATGGGG AGATGGTTCG CTGGGAAGAC 
GCGAAGGTGC ATGTGATGTC GCACGCGCTG CACTATGGCA CCTCGGTTTT TGAAGGCATC 
CGTTGCTACG ACTCGCACAA AGGACCGGTT GTATTCCGCC ATCGTGAGCA TATGCAGCGT 
CTGCATGACT CCGCCAAAAT CTATCGCTTT CCGGTTTCGC AGAGCATTGA TGAGCTGATG 
GAAGCTTGTC GTGACGTGAT CCGCAAAAAC AATCTCACCA GCGCCTATAT CCGTCCGCTG 
ATCTTCGTCG GTGATGTTGG CATGGGCGTT AACCCGCCAG CGGGATACTC AACCGATGTG 
ATTATCGCCG CTTTCCCGTG GGGAGCGTAT CTGGGCGCAG AAGCGCTGGA GCAGGGGATC 
GATGCGATGG TTTCCTCCTG GAACCGCGCA GCACCAAACA CCATCCCAAC CGCGGCAAAA 
GCCGGTGGTA ACTACCTCTC TTCCCTGCTG GTGGGTAGTG AAGCACGCCG CCACGGTTAT 
CAGGAAGGTA TCGCGCTGGA TGTGAATGGT TACATCTCTG AAGGTGCAGG CGAAAACCTG 
TTTGAAGTGA AAGACGGCGT GCTGTTCACC CCACCGTTCA CCTCCTCCGC GCTGCCGGGT 
ATTACCCGTG ATGCCATCAT CAAACTGGCA AAAGAGCTGG GAATTGAAGT CCGTGAGCAG 
GTGCTGTCGC GCGAATCCCT GTACCTGGCG GATGAAGTGT TTATGTCCGG TACTGCGGCA 
GAAATCACGC CAGTGCGCAG CGTAGATGGT ATTCAGGTTG GTGAAGGCCG TTGCGGCCCG 
GTTACCAAAC GCATCCAGCA AGCCTTCTTC GGCCTCTTCA CTGGCGAAAC CGAAGATAAA 
TGGGGCTGGT TAGATCAAGT TAATCAATAA

Protein sequence

MTTKKADYIW FNGEMVRWED AKVHVMSHAL HYGTSVFEGI RCYDSHKGPV VFRHREHMQR 
LHDSAKIYRF PVSQSIDELM EACRDVIRKN NLTSAYIRPL IFVGDVGMGV NPPAGYSTDV 
IIAAFPWGAY LGAEALEQGI DAMVSSWNRA APNTIPTAAK AGGNYLSSLL VGSEARRHGY 
QEGIALDVNG YISEGAGENL FEVKDGVLFT PPFTSSALPG ITRDAIIKLA KELGIEVREQ 
VLSRESLYLA DEVFMSGTAA EITPVRSVDG IQVGEGRCGP VTKRIQQAFF GLFTGETEDK 
WGWLDQVNQ