Gene ECH74115_3611 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3611
Symbol
ID	6968879
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3329306
End bp	3330544
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	55%
IMG OID	643387406
Product	aminotransferase
Protein accession	YP_002271865
Protein GI	209400401
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.890867
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGACA CTCGCCCTGA ACGTCGCTTT ACGCGCATTG ATCGTCTCCC GCCCTACGTT 
TTTAACATCA CCGCTGAACT GAAAATGGCT GCGCGTCGGC GCGGCGAAGA TATTATCGAT 
TTCAGCATGG GTAACCCGGA CGGTGCGACT CCGCCGCATA TCGTCGAAAA ATTATGTACT 
GTGGCCCAGC GTCCGGACAC GCATGGTTAC TCCACTTCAC GCGGCATTCC GCGGTTACGT 
CGCGCCATTT CCCGCTGGTA TCAGGATCGC TACGACGTTG AAATCGATCC GGAATCAGAA 
GCCATCGTCA CCATTGGTTC GAAAGAAGGG CTGGCACACC TGATGCTGGC GACGCTGGAT 
CATGGTGACA CGGTGCTGGT GCCGAATCCA AGCTACCCGA TCCATATTTA TGGCGCGGTG 
ATTGCCGGGG CGCAGGTACG CTCAGTGCCG CTGGTGGAAG GTGTCGATTT CTTCAACGAA 
CTGGAGCGCG CCATTCTTGA AAGTTATCCG AAACCGAAGA TGATGATCCT CGGCTTCCCG 
TCAAACCCAA CCGCGCAATG CGTGGAACTG GAGTTCTTCG AAAAAGTAGT GGCGCTGGCG 
AAACGCTACG ATGTGCTGGT GGTCCATGAC CTGGCCTATG CCGATATCGT CTACGATGGC 
TGGAAAGCGC CGTCAATCAT GCAGGTACCG GGTGCACGCG ATGTGGCAGT CGAGTTCTTT 
ACGCTGTCGA AAAGCTACAA CATGGCGGGC TGGCGTATCG GCTTTATGGT CGGCAACAAA 
ACGCTGGTCA GTGCCCTGGC GCGAATCAAA AGCTATCACG ATTACGGCAC TTTTACGCCG 
TTGCAGGTGG CGGCGATTGC GGCGCTGGAG GGCGATCAAC AGTGCGTGCG CGACATTGCC 
GAACAGTACA AACGCCGCCG CGATGTATTG GTTAAAGGGC TGCATGAAGC GGGCTGGATG 
GTCGAAATGC CGAAGGCTTC GATGTATGTC TGGGCGAAAA TCCCGGAACC ATATGCGGCC 
ATGGGATCGC TGGAATTTGC CAAGAAGCTC CTTAACGAAG CGAAGGTCTG TGTCTCTCCA 
GGGATTGGCT TTGGTGACTA CGGCGACACG CATGTTCGCT TTGCACTGAT TGAAAACCGC 
GACCGTATTC GTCAGGCGAT TCGTGGGATT AAAGCGATGT TCCGTGCCGA CGGTTTACTA 
CCCGCCAGCA GCAAACATAT TCACGAAAAC GCGGAATAA

Protein sequence

MADTRPERRF TRIDRLPPYV FNITAELKMA ARRRGEDIID FSMGNPDGAT PPHIVEKLCT 
VAQRPDTHGY STSRGIPRLR RAISRWYQDR YDVEIDPESE AIVTIGSKEG LAHLMLATLD 
HGDTVLVPNP SYPIHIYGAV IAGAQVRSVP LVEGVDFFNE LERAILESYP KPKMMILGFP 
SNPTAQCVEL EFFEKVVALA KRYDVLVVHD LAYADIVYDG WKAPSIMQVP GARDVAVEFF 
TLSKSYNMAG WRIGFMVGNK TLVSALARIK SYHDYGTFTP LQVAAIAALE GDQQCVRDIA 
EQYKRRRDVL VKGLHEAGWM VEMPKASMYV WAKIPEPYAA MGSLEFAKKL LNEAKVCVSP 
GIGFGDYGDT HVRFALIENR DRIRQAIRGI KAMFRADGLL PASSKHIHEN AE