Gene ECH74115_5335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5335
Symbol
ID	6967045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4977132
End bp	4978121
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	55%
IMG OID	643388996
Product	acetyltransferase, GNAT family
Protein accession	YP_002273405
Protein GI	209398236
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1246] N-acetylglutamate synthase and related acetyltransferases
TIGRFAM ID	[TIGR02447] thioesterase domain, putative

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.251571
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGC TTCCAGGGTT GTCACGGGAA ACAAGAGAGA GTATCGCTAT GTATCACCTT 
CGGGTTCCAC AAACAGAAGA AGAATTAGAG CGTTACTATC AGTTTCGCTG GGAAATGTTG 
CGTAAGCCCC TGCATCAACC AAAAGGTTCG GAACGCGACG CGTGGGATGC GATGGCGCAT 
CACCAGATGG TCGTCGACGA GCAGGGTAAT CTGGTGGCGG TAGGCCGACT GTATATTAAT 
GCCGACAATG AAGCGTCCAT TCGCTTTATG GCCGTTCATC CCGACGTGCA GGACAAAGGG 
TTAGGCACGC TGATGGCGAT GACCCTGGAG TCGGTGGCGC GTCAGGAAGG CGTTAAGCGC 
GTGACCTGTA GCGCCCGTGA AGACGCGGTG GAGTTTTTCG CCAAGCTGGG GTTTGTTAAT 
CAGGGAGAAA TCACCACGCC AACCACCACG CCGATTCGCC ATTTTTTGAT GATTAAGCCC 
GTCGCCACTC TGGATGATAT TTTGCATCGC GGCGACTGGT GCGCGCAGCT GCAACAGGCG 
TGGTACGAAC ATATCCCGCT TAGTGAAAAA ATGGGCGTGC GCATTCAGCA ATATACCGGG 
CAAAAATTTA TCACTACCAT GCCAGAAACC GGCAATCAGA ATCCGCACCA TACGCTGTTT 
GCCGGGAGTT TATTCTCACT GGCGACGCTC ACCGGTTGGG GGCTTATCTG GCTGATGCTG 
CGCGAACGCC ACCTCGGCGG AACGATTATT CTGGCGGATG CGCATATCCG CTACAGCAAA 
CCGATTAGCG GTAAACCCCA TGCGGTAGCC GACCTTGGTG CCTTAAGCGG CGATCTCGAC 
CGTCTGGCGC GCGGACGAAA AGCACGGGTG CAGATGCAGG TCGAAATCTT TGGCGACGAG 
ACGCCGGGTG CAGTGTTTGA AGGCACGTAT ATCGTTCTGC CCGCGAAGCC ATTTGGCCCG 
TATGAAGAGG GCGGGAACGA AGAAGAGTAG

Protein sequence

MSQLPGLSRE TRESIAMYHL RVPQTEEELE RYYQFRWEML RKPLHQPKGS ERDAWDAMAH 
HQMVVDEQGN LVAVGRLYIN ADNEASIRFM AVHPDVQDKG LGTLMAMTLE SVARQEGVKR 
VTCSAREDAV EFFAKLGFVN QGEITTPTTT PIRHFLMIKP VATLDDILHR GDWCAQLQQA 
WYEHIPLSEK MGVRIQQYTG QKFITTMPET GNQNPHHTLF AGSLFSLATL TGWGLIWLML 
RERHLGGTII LADAHIRYSK PISGKPHAVA DLGALSGDLD RLARGRKARV QMQVEIFGDE 
TPGAVFEGTY IVLPAKPFGP YEEGGNEEE