Gene ECH74115_4265 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4265
Symbol	mutY
ID	6969259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3949004
End bp	3950056
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	55%
IMG OID	643388003
Product	adenine DNA glycosylase
Protein accession	YP_002272442
Protein GI	209395967
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.528078
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGCGT CGCAATTTTC AGCCCAGGTT CTGGACTGGT ACGATAAATA CGGGCGAAAA 
ACTCTGCCCT GGCAAATTGA CAAGACGCCC TACAAAGTAT GGCTCTCAGA AGTGATGTTG 
CAACAAACTC AGGTTGCGAC CGTTATCCCC TATTTTGAAC GCTTTATGGC GCGCTTCCCG 
ACGGTGACCG ATCTCGCCAA TGCGCCGCTC GACGAAGTTC TCCACTTGTG GACGGGGCTT 
GGCTATTACG CCCGCGCGCG CAATCTGCAT AAAGCGGCAC AACAAGTGGC GACCTTACAC 
GGCGGTAAAT TCCCGGAAAC CTTTGAGGAA GTTGCAGCAC TGCCGGGCGT CGGGCGTTCC 
ACCGCAGGCG CGATTCTATC GCTTTCTCTG GGTAAGCACT TTCCGATTCT CGACGGTAAC 
GTCAAACGGG TGCTGGCGCG CTGCTATGCT GTAAGCGGCT GGCCTGGGAA AAAAGAGGTC 
GAGAATAAAT TATGGAGTTT AAGCGAGCAG GTGACGCCCG CGGTCGGCGT GGAACGGTTT 
AATCAGGCGA TGATGGATTT GGGCGCGATG ATTTGCACGC GTTCGAAGCC GAAATGTTCG 
CTCTGTCCGC TACAAAACGG ATGTATTGCC GCCACCAACA ATAGCTGGTC GCTTTATCCG 
GGCAAAAAAC CGAAACAGAC GCTGCCGGAG CGCACCGGCT ACTTTCTCCT GTTACAGCAC 
GAAGATGAAG TATTGCTGGC GCAGCGTCCG CCGAGCGGAT TGTGGGGCGG TTTATACTGT 
TTCCCGCAGT TTGCCGACGA AGAAAGTTTG CGGCAGTGGC TGGCGCAACG GCAGATTGCT 
GCCGATAACC TGACGCAGCT GACCGCGTTT CGGCATACCT TCAGCCATTT CCACTTAGAT 
ATTGTGCCTA TGTGGCTTCC CGTGTCGTCA TTCACCGGCT GCATGGATGA AGGCAATGCG 
CTCTGGTATA ACTTAGCGCA ACCGCCGTCA GTTGGCCTGG CGGCTCCCGT GGAGCGTTTG 
TTACAGCAGT TACGCACTGG CGCGCCGGTT TAG

Protein sequence

MQASQFSAQV LDWYDKYGRK TLPWQIDKTP YKVWLSEVML QQTQVATVIP YFERFMARFP 
TVTDLANAPL DEVLHLWTGL GYYARARNLH KAAQQVATLH GGKFPETFEE VAALPGVGRS 
TAGAILSLSL GKHFPILDGN VKRVLARCYA VSGWPGKKEV ENKLWSLSEQ VTPAVGVERF 
NQAMMDLGAM ICTRSKPKCS LCPLQNGCIA ATNNSWSLYP GKKPKQTLPE RTGYFLLLQH 
EDEVLLAQRP PSGLWGGLYC FPQFADEESL RQWLAQRQIA ADNLTQLTAF RHTFSHFHLD 
IVPMWLPVSS FTGCMDEGNA LWYNLAQPPS VGLAAPVERL LQQLRTGAPV