Gene SNSL254_A3358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3358
Symbol	mutY
ID	6484179
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3258019
End bp	3259071
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	55%
IMG OID	642738649
Product	adenine DNA glycosylase
Protein accession	YP_002042370
Protein GI	194444686
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	0.173815
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGCGT CTCAATTTTC AGCCCAGGTT CTGGACTGGT ACGACAAATA CGGGCGGAAA 
ACGCTGCCCT GGCAAATTAA CAAGACGCCT TACAAAGTAT GGCTCTCGGA AGTCATGTTG 
CAACAAACGC AGGTGACGAC GGTGATTCCT TACTTTGAGC GATTTATGGC GCGCTTTCCG 
ACAGTGACGG ATTTAGCGAA TGCGCCGCTG GATGAAGTGC TCCATTTATG GACCGGGCTC 
GGCTATTACG CCCGCGCGCG TAATTTGCAT AAAGCGGCGC AACAGGTGGC GACGCTTCAC 
GGTGGAGAAT TCCCGCAAAC TTTTGCCGAA ATCGCCGCGC TACCCGGCGT CGGGCGCTCA 
ACCGCCGGCG CGATTCTCTC CCTCGCGTTA GGTAAACATT ATCCGATTCT TGATGGAAAC 
GTTAAACGTG TGCTGGCTCG CTGTTATGCT GTTAGCGGCT GGCCTGGAAA AAAAGAGGTG 
GAGAATACGC TGTGGACGTT GAGCGAGCAA GTGACGCCCG CACGCGGCGT GGAGCGTTTT 
AATCAGGCGA TGATGGATCT GGGCGCGATG GTTTGTACGC GTTCAAAGCC AAAGTGCACC 
CTGTGTCCGC TGCAAAACGG TTGTATCGCC GCTGCGCATG AAAGCTGGTC ACGCTATCCG 
GGCAAGAAAC CGAAACAGAC GTTGCCGGAG CGGACGGGTT ACTTTTTATT GTTACAGCAT 
AATCAGGAGA TTTTCCTGGC GCAGCGCCCT CCCAGCGGTT TATGGGGCGG ACTCTACTGC 
TTCCCGCAGT TCGCCAGCGA AGATGAATTA CGTGAATGGC TGGCGCAACG GCATGTTAAC 
GCTGATAATT TGACCCAGCT TAACGCGTTT CGCCACACAT TTAGCCATTT CCATCTGGAT 
ATTGTGCCTA TGTGGCTTCC CGTGTCGTCA CTGGGCGTCT GCATGGATGA AGGCAGCGCG 
CTCTGGTATA ACTTAGCGCA ACCGCCGTCA GTCGGACTGG CGGCCCCCGT GGAGCGCTTG 
TTACAGCAGT TACGTACCGG AGCGCCAGTT TAA

Protein sequence

MQASQFSAQV LDWYDKYGRK TLPWQINKTP YKVWLSEVML QQTQVTTVIP YFERFMARFP 
TVTDLANAPL DEVLHLWTGL GYYARARNLH KAAQQVATLH GGEFPQTFAE IAALPGVGRS 
TAGAILSLAL GKHYPILDGN VKRVLARCYA VSGWPGKKEV ENTLWTLSEQ VTPARGVERF 
NQAMMDLGAM VCTRSKPKCT LCPLQNGCIA AAHESWSRYP GKKPKQTLPE RTGYFLLLQH 
NQEIFLAQRP PSGLWGGLYC FPQFASEDEL REWLAQRHVN ADNLTQLNAF RHTFSHFHLD 
IVPMWLPVSS LGVCMDEGSA LWYNLAQPPS VGLAAPVERL LQQLRTGAPV