Gene SeD_A3453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3453
Symbol	mutY
ID	6873877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3315746
End bp	3316798
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	54%
IMG OID	642786447
Product	adenine DNA glycosylase
Protein accession	YP_002217085
Protein GI	198243866
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	0.849569
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGCGT CTCAATTTTC AGCCCAGGTT CTGGACTGGT ACGACAAATA CGGGCGGAAA 
ACGCTGCCCT GGCAAATTAA CAAGACGCCT TACAAAGTAT GGCTCTCGGA AGTCATGTTG 
CAACAAACGC AGGTGACGAC GGTGATTCCT TACTTTGAGC GATTTATGGC GCGCTTTCCG 
ACGGTAACGG ATTTAGCGAA TGCGCCGCTG GATGAAGTAC TCCATTTATG GACCGGGCTC 
GGCTATTACG CCCGCGCACG TAATTTGCAT AAAGCGGCGC AACAGGTGGC GACGCTTCAC 
GGTGGAGAAT TCCCGCAAAC TTTTGCCGAA ATCGCCGCGC TCCCCGGCGT CGGACGTTCA 
ACCGCCGGCG CAATTCTCTC CCTCGCGTTA GGTAAACATT ATCCGATTCT TGATGGAAAC 
GTTAAACGTG TGCTGGCTCG CTGTTATGCT GTTAGCGGCT GGCCTGGAAA AAAAGAGGTG 
GAGAATACGC TGTGGACGTT GAGCGAGCAA GTGACGCCCG CACGCGGCGT GGAGCGTTTT 
AATCAGGCGA TGATGGATCT GGGCGCAATG GTTTGTACGC GTTCAAAGCC AAAGTGCACC 
CTGTGTCCGC TGCAAAACGG TTGTATCGCC GCTGCGCATG AAAGCTGGTC ACGCTATCCG 
GGCAAGAAAC CGAAACAGAC GTTGCCGGAG CGGACGGGTT ACTTTTTATT GTTACAGCAT 
AATCAGGAGA TTTTCCTGGC GCAGCGCCCT CCCAGCGGTT TATGGGGCGG ACTCTACTGC 
TTCCCGCAGT TCGCCAGAGA AGATGAATTA CGTGAATGGC TGGCGCAACG GCATGTTAAC 
GCTGATAATT TGACCCAGCT TAATGCGTTT CGCCACACAT TTAGCCATTT CCATCTGGAT 
ATTGTGCCTA TGTGGCTTCC CGTGTCGTCA CTGGACGCCT GCATGGATGA AGGCAGCGCG 
CTCTGGTATA ACTTAGCGCA ACCGCCGTCA GTCGGACTGG CGGCCCCCGT GGAGCGCTTG 
TTACAGCAGT TACGTACCGG AGCGCCAGTT TAA

Protein sequence

MQASQFSAQV LDWYDKYGRK TLPWQINKTP YKVWLSEVML QQTQVTTVIP YFERFMARFP 
TVTDLANAPL DEVLHLWTGL GYYARARNLH KAAQQVATLH GGEFPQTFAE IAALPGVGRS 
TAGAILSLAL GKHYPILDGN VKRVLARCYA VSGWPGKKEV ENTLWTLSEQ VTPARGVERF 
NQAMMDLGAM VCTRSKPKCT LCPLQNGCIA AAHESWSRYP GKKPKQTLPE RTGYFLLLQH 
NQEIFLAQRP PSGLWGGLYC FPQFAREDEL REWLAQRHVN ADNLTQLNAF RHTFSHFHLD 
IVPMWLPVSS LDACMDEGSA LWYNLAQPPS VGLAAPVERL LQQLRTGAPV