Gene YpsIP31758_0819 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_0819
Symbol	mutY
ID	5385149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	990151
End bp	991266
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	50%
IMG OID	640863783
Product	adenine DNA glycosylase
Protein accession	YP_001399803
Protein GI	153947319
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGCGC AACAATTCGC GCACGTGGTA CTTGATTGGT ACCAACGCTT TGGTCGTAAA 
ACCCTGCCAT GGCAGTTGGA TAAGACCCCC TATCAAGTAT GGCTGTCAGA AGTGATGTTG 
CAACAAACTC AGGTTGCGAC CGTCATCCCC TATTTTCAAC GTTTTATGCT GCGCTTCCCT 
GATATTCAGG CACTGGCGGC TGCGCCGTTG GATGAAGTAC TGCATTTATG GACCGGTTTG 
GGTTACTACG CCCGTGCCAG AAACCTGCAT AAAGCGGCCC AAATGGTCGT GGAACACCAT 
CAAGGGGAGT TTCCCACAAC ATTTGACCAG ATACTGGCAT TGCCAGGTAT CGGGCGCTCA 
ACTGCCGGGG CTATTTTATC GCTGTCTTTA GGCCAGCATT TTCCTATTTT GGATGGTAAC 
GTCAAACGGG TGCTGGCCCG TTGCTATGCC GTTGACGGCT GGCCGGGAAA AAAAGAGGTC 
GAAGGCCGCC TGTGGCAAAT CAGCGAAGAT GTCACACCCG CCAACGGGGT GGGCCAGTTT 
AATCAGGCAA TGATGGATTT AGGCGCGATG GTGTGTACTC GCTCTAAACC TAAATGTGAA 
CTTTGCCCAT TGAATATCGG CTGTATGGCG TACGCTAACC ACAGTTGGGC GCGCTATCCG 
GGCAAAAAAC CTAAACAGAC GTTGCCGGAA AAAACCGCCT GGTTCTTATT AATGCAAAAT 
GGATCGCAAG TGTGGCTCGA ACAGCGCCCC CCAGTCGGCT TATGGGGCGG CTTATTCTGT 
TTCCCACAAT TTGCTGAACA AGAAGAACTC ATTCACTGGC TGCAAAAACA GGGTATTCCC 
GCCAATGAAA CCCAGCAGTT AACCGCGTTT CGCCATACGT TTAGTCATTT CCATCTGGAT 
ATAGTCCCTA TATGGCTAAA TACGGCCTCA GTCCGAGGAT GCATGGATGA TGGCGCAGGT 
CTCTGGTATA ACTTAGCCCA GCCACCTTCG GTAGGGTTAG CTGCTCCGGT TGAGCGTTTA 
TTGCATCAGT TATTAAAAGA TCCGTTGGCA AAAGATGAGT TAACGCAACA ACAACTCACA 
AAGCAATCAC CTACCCAACC AGCTTTATTT GACTAG

Protein sequence

MQAQQFAHVV LDWYQRFGRK TLPWQLDKTP YQVWLSEVML QQTQVATVIP YFQRFMLRFP 
DIQALAAAPL DEVLHLWTGL GYYARARNLH KAAQMVVEHH QGEFPTTFDQ ILALPGIGRS 
TAGAILSLSL GQHFPILDGN VKRVLARCYA VDGWPGKKEV EGRLWQISED VTPANGVGQF 
NQAMMDLGAM VCTRSKPKCE LCPLNIGCMA YANHSWARYP GKKPKQTLPE KTAWFLLMQN 
GSQVWLEQRP PVGLWGGLFC FPQFAEQEEL IHWLQKQGIP ANETQQLTAF RHTFSHFHLD 
IVPIWLNTAS VRGCMDDGAG LWYNLAQPPS VGLAAPVERL LHQLLKDPLA KDELTQQQLT 
KQSPTQPALF D