Gene VC0395_A0003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0003
Symbol	mutY
ID	5135715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	1199
End bp	2260
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	51%
IMG OID	640531463
Product	A/G-specific adenine glycosylase
Protein accession	YP_001215977
Protein GI	147675529
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000019513
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTCCTT TTGCACAGGC CATCCTTACT TGGTATGACG CCTACGGCCG CAAAAACCTG 
CCGTGGCAAC AAAATAAAAA TGCGTATCGC GTTTGGTTAT CGGAAATCAT GTTACAGCAG 
ACTCAAGTCG CGACCGTGAT CCCCTACTTT GAACGCTTTT TAGAGCGCTT CCCGACCGTA 
CACGCCCTCG CGGCAGCGCC GCAAGATGAA GTGCTGCATT TCTGGACGGG GCTTGGCTAC 
TACGCCAGAG CGCGCAATCT GCATAAAGCA GCGAAAATGG TTGTGAGTGA ATATAGCGGC 
GAATTTCCCA CCGATTTAGA GCAGATGAAT GCGCTACCCG GTGTTGGCCG TTCCACCGCG 
GCAGCCGTGC TCTCTTCTGT GTATAAAAAA CCACACGCCA TTTTGGATGG CAACGTGAAA 
CGCACGTTAG CGCGCTGCTT TGCCGTTGAA GGTTGGCCGG GGCAAAAAAG TGTCGAAAAC 
CAGCTTTGGC ATTATGCAGA AATGCACACG CCCAAAGTGG ATGTTGATAA ATACAACCAA 
GCCATGATGG ATATGGGCGC AATGATCTGC ATTCGCAGTA AGCCCAAATG CAGCCTGTGC 
CCAGTAGAAT CGTTTTGCCT TGCCAAGCAG CAAGGCAATC CCCAAGAGTA TCCGGGCAAG 
AAACCGAAAA CAGATAAACC CGTCAAAGCC ACTTGGTTTG TCATGCTCTA TCACGACAAT 
GCCGTCTGGC TTGAGCAGCG CCCGCAAAGC GGAATTTGGG GCGGTTTGTA CTGCTTCCCG 
CAATCAGAGA TCGCCAATAT TCAAACCACC ATAGATCAGC GCGCCATCGG CGATAGCACA 
ATAACATCGC AGAAAACCCT GATCGCATTT CGCCACACCT TTAGCCACTA CCATCTCGAT 
ATTACGCCGA TTTTGCTGCA ATTAAGCCGC AAACCGGACA TCGTCATGGA AGGGAGCAAA 
GGTCTTTGGT ATAACTTAAG TCAACCCGAT GAGATTGGTC TCGCGGCACC AGTGAAACAA 
CTGTTGCACA GCTTACCTTT CGACATTGAT AGCCACATTT AA

Protein sequence

MTPFAQAILT WYDAYGRKNL PWQQNKNAYR VWLSEIMLQQ TQVATVIPYF ERFLERFPTV 
HALAAAPQDE VLHFWTGLGY YARARNLHKA AKMVVSEYSG EFPTDLEQMN ALPGVGRSTA 
AAVLSSVYKK PHAILDGNVK RTLARCFAVE GWPGQKSVEN QLWHYAEMHT PKVDVDKYNQ 
AMMDMGAMIC IRSKPKCSLC PVESFCLAKQ QGNPQEYPGK KPKTDKPVKA TWFVMLYHDN 
AVWLEQRPQS GIWGGLYCFP QSEIANIQTT IDQRAIGDST ITSQKTLIAF RHTFSHYHLD 
ITPILLQLSR KPDIVMEGSK GLWYNLSQPD EIGLAAPVKQ LLHSLPFDID SHI