Gene Dvul_0133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_0133
Symbol
ID	4663363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	162987
End bp	164102
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	67%
IMG OID	639818328
Product	formamidopyrimidine-DNA glycosylase
Protein accession	YP_965584
Protein GI	120601184
COG category	[L] Replication, recombination and repair
COG ID	[COG0266] Formamidopyrimidine-DNA glycosylase
TIGRFAM ID	[TIGR00577] formamidopyrimidine-DNA glycosylase (fpg)

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.272092
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0428662
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGAAC TGCCTGAAGT GGAAACCATC GCCTGCGGCT TGCGTCCGGC CCTTTCAGGG 
CGGCGCATCG TGGGTGTTAC GGTGCACAAC CCCGGCACGC TGGAAGGTCC GCTGCGCACA 
CCTGCCGCCT TCACGGAGGC CGTGCAGGGG CGACGCATCG CGGATGTGGG ACGGCGCGGC 
AAGCTGCTGC TTGTGGCGTT CGCGTCATTG CCACCTGTCG GCCACGCAGG GCAACCGCGA 
CCTGAAGGTC TCTCCTCTTC CACGGTTCGC GACTTCCTCG TCACGCACGG CTTCCATGCC 
GCAGGGTGCG CCACGTCAGT CCATGCCTGT GCCCCCCTTC TTGCGGACGG GCAACAGACA 
TCCGGGCCCG TCCCGGAACG GGGCCGTCTC GCGGGGCACG GCGACGGCAT GGATGGCACA 
TCGCGGACCG GAAGCACCTT GCCCGGAACC GGAGGCACCG AAAACTCTGA CGCTGTAGCC 
GTAGCGGATG ACGACACCGT CCTCGGTCTC GCCTTCCACC TCAAGATGAC CGGACGCCTC 
TTCATCCACC CGCCCGCAAC CCCGGCGGGT ATCCACACCC GCGTGGTCTT CGACCTTGAA 
GGCGGCACTC GCCTCTTCTT CGATGACGCC CGCAAGTTCG GCTATGTGCG TTGCATCACC 
CGGCGCAGCC TTGCGCTGTG GCCTTTCTGG CGCGACCTCG GCCCCGAGCC CCTCGAGACT 
GACGCGCGCG GCTTCGCGGC GCGGCTCGCC CGCAGGCGAG GGCGCATCAA GGCCCTGTTG 
CTCGACCAGA AGGTCGTGGC GGGGGTTGGC AACATCTATG CCGACGAGTC GCTGTTCCGT 
GCCGGCATCC GCCCCGACAC GCAGGCCCAT ACCCTGATAC CTGAACGCCT CTTCGCCCTG 
CACGGGCATC TTCAGGATGT GCTACGCGAG TCCATCGCCG AATGCGGCAG TTCCATCCGC 
GACTACCGCG ATGCACACGG CGATGCGGGG GCCTTCCAGA ACAGCTTCAG GGTCTACGGG 
CGGGGCGGGC AGCCTTGCCG TCACTGCGGC ACGACTCTCG CCACGGCGCA GGTAGCAGGA 
CGCACCACGG TCTTCTGCCC CAGATGCCAG CGGTGA

Protein sequence

MPELPEVETI ACGLRPALSG RRIVGVTVHN PGTLEGPLRT PAAFTEAVQG RRIADVGRRG 
KLLLVAFASL PPVGHAGQPR PEGLSSSTVR DFLVTHGFHA AGCATSVHAC APLLADGQQT 
SGPVPERGRL AGHGDGMDGT SRTGSTLPGT GGTENSDAVA VADDDTVLGL AFHLKMTGRL 
FIHPPATPAG IHTRVVFDLE GGTRLFFDDA RKFGYVRCIT RRSLALWPFW RDLGPEPLET 
DARGFAARLA RRRGRIKALL LDQKVVAGVG NIYADESLFR AGIRPDTQAH TLIPERLFAL 
HGHLQDVLRE SIAECGSSIR DYRDAHGDAG AFQNSFRVYG RGGQPCRHCG TTLATAQVAG 
RTTVFCPRCQ R