Gene Dvul_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1040
Symbol
ID	4664234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	1275966
End bp	1277945
Gene Length	1980 bp
Protein Length	659 aa
Translation table	11
GC content	68%
IMG OID	639819265
Product	C-5 cytosine-specific DNA methylase
Protein accession	YP_966487
Protein GI	120602087
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.172605
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTAG ACCTCCTCAA CATCAGCCGG GACGAGATCG TCGTTGACCT GTTCGCGGGC 
GGGGGCGGTG CCAGCCTCGG CATCGAGATG GCAGGGTGCC GCGTGCACGC TGCGGTGAAT 
CACGATCCGG TTGCCGTCTC GCTCCACCGC GAGAACCACC CCGACACCGA GCACTACACA 
CAGGACGTGT TTACCGTGTC GCCGCAGTGG GTGACGCGCG GTCGCAAGGT GGGCCTGCTG 
TGGGCCTCGC CAGACTGCAC GCACCACTCC AAAGCCAAAG GCGGAGCACC CACGCGCAAC 
GCCCGTCGCC GCGAGCTGGC CCGTGTCATT GTCGACAAGT GGATACCGGA GTTGCGCCCA 
AGCGGAGCAC ACCCCCGCGT CATCATCCTC GAAAACGTCG AGGAGTTTCA GGACTGGGGC 
CCGTTGGACG CCAAGGGCCG CATCATCGAG GCGCAGCGTG GCAAGTCTTT CAAGCGGTTC 
ATCAGCGACC TCAAGCGGTT CGGCTACAAG GTCGAGTGGC GCGAGCTGCG GGCGTGTGAC 
TACGGCACAC CAACCATCCG CAAGAGGCTG TTCCTGATTG CCCGGCGCGA CAAACTGCCC 
ATCGTCTGGC CCGAGCCGAC GCACGGTGCA CCCGGCTCTC CCAAGGTGCT GGCTGGCCAG 
CGCAGGCCGT GGCGAACGGC AGCCGAGTGC ATCGACTGGT CACTACCCTG CCCGAGCGTA 
TTTGCCTCGT CCGGGGAGAT TATGGAGCGG CACGGGGTGC GGGCCATCCG CCCCCTGTCG 
CCCAACACGC TGCGCCGGGT CGCCAAGGGT ATCCAGCGGT ACGTCGTGGA GGCCGCCGAG 
CCGTTTGTGG TGCAGATGCG TACCGGGGCC GTCGGTCATC CCATCGACGA GCCGTTGCGC 
ACCGTCACGG CGGGGGGCAA GGCCGCAAGG CCGGGTACGG GCAACACGTT CGCCCTGTGC 
GTTCCAAGCA TCCAGACCTA CTACGGCGAC CACGCCGGGA CGCACGACGG CGCACGGAGA 
GGATGCGCGA TGGACGCGCC CGTGGGCAGT GTCACAGCCG GGGGCAACCG CCACGCGCTC 
GCCGTGGCCC ACCTGCAACG GCAGTTTGGC AACAGCGTCG GTCAGGAGTG CGACAAGCCC 
GCGCCTACCG TCATGCCCGG GGGCGACGGT AAGACCGCTG TCTGTGCGGC CATGCTCAAA 
CACTATGGCG GCGTGGTCGG GCACGAGGTC GAGCAGCCCC TCGGCACAGT GACCCGCGTT 
GACCATCACT CGCTCATGAC GGCGGTGGTG GTCGGGGCCG GCGGCCCCAG CTACGGCGGA 
AGACCGGCAG CAGTCGACGC GCCGCTGGGC ACGGTGCTGA CCGACAATCA CCGCGCCGTC 
GCTGTCTGCA AGATGCGTGG TGACAACGTC GGTCACGGGG CCGACGAGCC GCTCCACACG 
GTCAGCGCAC GCGGGACGCA TCATGCGCTC CTCGCTGCGA CCATCGCCAA GGACTACGGT 
ACGGGCGGAT GCGTGGACAC AAGAGCCCCC CTCGCGACTG TTACGCAGCG TGACAAGCTG 
GAGCTCGTCA CGGGGTGCCT CGCGGCCTAC TACGGCGCAG AGGGCGACGG CCAGCCCGTC 
ACGGCCCCCA TGCGCACCAC GACCACCCGC GACCGCTTCG CGTTCGTCCG CGCCCTGCTG 
GACGAGTATA CCCCCGGCGT CGAGCCTGTC GTCACCATCG GCGGGCAGCG TTATGCCGTC 
GTCGACATCG GGCTTCGGAT GCTGACGCCG CGCGAGCTTG CGCGGGCGCA GGGTTTTCCG 
GACACCTACA TGCTCGACAT GGTGGGCGGG CAGCCTGTCA CCAAAGCGGC GCAGGTCAGC 
ATGATTGGGA ACAGTGTGTG CCCCGATTTG GCCGCAGCTC TGGTGGGGGC CAACTACAAG 
CCGGTGCGCC ACGATGCGCC GGTGGTCGCC ATGCCGCTTC TGGAGGTGTG CAATGCGTAG

Protein sequence

MLLDLLNISR DEIVVDLFAG GGGASLGIEM AGCRVHAAVN HDPVAVSLHR ENHPDTEHYT 
QDVFTVSPQW VTRGRKVGLL WASPDCTHHS KAKGGAPTRN ARRRELARVI VDKWIPELRP 
SGAHPRVIIL ENVEEFQDWG PLDAKGRIIE AQRGKSFKRF ISDLKRFGYK VEWRELRACD 
YGTPTIRKRL FLIARRDKLP IVWPEPTHGA PGSPKVLAGQ RRPWRTAAEC IDWSLPCPSV 
FASSGEIMER HGVRAIRPLS PNTLRRVAKG IQRYVVEAAE PFVVQMRTGA VGHPIDEPLR 
TVTAGGKAAR PGTGNTFALC VPSIQTYYGD HAGTHDGARR GCAMDAPVGS VTAGGNRHAL 
AVAHLQRQFG NSVGQECDKP APTVMPGGDG KTAVCAAMLK HYGGVVGHEV EQPLGTVTRV 
DHHSLMTAVV VGAGGPSYGG RPAAVDAPLG TVLTDNHRAV AVCKMRGDNV GHGADEPLHT 
VSARGTHHAL LAATIAKDYG TGGCVDTRAP LATVTQRDKL ELVTGCLAAY YGAEGDGQPV 
TAPMRTTTTR DRFAFVRALL DEYTPGVEPV VTIGGQRYAV VDIGLRMLTP RELARAQGFP 
DTYMLDMVGG QPVTKAAQVS MIGNSVCPDL AAALVGANYK PVRHDAPVVA MPLLEVCNA