Gene Dvul_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1037
Symbol
ID	4664167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	+
Start bp	1272991
End bp	1274109
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	55%
IMG OID	639819262
Product	phage integrase family protein
Protein accession	YP_966484
Protein GI	120602084
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.197081
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAAGA CAAGATTTAC AGGGGTTTAC GAGAACCCTA GCACCAACCG CAAATATGAG 
GGCCGCCCTG ATGTCTGCTT CTACATAACC TTCAAGGATA ACGGTAAGAA AGTATTCGAG 
AAGGTCGGGT GGCGATCTGA GGGCTACACT GCAGCCTATG CCTCTGACGT CAGGTCTGAG 
CGGGTCAGAG ACATACGTCA TGGTAAGTCG TCGCCCCAGG GGCGAAAAGG CGAGCTGACC 
ATCAATGACG CATGGGCATT GTATCTCGAA AAATGGTTGC ATGGGAAGCC CAGCGAGCAA 
TCGGATGAGG CGCTCTATCG TCTATGGCTG GCCCCTGCGT TTGGCATGAA GAAGATGGCC 
GGGGTCAGGC CCGTCGACAT CGAGGAGTTC AAAAATCGTA TGCTGGCGCA GAGGTCGCCT 
CAGACAGTCA AGCACGCGTT GGGCCTGTTA CGGCGAGTCT ACAGGAAGAT GGCGGCGTGG 
GGTGAATACA AGGGCGATAT CCCAACAGTG TCTGTTCCGA TGCCGAAGGT CGACAACGGT 
CGTCTCCGCT TCCTCACCCC TGATGAGGCT GTCAGGCTGG TCGAAGCACT CCGTAAGAGG 
AGCGTTCTGT GGGCTGACGT GTCGCTGGTG TCGCTCCATG CGGGGCTGAG GCTGGATGAG 
ATCCTCGGCC TCCAAGCATG TCACGTGGAC ATTGATAACC GGCTGCTACA CGTCATGGAC 
GCCAAATGCG GCACGCGTAC CGTGCCGCTG GCTGATAGAG GACTATGTGA GATGTTGCGC 
CAGAGGAAGG CGGCCTGTTC TGGCGCGGAG GATTTTGTTT TTAAAAACAG GAATGGCGAG 
CGAATCAACA ATATCAGTCA AACCGTGGTC AGAGTCATAC AAGACTTAGG ATTCAATCAC 
GGTATCACTG ACAGAAGGCA TAAGGTCGTA TTCCACACGT TGCGGCATAC GTTCGGGTCG 
TGGATGGCGC AGCGAGGTGT ACCGCTGTAC GTCATCGGTG AATTGATGGG GCACTCGACT 
CTCGAAATGA CGCGCAGGTA TAGCAAGCTG TGTCCGGAGA CAAAGGTGGA CGCGCTCTCG 
TTTATCACGC AGGCGATGAA CTCCGGCAAA AGCGAGTGA

Protein sequence

MRKTRFTGVY ENPSTNRKYE GRPDVCFYIT FKDNGKKVFE KVGWRSEGYT AAYASDVRSE 
RVRDIRHGKS SPQGRKGELT INDAWALYLE KWLHGKPSEQ SDEALYRLWL APAFGMKKMA 
GVRPVDIEEF KNRMLAQRSP QTVKHALGLL RRVYRKMAAW GEYKGDIPTV SVPMPKVDNG 
RLRFLTPDEA VRLVEALRKR SVLWADVSLV SLHAGLRLDE ILGLQACHVD IDNRLLHVMD 
AKCGTRTVPL ADRGLCEMLR QRKAACSGAE DFVFKNRNGE RINNISQTVV RVIQDLGFNH 
GITDRRHKVV FHTLRHTFGS WMAQRGVPLY VIGELMGHST LEMTRRYSKL CPETKVDALS 
FITQAMNSGK SE