Gene DvMF_2449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_2449
Symbol
ID	7174384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	3083870
End bp	3084880
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	70%
IMG OID	643540980
Product	formamidopyrimidine-DNA glycosylase
Protein accession	YP_002436858
Protein GI	218887537
COG category	[L] Replication, recombination and repair
COG ID	[COG0266] Formamidopyrimidine-DNA glycosylase
TIGRFAM ID	[TIGR00577] formamidopyrimidine-DNA glycosylase (fpg)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	97
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGAGT TGCCAGAGGT GGAGACCATT GCCTGCGGTT TGCGGCCCCA GTTGACGGGG 
CGGCGCATCG TGTCCGTTTT GGTGCGCAAC GAAGGGACGG TGCAGGGCGA CGCAGCGGCG 
TTCGCCCGGT GCGTGCCGGG GCGTGTCATT GCCGGGGTGG GGCGGCGCGG CAAGTTGCTG 
CTGATGGAAT TGGCCCCACC GGGCGGACCG GACGCCCCGG ATGCCACAGG CGGTGGAGCG 
GGCGGGCCGG ATGCGGCAGG GGCCGCCGGG ACGGGAACCA ATGTTCCGCC AGACGCGGCA 
GACCTGATGG CCTGCCGCGA CGCGGCGGGC AAGATGGCCG GTTCCAGCGC TACAGGCGCT 
ACAGGCGCGG CGGGCGGCAA CCGCGTGCCG CATCTGCTGG GCGTGCATCT GAAGATGACC 
GGGCGGCTGT TTGTCTACGG GCCGGAGGTG GCGCCCAACA CCCACACCCG CGTGGTCTTC 
GGGCTGGATG ACGGCAATCG GCTGTTTTTC GACGATGCGC GCAAGTTCGG TTACGTGCGC 
GCCCTGTCCG ACGCCGATCT GGCCACGTGG GACTTCTGGC GGTCGCTGGG GCCGGAGCCG 
CTGGAGATTG CCGCGCCGGA CTTCGCGGCG CTGTTCCGGG GGCGGCGGGG GCGCATCAAG 
GCGCTGTTGC TGGACCAGAC GGTCATCGCG GGCATCGGCA ACATTTACGC CGACGAATCG 
CTGTTCCGGG CGTCCATCCG GCCCGATGCG CAGGCCGGGG AGCTTTCGCC CGAGCGGCTG 
TGCGTGTTGC ACGGGCATCT GGTGGACGTG CTGCGCGAAT CCATCGCCGA GTGCGGCAGT 
TCCATCCGCG ACTACCGCGA TGCCCACGGC GATGCCGGGG CCTTCCAGAA CCGCTTCCGG 
GTGTACGGCA GGTCCGGGCA GCCGTGCGTG GCCTGCGGGC GCGCGCTGAC CACGGGCAAG 
GTGGCCGGGC GCACCACGGT GTTCTGCGAG CGCTGCCAGA AGGCGAAGTG A

Protein sequence

MPELPEVETI ACGLRPQLTG RRIVSVLVRN EGTVQGDAAA FARCVPGRVI AGVGRRGKLL 
LMELAPPGGP DAPDATGGGA GGPDAAGAAG TGTNVPPDAA DLMACRDAAG KMAGSSATGA 
TGAAGGNRVP HLLGVHLKMT GRLFVYGPEV APNTHTRVVF GLDDGNRLFF DDARKFGYVR 
ALSDADLATW DFWRSLGPEP LEIAAPDFAA LFRGRRGRIK ALLLDQTVIA GIGNIYADES 
LFRASIRPDA QAGELSPERL CVLHGHLVDV LRESIAECGS SIRDYRDAHG DAGAFQNRFR 
VYGRSGQPCV ACGRALTTGK VAGRTTVFCE RCQKAK