Gene DvMF_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_2041
Symbol
ID	7173960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	2531921
End bp	2532985
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	68%
IMG OID	643540558
Product	protein of unknown function DUF116
Protein accession	YP_002436452
Protein GI	218887131
COG category	[S] Function unknown
COG ID	[COG1852] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATGC CCATCCGCAA GAACCCGGAT TCCCTCCCGC GAGAGGACTA CCACGGCGCC 
CGCAAGCGGC TGTTCATCGG GCTCATCAGC CTGACGTCCG CCGCCCTGTG CCTAGTGCTG 
CTGGTGGGGT GGATCATCCC GTACATCGGG CTGGGCAACA TCCATCCGCT GGTGCCGGAC 
ATCACCGGGG CCCTGCTGGT GGCGTGCATT GCGCTCATCG TGTGGGCCAC GCTGGGCCTT 
GTGCTGCACA TCTACACCGG GCGGCCCTGG TTCGGCTCGC AACGGGTGCG CGGCGTGGCG 
GTAAAGCTGT TCCTGCCGCT CATGGAGCTG CTGGGGCGGC TGTTCGGCAT CTCGCGCGAA 
GAGGTGCGCC ACTCGTTCAT CAAGGTCAAC AACGAGCTGG TGCGCGGCGA GACGGGCAGC 
TTTGCCCCGT CGGACGTGCT GATCCTGCTG CCGCACTGCC TGCAGTCCAG CAACTGCGCG 
GTGCGCCTGA CCTACGGCGT GGACCACTGC AAGCGCTGCG GCCAGTGCCC CATAGAGCGG 
CTGCTGGCCC TGCGCGATCG CTACGGCGTC AAGCTGGCCA TAGCCACCGG CGGCACCATC 
GCCCGGCGTA TCGTGGTCAA GGAGCGCCCC CGGCTGATCA TTGCCGTGGC CTGCGAACGC 
GACCTTGCCA GCGGCATCCA GGACACCCAC CCCATCCCGG TGTACGGCGT GCTCAACGAG 
CGGCCCAACG GCCCCTGCCT GGACACGCTG GTCAGCCTGC TCAACGTGGA AAAGGCCCTG 
CGCCACTTCC TGAACGTGCT GCCGCCCGAT GTTGCGATAG ATGATGCGGA AGCGGACACG 
GCTTCTGCGG CACCCGGCTT TCACGATGCT CCCGCGACTG GCGTGCCGGG CTCCGTTGCC 
GATGCCACCT TCGGGGCCGG CAGCGGACAT GCCACGGGCG TCGGGCATGC CGGGAGTCCC 
CATGGTGCCG GTGTTGCCAC AGCCCGCGAC CAGCGCGCGC AGGAACGCAC GCCTGCGGCC 
TCTTCCACCG CAGAGGCGCC TGCCGCGCCG TCGGAACCGC AATGA

Protein sequence

MSMPIRKNPD SLPREDYHGA RKRLFIGLIS LTSAALCLVL LVGWIIPYIG LGNIHPLVPD 
ITGALLVACI ALIVWATLGL VLHIYTGRPW FGSQRVRGVA VKLFLPLMEL LGRLFGISRE 
EVRHSFIKVN NELVRGETGS FAPSDVLILL PHCLQSSNCA VRLTYGVDHC KRCGQCPIER 
LLALRDRYGV KLAIATGGTI ARRIVVKERP RLIIAVACER DLASGIQDTH PIPVYGVLNE 
RPNGPCLDTL VSLLNVEKAL RHFLNVLPPD VAIDDAEADT ASAAPGFHDA PATGVPGSVA 
DATFGAGSGH ATGVGHAGSP HGAGVATARD QRAQERTPAA SSTAEAPAAP SEPQ