Gene DvMF_1001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_1001
Symbol
ID	7172896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	1216312
End bp	1217406
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	69%
IMG OID	643539507
Product	biotin synthase
Protein accession	YP_002435424
Protein GI	218886103
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	80
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCCCC TGCTGGAACG TCTGTGCGCG CGCCTTTCGG ACACCATTCC CCCCGGAACG 
GAAACTCCGT ACGCATCGCC AAGCCACGCC CGCACGGAGG AAGCCCCCTG GTCCGGCATC 
ACCGGAGAAG AGGCGCTCGC CGTGGCGCGG CTGCCCGCGT CCGACATCCT GGACATCCTG 
GCCGTTGCGC AGGCCGTGCG TTCGGCCCGC AAGGGGCCGC TGGCGACCAC TTGCGGCATC 
GTCAACGCCA AGTCGGGCCG GTGCGGCGAG GATTGCGCCT TTTGCGCCCA ATCGTCGCAC 
CACGACACGG GAGCCCCGGT GCATGCGCTG CTCGGCCCCG ACGCGTTGCT GCGCCATGCG 
GAAGAACTGG CCCGCGCGGG GGTGCGCCGC TTCGGCATAG TGACCAGCGG CAACGCCCTT 
TCGGAACGGG AGTTCGACGC GGTCTGCCAT GCGGCGCGCC TGCTGCGCGA CCGTGTGGAC 
ATCGGCCTGT GCGCCTCTCT GGGGCAACTC GCCACCGGGT CCGCCGAGAG CGGAAACCGG 
GGAGAACGAG CGCGCCGCCT GAAGGACGCA GGCATCTCCA GCTACCACCA CAATCTTGAA 
ACGGCCAGAA GTTTTTTCCC GCAGGTATGT ACCACGCACC CTTACGACGA CGACATCGCC 
ACCGTGCGCG AGGCCGCGCG GGCGGGGCTG CGCACCTGTT GCGGCGGCAT CCTGGGCCTT 
GGCGAAACGT GGGAACACCG TGTGGAACTG GCCCTGACCC TGCGTGAACT GGACGTGGAC 
TCCATCCCGC TGAACTTCCT GCATCCCGTT CCGGGAACAC GGCTGGGCCA CCGCAGTCCG 
CTGCCCCCCA TGGAAGCCCT GCGGGCCATT GCCGTGTTCC GGCTGCTGCA CCCGCAGAGG 
GACATCCTGG TGTGCGGCGG ACGCGAGACG ACCCTTGGCC AGTGGCAGTC GTGGGTATTC 
GCCGCCGGGG CCAACGGACT GATGGTGGGC AACTACCTGA CCACGGCGGG CCGCGCCCTT 
GCCGAGGACA TGGAGATGCT GGCCGCGCTG GGCGTGGGCG AAATTCCCCG CAATGGCGAG 
GAGGCACGGG CATGA

Protein sequence

MNPLLERLCA RLSDTIPPGT ETPYASPSHA RTEEAPWSGI TGEEALAVAR LPASDILDIL 
AVAQAVRSAR KGPLATTCGI VNAKSGRCGE DCAFCAQSSH HDTGAPVHAL LGPDALLRHA 
EELARAGVRR FGIVTSGNAL SEREFDAVCH AARLLRDRVD IGLCASLGQL ATGSAESGNR 
GERARRLKDA GISSYHHNLE TARSFFPQVC TTHPYDDDIA TVREAARAGL RTCCGGILGL 
GETWEHRVEL ALTLRELDVD SIPLNFLHPV PGTRLGHRSP LPPMEALRAI AVFRLLHPQR 
DILVCGGRET TLGQWQSWVF AAGANGLMVG NYLTTAGRAL AEDMEMLAAL GVGEIPRNGE 
EARA