Gene DvMF_2733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_2733
Symbol
ID	7174672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	-
Start bp	3458659
End bp	3459879
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	65%
IMG OID	643541266
Product	von Willebrand factor type A
Protein accession	YP_002437140
Protein GI	218887819
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4961] Flp pilus assembly protein TadG
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATGC TGATGGCCGT GCTGCTGCCC GTGGTGCTGG GCCTTGCCGG CCTTGGCATC 
GATTCGGGCA TGCTCTACCT CGCGCACAAC CGCCTGCAGG GGGCCGTGGA TGCGGCAGCC 
CTGGCGGGCA GTCTGGAACT TCCCTACGAC CCGCAACTGG ACAAGGGGCT GGTGAAGGGC 
GCCGTGAACC AGTACATGGC CGCCAACTAC CCCGCCGCCG TGCTGAAGGG CGTCACCCCC 
GGCACCGAGG AACGCAGCGT CACCGTGAAG GCCGAGGCCA CCGTGGACAC CATCTTCATG 
GGTGCCCTTG GCATCGGGTC CAGCACGGTG CGCGCCCAGG CCACCGCCGG GTACAACAAC 
CTGGAAGTGG TCTTCGTCAT CGACAACACC GGCTCCATGA AGGGCACGGC CATCCAGCAG 
GCCAACGCGG CCGCCACCCA GCTTGCCGAA CTGATCATGC CCGACGGCAT GGAAACCTCG 
GTCAAGGTGG GGCTGGTGCC CTTCCGGGGC AAGGTGCACA TTCCCGCGGG CGTGGACGGC 
CTGGCCGACG GCTGCCGCAA CGCCGACGGC ACCCTGGCGC CCTCGTGGAT ACTGGAAGAG 
TACAAGCAGA CCAAGTACCG CTACCCCACG GGTTCGTCAC TCAACGTGCC CAAGGGCACC 
TGCGACAGCA TTCCGCGCGT GCAGGCCCTG ACCAGCAACC GCACCACCAT CGTCAGCGCC 
ATCGCCAAGC AGGACGCCCT GGGCGATGCC TCGGGCACCG TCATCTCCGA AGGCATCAAG 
TGGGGGCGCC ATGTGCTCAC TCCCGAGGCG CCGTTCACCC AGGGCTCGTC CAACAAGGAC 
ATGCGCAAGG TGATGATCGT GCTGACCGAC GGCGATACCG AGGACGGCAA GTGCGGCGGC 
AACTACGCCC TGAACTACAC GCCCAACGCC TACTGGACCA ACGCCTACTA CGGCATGTTC 
GACATGAACA CTCACTGCGA GAACGGCGGC AAGCTGAACG CGGCCATGCT GAGCGAGGCG 
CAGATCGCCA AGGACAAGGG CATAGAGATC TTTGCCATCC GCTACGGCGA CTCCGACTCC 
ACGGACATCA GCCTGATGAA GGCCATCGCC TCCAGCAAGG CGGGCACGGA CGACCACTAC 
TACAACGCGC CCTCTGCCTA CGATCTTGAA GAAATCTTCA AGAAGATCGG TCGGCAGCTT 
GGCTGGCGGT TGCTGCGCTA G

Protein sequence

MAMLMAVLLP VVLGLAGLGI DSGMLYLAHN RLQGAVDAAA LAGSLELPYD PQLDKGLVKG 
AVNQYMAANY PAAVLKGVTP GTEERSVTVK AEATVDTIFM GALGIGSSTV RAQATAGYNN 
LEVVFVIDNT GSMKGTAIQQ ANAAATQLAE LIMPDGMETS VKVGLVPFRG KVHIPAGVDG 
LADGCRNADG TLAPSWILEE YKQTKYRYPT GSSLNVPKGT CDSIPRVQAL TSNRTTIVSA 
IAKQDALGDA SGTVISEGIK WGRHVLTPEA PFTQGSSNKD MRKVMIVLTD GDTEDGKCGG 
NYALNYTPNA YWTNAYYGMF DMNTHCENGG KLNAAMLSEA QIAKDKGIEI FAIRYGDSDS 
TDISLMKAIA SSKAGTDDHY YNAPSAYDLE EIFKKIGRQL GWRLLR