Gene Dvul_1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1104
Symbol
ID	4662810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	1342923
End bp	1344185
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	63%
IMG OID	639819333
Product	von Willebrand factor, type A
Protein accession	YP_966551
Protein GI	120602151
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4961] Flp pilus assembly protein TadG
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.753254
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.1698
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGCCC TGTCGGCCCT TCTCCGGCGG CAGAAGGGTT CCATGGCGAC GCTGGTCGCC 
GTGCTGCTGC CAGTCGTCCT CGGGCTTGTG GGCCTCGGCA TCGACTCGGG CATGCTCTAC 
CTGTCCCACA GCCGCCTGCA GGCCGCCGTG GATGCTGCCG CCCTCGCCGG CAGCCTGCAA 
CTGCCCTACG ACCCGCAGCT GGACAAGGGA CTCGTGCGCG GGGCCGTCAC GCAGTACATG 
GATGCCAACT ACCCCGAAGC CTCTCTCAAC GGGGTGACTC CGGGCACAGA GGAACGCAGT 
GTCACGGTCA CCGCCACCGC CACCGTGCCC ACCATCTTCA TGAACGCGCT CGGCATCGGT 
TCCAGCGAGG TGCACGCCAA GGCCACTGCC GGATACAACA AGCTGGAGGT CGTCTTCGTC 
ATCGACAACT CCGGTTCCAT GAAGGGCACC CCCATCCAGC AGACCAACAG CGCGGCCTCG 
CAGCTTGTGG AACTCATCAT GCCCGAGGGC ATGATGACGT CGGTCAAGGT GGGGCTGGTG 
CCCTTCCGCG GCAAGGTGCA CCTGCCAGCC GGTGTGGACG GGCTTCCCGA CGGCTGCCGC 
AACGCCGACG GGACGCTGAA CCCCAGCTGG CTGCACGAAG AGTACTTCAA GACGTCATAC 
CGCTATCCCT CAGGCTCGTC ACTGAACGTG CCCAAGAACA CGTGCACCAG CATTCCCCGC 
GTGCAGGGAC TGACTGAAGA CCGCGAGACA ATCCTCACCG CCATATCGAA GCAGAACGGC 
CTTGGTGACG CCTCGGGGAC GGTCATATCC GAAGGGCTGA AATGGGGACG TCACGTGCTC 
ACGCCCGAGG CACCGTTCAC CGAAGGCTCA TCGGCCAAGG ACATCCGCAA GGTCATCATC 
GTGCTCACCG ATGGTGATAC CGAAGACGGA AAGTGCGGAG GCAGCTACGC CATCAACTAC 
ACCCCCAACG CCTACTGGAC CAACGCCTTC TACGGCATGC TGGACATGAC GTCGCACTGC 
GAGAACGGGG GCAAGCTCAA TGCCGCCATG CTCGAAGAGG CGCGCAAGGT GAAGGAGGCG 
GGTATCGAGG TGTTCGCCAT ACGCTTCGGC GATTCAGACA GTGTCGACGT CTCGCTCATG 
AAGAGCATCG CGTCCAGCAA GGCTGGGACC AACGACCATT ACTACGACGC GCCCTCGGCC 
TACGACATCG ACGACGTGTT CAAGAAGATC GGCCGACAGC TCGGCTGGAG ACTGCTGCGC 
TAG

Protein sequence

MRALSALLRR QKGSMATLVA VLLPVVLGLV GLGIDSGMLY LSHSRLQAAV DAAALAGSLQ 
LPYDPQLDKG LVRGAVTQYM DANYPEASLN GVTPGTEERS VTVTATATVP TIFMNALGIG 
SSEVHAKATA GYNKLEVVFV IDNSGSMKGT PIQQTNSAAS QLVELIMPEG MMTSVKVGLV 
PFRGKVHLPA GVDGLPDGCR NADGTLNPSW LHEEYFKTSY RYPSGSSLNV PKNTCTSIPR 
VQGLTEDRET ILTAISKQNG LGDASGTVIS EGLKWGRHVL TPEAPFTEGS SAKDIRKVII 
VLTDGDTEDG KCGGSYAINY TPNAYWTNAF YGMLDMTSHC ENGGKLNAAM LEEARKVKEA 
GIEVFAIRFG DSDSVDVSLM KSIASSKAGT NDHYYDAPSA YDIDDVFKKI GRQLGWRLLR