Gene Dvul_1109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1109
Symbol
ID	4662534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	1347971
End bp	1349797
Gene Length	1827 bp
Protein Length	608 aa
Translation table	11
GC content	66%
IMG OID	639819338
Product	type II secretion system protein E
Protein accession	YP_966556
Protein GI	120602156
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.280352
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0921606
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACTCG CCGAACGCCT CATGCGCGCG ACACGACGCC AGCAGGAAAC GGACGACGTA 
CCCGCCGCCC CGGTTCATGC GAGACGGGCC ACCGACCGCA TCGCCATGCC CGACACCCTG 
CGTGGTGACA CCGGGACACA CGGGCCCGAG AACGCCCCTT CTTCGCACCT CGACGTCACC 
ACGGCATCGG CCGGGCAACC GGACACGCAC AGCCAGACCG GCATGCCGTA CGATGTGGCG 
GTCGATGGCC TGCACGTCCG GCCTCCGCAA GACGGCCCTG CATCCGGACT TTTCCAGACG 
ACCAGCGACC AGCCCCCCAC CATTGCGGAC GGCGAGAACG ACGAGAACCC GATTCTGCCC 
CCTGCGGCCA CCACGGCGGC ACCGCGACGC CCTGTGGTCG CGCCGTCGTC ATCAAGGCGC 
ACGGACGACG CCACCGTGTC CCCCGCCGCT GCCGAAACAC AGGCAACCGC CCCGGCACAG 
GCCGAGCAAC CCCTGCGGGC GGCCCGCAGC ACCCCCCGGG CCGCGGAACA GGTCGTGGAC 
GTGAGCAAGC TCACCCTGCA CGGTGACCAC TATTACGAAA TCAAGGAACA TCTGCTCGAC 
CGACTGCTTG AGCTTCTCGA CCTCGCCGCC GTGGAGTCGC TTCCCCCCGA ACGACTTGGC 
GACGAGATTG GCCGCCTCGT CGAGAGGCTC ATGCGCGACG AGTTCAGGCA AGCCCCCCTC 
AACGCCAGTG AACGCCGCCA GATAACCGGT GACATCCGCG ACGAGATCCT CGGCCTCGGC 
CCGCTGGAAC CGCTGCTGCA CGACCCCACC GTCAACGACA TCCTCGTCAA CAACTACAGG 
CAAATCTACG TCGAACGCCG CGGCAAGCTC ATCAAGGTCA ACACGCGCTT CCAGGACGAC 
GACCACCTGC GCAAGATCAT CGACCGCATC GTCTCGCGCA TAGGCCGCCG AGTGGACGAA 
TCGTCGCCCA TGGTCGACGC CCGCCTTGCC GACGGGTCGC GCGTCAACGC CATCATCCCG 
CCTCTGGCGC TCGACGGACC CAGCCTGTCC ATCCGCCGCT TCTCGAAGGA CCCTCTGGAG 
TTGCACGACC TCATCGGCTT CGGCGCCCTG ACGCCGGAGA TGGGCGAAGT GCTGCAGGGC 
ATCGTCAAGG CGCGGCTGAA CATCATCGTC TCGGGCGGAA CAGGGTCGGG CAAGACCACC 
ATGCTCAACT GCCTTTCGCG TTTCGTGCCG CACGACGAAC GCATCGTGAC CATCGAGGAC 
GCCGCAGAAC TCCAGCTCAA ACAGGAGCAT GTGGTGCGCC TTGAGACACG GCCCGCCAAC 
ATCGAGGGAC ACGGCGAGGT CACGGCCCGC GACCTTGTGA AGAACTGCCT GCGTATGCGC 
CCCGACCGCA TCATCGTCGG CGAAGTCCGT AGCGGTGAAG TGCTCGACAT GCTGCAAGCC 
ATGAACACCG GTCACGACGG GTCGCTGACG ACCATCCACG CCAACACCCC GCGAGACTGC 
CTGATGCGCC TTGAGACCAT GGTCGCCATG GCAGGGCTGA ACATCAGCAC CCTTTCGCTC 
AAACGCTACA TATCCTCCGC CGTGGACGTG ATCATACAGG TCTCACGCCT CTCGGACGGT 
TCACGCAAGC TCACCAGCCT GATGGAACTG ACCGGCATGG AAGGCGAGGC CATCACCATG 
CAGGAAATCT ACAGCTTCGA GCAGACCGGA GTGGACGACA AGGGCAAGGT TCAGGGGCAC 
TTCCGCAGCG GCGGCATCAG GCCGAACTTC GCCCCGCGCC TAGCGGCCAT GGGCATCCAT 
CTCGGCGGCA GCCTCTTCGA CGTCTGA

Protein sequence

MRLAERLMRA TRRQQETDDV PAAPVHARRA TDRIAMPDTL RGDTGTHGPE NAPSSHLDVT 
TASAGQPDTH SQTGMPYDVA VDGLHVRPPQ DGPASGLFQT TSDQPPTIAD GENDENPILP 
PAATTAAPRR PVVAPSSSRR TDDATVSPAA AETQATAPAQ AEQPLRAARS TPRAAEQVVD 
VSKLTLHGDH YYEIKEHLLD RLLELLDLAA VESLPPERLG DEIGRLVERL MRDEFRQAPL 
NASERRQITG DIRDEILGLG PLEPLLHDPT VNDILVNNYR QIYVERRGKL IKVNTRFQDD 
DHLRKIIDRI VSRIGRRVDE SSPMVDARLA DGSRVNAIIP PLALDGPSLS IRRFSKDPLE 
LHDLIGFGAL TPEMGEVLQG IVKARLNIIV SGGTGSGKTT MLNCLSRFVP HDERIVTIED 
AAELQLKQEH VVRLETRPAN IEGHGEVTAR DLVKNCLRMR PDRIIVGEVR SGEVLDMLQA 
MNTGHDGSLT TIHANTPRDC LMRLETMVAM AGLNISTLSL KRYISSAVDV IIQVSRLSDG 
SRKLTSLMEL TGMEGEAITM QEIYSFEQTG VDDKGKVQGH FRSGGIRPNF APRLAAMGIH 
LGGSLFDV