Gene Dvul_3065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_3065
Symbol
ID	4662001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008741
Strand	-
Start bp	149855
End bp	150901
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	71%
IMG OID	639813985
Product	hypothetical protein
Protein accession	YP_961264
Protein GI	120586919
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID	[TIGR03019] FemAB-related protein, PEP-CTERM system-associated

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0204721
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGACA TGGAGGTCAG GGGCGTCGAC CCCAACGCCC CGCAAGAGGC GGCCCTGTGG 
GACGCCTACG TGGCGGCCCA TGCGGAGTCC ACGGGCTATC ACCGCATGGG CTGGACGCGG 
GTGGCGCAAC GGGCCTTCGG GCACGCGGCG TATCCCCTCG CGGCCTTCGA CGGCGGACGC 
ATCGCCGGGG TGCTGCCCCT CGTCCACATC CGCAGTCGCC TCTTCGGGCG CTTTCTCGTC 
TCGCTGCCCT TCGTCAACTA CGGCGGGCTG CTGGCGGACT CCGCCGAGGC GGCGCAGGCG 
CTCATCGACG AGGCCGAGGG GCTGCTGCGG CGCACCGGGG CGGGCAGCAT CGAACTGCGG 
CACGTGGGGC CGCCGCGCCT CGGGCTTTCC GCCAAGTCGC ACAAGGTGAC CATGCTCCTC 
GACCTGCCGG ACGACCCCGA CACCCTGTGG CGCGGCCTGC GCGACAAGGT GCGCAATCAG 
GTGCGCAAGG CGGGCAAGTC GGGCCTCACC GTGGAACAGG GCGGCGCGGG GCTGCTTGGG 
CCGTTCTACG ACGTGTTCGC CGTCAACATG CGCGACCTCG GCACGCCGGT GTACTCGCGG 
CGCTTCTTCG AGACCATCAT GGACGAATTC CCCGGCGCCA CGCGCATCGT CGCCGTGCGC 
GACGGAGACG CCGTGGTGGC GGCAGCCCTC TGCTACACGC ACGGCAACAC CTTCGAGGTG 
CCGTGGGCCT CGTCGCTGCG CACCCACCGT GACCGCTGCC CCAACAACCT CATGTACTGG 
CACTGCATGG AGACGGCGTG CCGTGAAGGG TTCACCGTGT TCGACTTCGG GCGTTCGTCG 
CGCGACAGCG GCCCGTGGCG CTTCAAGGCG CAGTGGGGCG CGCGCGAGGT GCCCCTCAGC 
TGGGAGTACC TGCTGGCCGA CGGCGCACCC CTGCCCGACC TCAACCCGTC CAGCGCCCGC 
TTCAGCCTCG CCGTGCGGGT GTGGCGGCAT CTGCCCGTGG CCCTCACGCG GTTCATCGGC 
CCGCACATCG TCAGGAGCAT CCCATGA

Protein sequence

MSDMEVRGVD PNAPQEAALW DAYVAAHAES TGYHRMGWTR VAQRAFGHAA YPLAAFDGGR 
IAGVLPLVHI RSRLFGRFLV SLPFVNYGGL LADSAEAAQA LIDEAEGLLR RTGAGSIELR 
HVGPPRLGLS AKSHKVTMLL DLPDDPDTLW RGLRDKVRNQ VRKAGKSGLT VEQGGAGLLG 
PFYDVFAVNM RDLGTPVYSR RFFETIMDEF PGATRIVAVR DGDAVVAAAL CYTHGNTFEV 
PWASSLRTHR DRCPNNLMYW HCMETACREG FTVFDFGRSS RDSGPWRFKA QWGAREVPLS 
WEYLLADGAP LPDLNPSSAR FSLAVRVWRH LPVALTRFIG PHIVRSIP