Gene Dvul_0195 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_0195
Symbol
ID	4662509
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	238542
End bp	239702
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	67%
IMG OID	639818391
Product	glycosyl transferase, group 1
Protein accession	YP_965646
Protein GI	120601246
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCCCC CGGTCGTCTG CTTCTGCAAC ACCAACCCCG GCTGGGGCGG CGGCGAGAAA 
TGGCACCTTG AGGCGGCCAT CGCCCTTGCC CATCGTGGAC GGCGTGTGCT GCTCATGGCC 
CACCCGGCAG GACGCCTCCA TGCCGAGGCG TCACGACTGG CAGCCACCCT CCCCGCCCAT 
CTGCCCGGAC TGCGCGTCCT TCCGTTGCAG GTCGGCAGGC TCACGTTCCT CAATCCGGGC 
GCCATCGTCC GTATCGCGCA TGTCCTGCAC AGGGAGAAGG TCGACAGCCT CGTGCTGGGC 
CTGACCTCCG ACCTCAAGGC CGTGGGCCCT GCCGCGCGCC TCGCCGGAGT GCGTCAGGTG 
TTCTATCGCC GGGGCAGCGC GCTGCCCATA CGCAACACGG CCTTCAACCG TCTGCTCTAT 
GGGCGCGTCA TCAATGGACT CATCGTCAAC TCGCAAGAGA CCCGCCGGCT GGCGCTGGTG 
AACAATGCGG GACTCATCCC CGAAGAGCGC ATCCACCTGC TTCACAACGG CATCGACGCC 
ACGGGGTTCG ACGCCGCGCT CAAGAAGGCC AGCCCCGCCT ACAGGGCCGG CGGACATACG 
CTGGTCATCG GCAATGCGGG GCGCCTCAAC AGGCAGAAGG GGCAGCACCA CCTGCTGCAC 
ATGGCGCGTC TTCTGGCTGA CGAGGGGCTG GACTTCAGGC TTGTCATCGC GGGAGAGGGC 
GAACGGAGAC AGGAGCTTGA GACGCTGGCG CGAACGCTTG GCGTTTCGGG GCATGTGGTC 
TTTGCGGGGT TTCTCGCCGA CCTTGCGCCT TTCTGGAAGA GTCTGGACGT CTTCGTGCTC 
AGTTCGCACT GGGAGGGCTT CGGCTATGTG CTTGCGGAGG CCATGCTGGC AGAAGTGCCC 
GTGGTGTCCT TCGACGTGAG CAACATCCCC GAACTCGTGC AGGATGGCAC CAACGGCCTG 
CTGGTGCCCG GCCCGGACGC GGCACCGGAA GGCGACGCCG CCCCCGCAGC GGGGCTTGCC 
CGCGCCGTCA TGACCATGGC TGCGTCGCAG GACCTGCGTT GTCGCATGGG AGCGGCGGGC 
AGGGCGCACG CCCTCGCCAA ATATGCGCAA GAGTCCTGCA TGGACGCACT GGAGAGCATC 
CTCGGTAGCG CACCCCGGTA G

Protein sequence

MTPPVVCFCN TNPGWGGGEK WHLEAAIALA HRGRRVLLMA HPAGRLHAEA SRLAATLPAH 
LPGLRVLPLQ VGRLTFLNPG AIVRIAHVLH REKVDSLVLG LTSDLKAVGP AARLAGVRQV 
FYRRGSALPI RNTAFNRLLY GRVINGLIVN SQETRRLALV NNAGLIPEER IHLLHNGIDA 
TGFDAALKKA SPAYRAGGHT LVIGNAGRLN RQKGQHHLLH MARLLADEGL DFRLVIAGEG 
ERRQELETLA RTLGVSGHVV FAGFLADLAP FWKSLDVFVL SSHWEGFGYV LAEAMLAEVP 
VVSFDVSNIP ELVQDGTNGL LVPGPDAAPE GDAAPAAGLA RAVMTMAASQ DLRCRMGAAG 
RAHALAKYAQ ESCMDALESI LGSAPR