Gene DvMF_1952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_1952
Symbol
ID	7173870
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	2412960
End bp	2414591
Gene Length	1632 bp
Protein Length	543 aa
Translation table	11
GC content	68%
IMG OID	643540468
Product	glycosyl transferase family 2
Protein accession	YP_002436363
Protein GI	218887042
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	105
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTACC GCTACCTCGC CCCCGGCCTT CAGACGGAAC TGGAAGCCCT CACCGTCGAT 
GACGCCATCG ACCACCTGCG CAACCATCTT GGCAACTTCC TGCTCGATGC ATCGGTGTGC 
GTCAGCTACC TGAACCGGCT GGCCGCAGAA TCCGGCGGAC CTGATTCGCC TCGCCATGTG 
ACCTGGCTGC GCTGGCTGGT CCGCGCCCTT GCCCGGCTGC GGCCATTCGA CGAGCAGGCC 
GTAACCCTGG CCGCCCGGGT GAACGGCACA CCGGAAGACA CCCCCCTGAT CCGGGCCATG 
GCCAAGGTGC GCACCCCGGA GGCCCTGCAC CACCGGGTGG AACAGACCGC CAACCAGGCC 
CCGGCTGAAG CACGCGACGT GTTGTTGCGG CTGTTCCGCG AAATGCCGTT TTGCGTGGAC 
ATGGCCGAGC GGCTGCTGTT CCTGGACCTG CAACTGGGAC TTGTGCCCGG AGGCGGCTGG 
TACGAAGGGC TGCGCTGCCC GCCCCTGCTG CGCGACATGC TGGACCGGGA GCGTTTTCGG 
GCGTGCATGC TGTGCGGCAA CGACGCCATG GCCCTGGAAT TGCTTGACCA CACGCGCACA 
GCCGGAACAC ACGACCCCGG CTGGCTGAAC TGCGCGGCGG AACTGGCCGT GCGCACCGGC 
GACCGCGCGA CGGGCATGGA CTTCTACCGG GCGTCACTGG GTCTGGACCC CATGCAGGTA 
CCCGTGGCCC TGCGCCTGCA CGAACTGGAG CAGCCCTTCG CCACCCCGCC GGACGCCCTT 
GCCCCTGCGC ACGGCCCCGT GGCCGTCTTT CTGTACTCCT GGAACAAACG CGACCTGCTG 
GAGCAGACCC TGCGCTCGCT GGCGGCGTCG GACACGGGCG GTGCCTCCGT CACCCTGCTG 
CTGAACGGCT GCACCGACGG CTCTCCCGAA ATGGCGGCGG GGCTGAACGC CAGTCTGTTC 
GGCGGGCGCA TGGATATCAT CGAACTGCCC GTCAACGTGG GCGCCCCGGC GGCGCGCAAC 
TGGCTGCTGC ACACCCCGCG CGGTCGCGAA GCGGCCTTCG TGGCCTTTCT GGACGACGAC 
GTGGAGGTGC CCGCCGACTG GCTGTCCACG CTGATTTCCG TACTGCGGGC CAATCCGCGC 
GCCGGGGTGG TGGGTGCCAA GACGGTCTTT CCCGGTTCCC CCCGCCGGTT GCAGTACCTG 
TACCGCAACG TTTCCGTGGC CCAGCCGGGG CTGCTGCGCG TCAGCCTGGG CACGCCCAGC 
TTCAACTACG ATGGCGGAAC CTACGACGTC ATCCGGCCCA CGGCCAGCGT CATGGGCTGC 
TGCCACGTGT TCACCCGCAC CGCGCTGGAC GCGGTGCGCG ACTTCGACAT CCGCTTCTCG 
CCCTCGCAGA TGGACGACAT CGCCCACGAC CTGGATCTGT GCCTGCACGG CTTCGAGGTG 
GTGTACTGCG GCCTTGTCTC CTGCGTACAC CATCAGATGT CTGGAGTGGG CATCGGCAAC 
GTGCATGCCG CCCGCATGGG TAACGTGCTG GGCAACGACG TGAAGTTCTA CTACCGCTTC 
GCCGAACATC TGGACGCGTT ACGCAGGCTT ACCGCACGCC ACGCGGTGCC CCAGATGCCG 
CCGGATGCAT AG

Protein sequence

MHYRYLAPGL QTELEALTVD DAIDHLRNHL GNFLLDASVC VSYLNRLAAE SGGPDSPRHV 
TWLRWLVRAL ARLRPFDEQA VTLAARVNGT PEDTPLIRAM AKVRTPEALH HRVEQTANQA 
PAEARDVLLR LFREMPFCVD MAERLLFLDL QLGLVPGGGW YEGLRCPPLL RDMLDRERFR 
ACMLCGNDAM ALELLDHTRT AGTHDPGWLN CAAELAVRTG DRATGMDFYR ASLGLDPMQV 
PVALRLHELE QPFATPPDAL APAHGPVAVF LYSWNKRDLL EQTLRSLAAS DTGGASVTLL 
LNGCTDGSPE MAAGLNASLF GGRMDIIELP VNVGAPAARN WLLHTPRGRE AAFVAFLDDD 
VEVPADWLST LISVLRANPR AGVVGAKTVF PGSPRRLQYL YRNVSVAQPG LLRVSLGTPS 
FNYDGGTYDV IRPTASVMGC CHVFTRTALD AVRDFDIRFS PSQMDDIAHD LDLCLHGFEV 
VYCGLVSCVH HQMSGVGIGN VHAARMGNVL GNDVKFYYRF AEHLDALRRL TARHAVPQMP 
PDA