Gene Dole_1440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1440
Symbol
ID	5694277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1715201
End bp	1716652
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	55%
IMG OID	641264035
Product	glycosyl transferase family protein
Protein accession	YP_001529321
Protein GI	158521451
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTGACC GGTTTCCGGT TTTTATCGGT CTCTACTTTA TCGCCCACTT GGTGCTGAGG 
GTGTGGAGCA ACAACACCCT GACCATCGAC GAATCGGAGC AAATGCTGCT TTCCCAGTGT 
TTCAGCCTGG GTTACAACGC GCAACCGCCT TTGTACACAT GGATTCAAAT CTTTTTTTTC 
AACATCTTCG GCCCGACTGT TTTCAGCATC GCCCTGCTGC GCCATCTCTT CCTGTTCCTG 
CTTTACCTGT TTGTCTATTT AAGCGCAAAG GAGATCACGC GGGACAAAAC CATGTCCGCG 
CTCTGCTCGG TTTCCATGGT CCTGCTGCAT CCCATCGGGT GGGCGGCCCA GGTGGACCAG 
ATCCACTCGG TGGCCGTGAC CACGGCGGCG GCGGCCACTC TTTACGGGTT TCTGAGGATC 
ACCCGAAACG GGCAGGTGAC AGACTACCTG CTGCTGGGCA TCGCCGTTGG ATGCGGGGTC 
CTGTTCAAGT ACAATTTTGT GCTGCTGGCG GCGGCCATGC TGATTGTCGG CGCTCTTTCC 
CCGGAGTTAC GGAAGCACCT GCTCACTCCG AAGCTGCTGC TCACGGTGGT CTTGGCCCTG 
GTCCTGGTGA TGCCTCATAC ACTCTGGTTT TTTACTCACA TGGACCTGGC CACCGGTGAG 
ACGCTTCACC GAATGCGGGT GGACCCGGAT GGGCACGAGC AGTTATGGAT CACCATGTAC 
GGCGTGTTTG AATTTGTTGT TGCTGTCATC TCTTTTACCT CCCCGTTCTG GATCATCTTT 
TTTATGATGT TCGGCAGGCA CCTGCAGCCC GGTTCCCATC CCCAAACGCG GTGGCTGAGC 
CATATCATGA TGACGATCCT GATCATGGTG CTGGTGATCG TCATCGGCAG CGAGACCACC 
AATGTAAAGG ACCGGTGGCT TCAGCCCTAT CTTTTTTTCT TTCCCCTGTG GGCGTTTCTG 
TACGTGAATC CGGATGCCCT TCGACGAAGA GCCCCTGCCA TGGCCGGATT GGTGGCCGTT 
GTCATGCTGG TAATCTTTAT CATTATTCCG CTGCGCCTGG TAACCACCGA CCTCACTCAA 
GACCCCCGAC GGGAAAACTA TCCGTTTGAC GCCCTGGCCG CAGAGATAAA AAGTCATGGG 
TTCCAGACCG GCGCCATCGT GGCCCAGGAC ATGTTTATCG GCGGCAACCT GCGGCTGTTT 
TTTCCTGAGA CAACGGTTTC CACGCCCCAG TTCTCACTGC CGGCGGATAC TGGCAAGACC 
CGGCCGGTAC TCTACATATG GCATGGCCCA AAACTGATAA CAAAAAAAGA GTTTCGAACC 
GCGGGAAAAG ATATGATGTG TGTGGACCAC ACCGCATCCC TACCGTACAA ACATTCCAAA 
ACCATGGCCT ACACCCCGTT TTACCGGATA TGCCGGGCAG CGCCAGAAAC CCCATCGACC 
GACAGCCCAT GA

Protein sequence

MLDRFPVFIG LYFIAHLVLR VWSNNTLTID ESEQMLLSQC FSLGYNAQPP LYTWIQIFFF 
NIFGPTVFSI ALLRHLFLFL LYLFVYLSAK EITRDKTMSA LCSVSMVLLH PIGWAAQVDQ 
IHSVAVTTAA AATLYGFLRI TRNGQVTDYL LLGIAVGCGV LFKYNFVLLA AAMLIVGALS 
PELRKHLLTP KLLLTVVLAL VLVMPHTLWF FTHMDLATGE TLHRMRVDPD GHEQLWITMY 
GVFEFVVAVI SFTSPFWIIF FMMFGRHLQP GSHPQTRWLS HIMMTILIMV LVIVIGSETT 
NVKDRWLQPY LFFFPLWAFL YVNPDALRRR APAMAGLVAV VMLVIFIIIP LRLVTTDLTQ 
DPRRENYPFD ALAAEIKSHG FQTGAIVAQD MFIGGNLRLF FPETTVSTPQ FSLPADTGKT 
RPVLYIWHGP KLITKKEFRT AGKDMMCVDH TASLPYKHSK TMAYTPFYRI CRAAPETPST 
DSP