Gene Dole_1302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1302
Symbol
ID	5694137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1554040
End bp	1555107
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	59%
IMG OID	641263896
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_001529185
Protein GI	158521315
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.454328
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCAT TCTCAGACAG ACGTGTGCTG GTTACCGGGT GTTGCGGTAC TGTGGGCAGC 
GAGCTGGTCC GCCAGCTGCT GGAGGTCTAC GGCGTTGGCG AACTGGTTGG CATTGACAAC 
AACGAAAGTG AGCTTTTTTT TGCCCAGCAG CGGTTTGCCG GCCGGCCGGC CCGGTTCTTT 
CTGGCCGATG TTCGGGACGA GGCCCGGCTG AAGCGGCTTT TCTCCGGCAT CGACATCGTG 
TTTCACACAG CGGCGTTTAA ACACGTGGAG CTGTGCGAGG TATCGCCCTT TGAGGCGGTG 
CAGACCAATA TTCACGGGGT TCAGAACGTG GTGTGGGCCG CTGTTGAAAA CAGGGTCCGA 
ACGGTGGTGT TCACCAGCTC CGACAAGGCG GTCAACCCCA CCAACGTGAT GGGCACCTCC 
AAGCTGATGG GCGAGCGGCT CATGACAGCG GCCAACAGCA ACCTGCGGTC CGGCAAAACC 
GTGTTTGCCG CCACCCGGTT CGGCAATGTG CTGGGCTCCC GGGGTTCGGT GATTCCCATC 
TTTCGCGAAC AGATTCGAAA AGGCGGGCCC GTGACCCTCA CCGATCCGGA CATGACCCGG 
TTTATCATGA GCATTCGCCA GGCCGTGCAA CTGGTCATTG ATTCCGCGGA TATCGCCAGG 
GGCGGGGAGG TGTTTGTCAC CAAGATGCCG GTGATCCGCA TTGAAGACCT GGCCCGGGTG 
ATGATTGACG ATCTGGCCCC CCGGTACGGA CATGATCCGG CAGCGGTCAC GACAGAGGTG 
ATCGGCACCA AGGCCGGCGA AAAACTCTAC GAAGAGTTGA TGACCGACGA GGAGACCCGC 
CGGAGTCTGG AGCTGGCCCG CTATTTTGTG GTGCGGCCTG CGTTCCTTTC TCTTTACCGG 
GAAATTGATT ACACCTATGC GGATATGATC AGCGACAGGG TGGACCGGCC TTACCACTCC 
GCCAACGAGA CACCGTTGAC CCAGGCCGAG CTTAGGGCTT TTCTGTATGA GAACAACCTC 
ATCGAAGGCG AAGCGGCCGA ACCGTTTCAA CCGGCAAAAC GGTTTTAA

Protein sequence

MNAFSDRRVL VTGCCGTVGS ELVRQLLEVY GVGELVGIDN NESELFFAQQ RFAGRPARFF 
LADVRDEARL KRLFSGIDIV FHTAAFKHVE LCEVSPFEAV QTNIHGVQNV VWAAVENRVR 
TVVFTSSDKA VNPTNVMGTS KLMGERLMTA ANSNLRSGKT VFAATRFGNV LGSRGSVIPI 
FREQIRKGGP VTLTDPDMTR FIMSIRQAVQ LVIDSADIAR GGEVFVTKMP VIRIEDLARV 
MIDDLAPRYG HDPAAVTTEV IGTKAGEKLY EELMTDEETR RSLELARYFV VRPAFLSLYR 
EIDYTYADMI SDRVDRPYHS ANETPLTQAE LRAFLYENNL IEGEAAEPFQ PAKRF