Gene Dole_0524 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0524
Symbol
ID	5693346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	590753
End bp	591793
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	56%
IMG OID	641263108
Product	glycosyl transferase family protein
Protein accession	YP_001528411
Protein GI	158520541
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGGCC CAATGGATGA AGTCTTCCAT CAGGACATCG TCTGCTCGGT CTGTATCGCC 
AACTATAACG GCGCCAACGT GCTTGCGGCA TGCCTGGATT CTGTTTTTCA ACAGGCATTT 
CCTTATCCGT TTGAGGTGAT CGTGCATGAT GACGCATCCA CAGACGGATC GGCCGGCATT 
GTTGCGGAAA AATATCCGAC GGTGCGACTG CTTCAAAGCC GGACCAACGT GGGTTTTTGT 
GTCAGCAACA ACCGCATGGC GGCTGTTGCA AGGGGCCGGT TTATCCTGCT GCTGAACAAT 
GATGCCGAGT TGCACCGGGA CGCCTTTGCC ACGCTTTATG ATGTTGCGGT CAGGCAAAAC 
GTGTATGGCA TTCTCGGCCT CCCCCAATAC AGCATGGCGA CCGGTGAACT GATCGACCGG 
GGCAGTCTGC TGGACATTTT CTGTAACCCG GTTCCCAACC TGAACCCGTC CCGGCGCGAC 
GTGGGCATGG TGATCGGCGC CTGTCTCTGG CTGCCCCGGC ACCTCTGGCA GGAGCTGGGC 
GGTTTTCCGG AATGGTTTGA GAGCCTTGCC GAAGACATGT ACCTCTGCTG TTACGCCCGG 
GTCAAGGGAT ATCCGGTCAT CGCCCTTGCG GCGTCCGGGT TCAATCATTG GGTCGGCGAG 
AGTTTTGGCG GCGGCAAAGT GGTCGGTCGC ACTTTGCAGA CCACCTATCG CAGGCGCACC 
CGGAGCGAGC GCAACAAAAC GTATGTCATG CTGCTGTGCT ATCCCGCCCC CCTTGCCCAG 
GTGTTGGTTC CGCTTCATTT GTTGCTGCTG GCGGTAGAGG GACTGCTGCT TTCAGCCTTC 
AAAAAAGACG CCCGCATCTG GAAAGAAATT TATTGGCCCT GTTTATTGGC CCTCTGGCGT 
CGCCGCCACA TGCTGATGCG CCTGAGGTGC GAGATACAGG CAACACGGCG AGCCTCCTTA 
AAGGCTTTTT ATTCGACGCA CACCTTCTGG CCTCATAAAC TGACCATGCT GATCAAATAT 
GGTCTGCCGA TATTGAAATA A

Protein sequence

MSGPMDEVFH QDIVCSVCIA NYNGANVLAA CLDSVFQQAF PYPFEVIVHD DASTDGSAGI 
VAEKYPTVRL LQSRTNVGFC VSNNRMAAVA RGRFILLLNN DAELHRDAFA TLYDVAVRQN 
VYGILGLPQY SMATGELIDR GSLLDIFCNP VPNLNPSRRD VGMVIGACLW LPRHLWQELG 
GFPEWFESLA EDMYLCCYAR VKGYPVIALA ASGFNHWVGE SFGGGKVVGR TLQTTYRRRT 
RSERNKTYVM LLCYPAPLAQ VLVPLHLLLL AVEGLLLSAF KKDARIWKEI YWPCLLALWR 
RRHMLMRLRC EIQATRRASL KAFYSTHTFW PHKLTMLIKY GLPILK