Gene Dole_1804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1804
Symbol
ID	5694644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2185013
End bp	2186260
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	50%
IMG OID	641264402
Product	glycosyl transferase group 1
Protein accession	YP_001529685
Protein GI	158521815
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAC TTCTGGTTAA TAAATTTCTC TTTGCCAAAG GTGGCGATGC CATCAGCACC 
CTGGACACAG GCCGGATTCT TGAGGCCCAT GGGCATGAGG TGGTTTTCTG GGGCATGGAT 
CATCCGGACA ACCCGCCCTG GCCTTTTGCA GACCTTTTTG TTTCTCATGT GAATTATGAA 
AACGCGGGTG GCCCTGGTGG TAAAGCCAGA ACCGCCATGA ACATTCTGTA CTCATTTGAG 
GCCAGAGAAA AAATGGCGGC CCTGCTGGAA AAAACAAAGC CGGACCTGGT GCACTTGAAC 
AACTTCGCAC ACCAGCTAGG CCCCAGTGTT CTGGATGTAA TCAAGAAACA CGGCATTCCC 
ACTGTGATGA CCATGCACGA CTACAAGATG GTCTGCCCTG TTTACACTAT GCTTTGCAAT 
GGTCGGGTTT GCGAAAAATG CAAAAATGGC CGGTTTTACC ATTGCGGGCT CAACCGCTGC 
ACCAAGGGCA GCTTGTTTAA AAGCATGGTG AACGTGGCGG AGATGTACCT TCACCACCGG 
ATGCTGCATA TTTATGACAA AATCGATCTT TATATCTCGC CCAGCCGGTT TCTAAAAAAC 
AAAGTGGAAG AAATGGGCCT GAAAGGCGAG GTGGCCTATC TTCCCAACTG CGTGGATGTG 
TCCGGTTTTG TGCCCTGCTT TGAGTGGCGG GAAAAAAGCA TTGTTTATGT GGGGCGGCTT 
TCCCATGAAA AGGGCGTGGA AACCCTGATT GATGCGGTTA AAAACATTCA TGGCGTACGA 
CTGAAAATCA TCGGTGACGG GCCGCTGAAA GCAAACCTGG AAGAAAAGGT TAAAAACGAA 
AACATCGGCA ACGTGGTTTT TCTCGGATAC CGAACCGGTC AGAATTTGCA CAATGAAATT 
CGGAACTCAA TGTTCCTGGC CATCCCTTCG GAGTGGTATG AAAATAGCCC ACGGGTCGTG 
ATCGAAGCGT TTGCCCTGGG CAAGCCTGTG GTGGGCGCCA GGATCGGGGG GATTCCAGAG 
CTGGTGCAGG ACTGGGAAAC CGGGTTGACG TTCACTTCCG GGGATGTGGA TGATTTGCGG 
AAAAAAATAA ATTTAATGCT GAACAGCAAT ACCAGGATTT CCCAATTGGG GAAGAATGGA 
CGGGCTTTCG TAGTGCAACA GGCTGAGCCG ACGGTTTACT ACCGGCGACT GCTGGAGTGC 
TATGGCCGTG CCCGTCAATT GAATCACAAC GATACCGTCA GACGCTAA

Protein sequence

MKVLLVNKFL FAKGGDAIST LDTGRILEAH GHEVVFWGMD HPDNPPWPFA DLFVSHVNYE 
NAGGPGGKAR TAMNILYSFE AREKMAALLE KTKPDLVHLN NFAHQLGPSV LDVIKKHGIP 
TVMTMHDYKM VCPVYTMLCN GRVCEKCKNG RFYHCGLNRC TKGSLFKSMV NVAEMYLHHR 
MLHIYDKIDL YISPSRFLKN KVEEMGLKGE VAYLPNCVDV SGFVPCFEWR EKSIVYVGRL 
SHEKGVETLI DAVKNIHGVR LKIIGDGPLK ANLEEKVKNE NIGNVVFLGY RTGQNLHNEI 
RNSMFLAIPS EWYENSPRVV IEAFALGKPV VGARIGGIPE LVQDWETGLT FTSGDVDDLR 
KKINLMLNSN TRISQLGKNG RAFVVQQAEP TVYYRRLLEC YGRARQLNHN DTVRR