Gene Dole_1808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1808
Symbol
ID	5694648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2189446
End bp	2190567
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	53%
IMG OID	641264406
Product	glycosyl transferase group 1
Protein accession	YP_001529689
Protein GI	158521819
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGATG GCAGAATAAA AATTTTTGTA ACAGGCACAC GCGGAATTCC GGACATATCG 
GGGGGTGTTG AAAAACATTG CCAGGAGCTG TATCCCCTGA TTGCCGCGCA GGGCCACGAT 
GTGTTTGTGG CCACGCGCAA AAGCTATGTG AACGATCCCG GCGTTACGGC GTGGGGCGGG 
GTTTGGCTGA TACATCTCTA TGCGCCCCGC AAAAAGAGCC TGGAAGCGGC TGTGCATACC 
TTTCTGGCGG TTTTAAAGGC GCGGCAGGTA AATCCGGATA TTCTGCATGT GCATGCCGTG 
GGGCCTTGCC TGATGGTGCC CTTGGCCCGC CTGCTTGGCA TGCGGGTGGT GATGACCCAC 
CACGGCCCGG ATTATGAACG GCAGAAATGG AATAAACCGG CTAAGTTGGT GTTGCGCCTG 
GGGGAATGGC TGGGCGGGTG TTTTGCAAAT GAAGTGATTG TCATATCCCG AATCATTGAA 
ACCCTTGTTC AAAAAAAATG CCGCCGGCCC TGCCATGTGA TTTACAACGG TGTTCGGCTG 
CCGGAAAAAA CGGAAAAGAC CGATTACCTT GAAACCATCG GCGTTTCGCC GGGGCGCTAT 
ATTCTTGCTG TGGCCCGGTT TGTGCCGGAA AAAGGATTGG ACCTGCTGGT AAAGGCGTTT 
AAAGAGATTA GGGGAGATTT CAAGCTGGTG ATTGCCGGAG ACGCCGACCA TGAAACCACC 
TACAGCCGGA ACCTGAAAGA AGAGATGGCC GGGGATGACC GGATTGTGAG CACCGGCTAC 
ATTACCGGGG AAGCGTTAAA CCAGGTCTAT TCCCACGCCG GGCTGTTTGT GTTGCCATCG 
TTTCATGAAG GGCTGCCCAT TGCCCTGCTG GAGGCCATGA GTTACGGCCT GCCGGTGCTG 
GTATCGGATA TTCCGGCCAA CCGTGAGGTG GACCTGCCTG AGGAACGATT TTTTCGGTGT 
GGGGATGCGC CGGACCTGAA AAAAAAGATC GAAGCCCTTT GGGATAAAGA TCTGACGGTT 
GATGAAAAGA ATCATTTCAG AAACCTGCTT GCGAAACAAT ACAACTGGGA TAAAATTGCC 
AGGCAGACGA TTGAAGTGTA TGAAAGAGTT CTAAGCGGAT AG

Protein sequence

MIDGRIKIFV TGTRGIPDIS GGVEKHCQEL YPLIAAQGHD VFVATRKSYV NDPGVTAWGG 
VWLIHLYAPR KKSLEAAVHT FLAVLKARQV NPDILHVHAV GPCLMVPLAR LLGMRVVMTH 
HGPDYERQKW NKPAKLVLRL GEWLGGCFAN EVIVISRIIE TLVQKKCRRP CHVIYNGVRL 
PEKTEKTDYL ETIGVSPGRY ILAVARFVPE KGLDLLVKAF KEIRGDFKLV IAGDADHETT 
YSRNLKEEMA GDDRIVSTGY ITGEALNQVY SHAGLFVLPS FHEGLPIALL EAMSYGLPVL 
VSDIPANREV DLPEERFFRC GDAPDLKKKI EALWDKDLTV DEKNHFRNLL AKQYNWDKIA 
RQTIEVYERV LSG