Gene Dole_2837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2837
Symbol
ID	5695695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3419170
End bp	3420339
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	59%
IMG OID	641265452
Product	lipid-A-disaccharide synthase
Protein accession	YP_001530717
Protein GI	158522847
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0763] Lipid A disaccharide synthetase
TIGRFAM ID	[TIGR00215] lipid-A-disaccharide synthase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGATAAGC ATGCTTTGCC GAACAGGGTG CCAGTGGGCC GGTGCGTGAT GATCATTGCC 
GGCGAGGCCT CCGGCGACCT GCACGGCGCC AACCTGATCC GAAACATGCG CGAACAGATT 
AAGGACCCTC TTTTTTTCTG CGGCATTGGA GGGGCGGCCA TGCGCCGGGC CGGCGCCAAG 
ATTCTGGTGG AGGCGGAGCG GCTTTCGGTG GTGGGAATCA CCGAGGTGAT TGCCCGCATG 
CCGGATATCC TAAGCGGCAT GAAAACGGCC AAAAGGATGC TGGCCTCCCG CATTCCCGAT 
CTGCTGGTGC TTATCGATTT TCCCGATTTT AACCTGAGAA TGGCCGCAAC GGCCAAAAAG 
CACGGCATTC CCGTTTTTTA CTATATTTCT CCCCAGGTAT GGGCCTGGCG AAAAGGCAGG 
GTGCGCACCA TTCGAAAACG GGTGGATCAC ACGGCGGTGA TTCTTCCCTT TGAGGCCGAT 
TTTTTTAAGG CCCACGATGT CCCCGTGACC TTTGTGGGCC ATCCCCTGCT GGACGCCGGA 
TACGGTCCGG CGCCGTTATA CGAGAGAACA GAAGGGCGGA CAGTGGTGGG CCTGCTGCCC 
GGTTCCAGGG GCAGCGAGGT GGCACGACAC CTGCCTGTAA TGATGGAAGC CGGGGCCCGG 
ATCAGCCGTC GCCATCCCCA TGTCACTTTC ATGGTCTCCT GCGCGCACTC GATTCCGGTG 
GAAAGCATGG CTTCAATCAC GGAAAAGTAT ATCGGCACCG TTCCTTTTAC CATTGTTCCC 
GGTGACGTGA CCCAGGTGTT GAAGAGGAGC ACCTGCGTTG TGGCGGTGTC CGGCACCGTG 
TCCCTTGAAA CGGCCCTGTA CGGCGTTCCC ATGGTGGTGA TTTACAAGGT GTCGTTTCTC 
AGTTACTGGC TGGCAAAGGC ATTGATCCGG CTGGAGCACA TCAGCCTGGT GAACCTGATC 
GCCGGAAAAG CGGTTGTGCC GGAGCTGATT CAGAAAGATG CGTCGGCGGA GCATATTGCC 
GCGCGCATCA TGTCGATGAT TTCTGATCCC CAGGAACTGG AGACCGTTCG AAAGGAGCTT 
GCCGAAGTTC GGAAGCGCCT GGGCGGTCCC GGGGCATCTG CCCGGGCCGC CGGAATCGCG 
GCCCGGCTGC TGAATGAAGG GGTAACCTGA

Protein sequence

MDKHALPNRV PVGRCVMIIA GEASGDLHGA NLIRNMREQI KDPLFFCGIG GAAMRRAGAK 
ILVEAERLSV VGITEVIARM PDILSGMKTA KRMLASRIPD LLVLIDFPDF NLRMAATAKK 
HGIPVFYYIS PQVWAWRKGR VRTIRKRVDH TAVILPFEAD FFKAHDVPVT FVGHPLLDAG 
YGPAPLYERT EGRTVVGLLP GSRGSEVARH LPVMMEAGAR ISRRHPHVTF MVSCAHSIPV 
ESMASITEKY IGTVPFTIVP GDVTQVLKRS TCVVAVSGTV SLETALYGVP MVVIYKVSFL 
SYWLAKALIR LEHISLVNLI AGKAVVPELI QKDASAEHIA ARIMSMISDP QELETVRKEL 
AEVRKRLGGP GASARAAGIA ARLLNEGVT