Gene Dole_1838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1838
Symbol
ID	5694678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2222633
End bp	2224990
Gene Length	2358 bp
Protein Length	785 aa
Translation table	11
GC content	55%
IMG OID	641264436
Product	O-antigen polymerase
Protein accession	YP_001529719
Protein GI	158521849
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTCAA TAAGTCGATT TTTATATCTG GCAACCCTGG TCTTTGCGCC CCTGGCGTTC 
GGCAGCGTGG AGTCCTGGGC CTTCTTCTTC CTGACCCTGC TCACCGGTGC CGCCATCAGC 
TTTTACCTGC TTCACACCCG GCGCCATGCC GCCCCCATCT ACCGGGTACC CTGCATGTTA 
CCCCTTGCCC TGCTTGGGCT TTTCATCTTC TTGCAGATCA TCCCCCTGCC GCAGGCTGTC 
CTGTCCCTTT TGTCTCCCAA CGCCGCCCAG CTCCGCAACG AAACCATCGG CATTCTTCTA 
CCGGACCGTG CCTGGCCCCT TACACTGAAC CTTCACGCCA CCCTGTTTGA ACTCTGTCGC 
TGGCTGCTGT GGGTCGGTTT CTACTGGATT TCTGTTCAGC TCCTGTCGGA CAAAGCAATG 
TTGCGCCGCA CCCTGCTGTT TCTGGCCTTT TTTGCCGGCA TTTTTGCCTT TTCGTCCATC 
CTTCAGCACA TTTTCACAGA CAACCGTGCT TTATGGTTCC GCTATATATC CGTGCAGTCC 
TGCTCGATAT TTGGCTCCTA TATTAACCGC AACCACTACG CCGGCCTTAT GGCCATGCTT 
TTTGGTCCCA CCCTTGGCCT GTTGCTGGCG CTTCGCCCCC CCCGTCAGTT CGGCACCATG 
CGCGAAAAAA TCCTGGGCCT GTTTGAAGAA AAAGAGACCC CCCTGTTTAT TCTTCTTCTG 
CTTTCGGCAT CAATCATGGT GATGTCGGTT TTTATCAGTC TCTCCAGGGG CGGCATGACC 
AGCCTGTGCA TATCCAGCCT GTTTTTTATT CTGATGGCAT CCGGAAAAAA ATTTTCAGGA 
CGCCACACAA AAATGAAAAT CACCGCCGCA ATGCTGCTGT GCGCCGTTCT GATGGCCCTC 
ACCTGGGTCG GCTGGGAAAC AATTGACAAT CGCTTCAGCA CCATCTATGC GGCAGATGAT 
ATCATGCGCA TTGGCCGGCT CCGATACTGG GGCAGATGCC TGGCCGGCGG GCTGGATTTT 
TTGACCACCG GTGTTGGTTT TGGTGCCTTT GAAGTGGCCG GACCCATCTA CCAGACCTAC 
TATATGGGAG CCATCCTGGA CCATGCCCAC AACGACTACC TGGAGCTGCT TATAGAAGGC 
GGTATCCCCG GTGTTCTGCT GTTTCTTGTT TTTTTTCTCT GCCTTTTCCA GGTTGTGCAG 
AAAACCCTAA AAAAGAGAAA AGAGTCCTAT TCCATTCTGG TCTGTATCGG CGCCATTACC 
GGTATTGTAG CCATCCTGCT GCACAGCTTC ACAGACTTCA ACCTGCATAT TCCCGCCAAC 
GCCCTTTATC TTGCCTTTCT CTGCGGCCTG GCGGTTGCCG CGGCCCACAC CCGGCTGCGA 
AACCACATCA CCCCGCCCAC CTACCTGCCA CCCGCGCCAA ACAGGGCAGC CCTTGTCACG 
CCTTTTCTGT TTATCCTGCT CTGGCCGCCG CTTCTGGCGC TGTCTATGGG CCAATGGATG 
GCCGATCAAC ACATCCAGCC CTTTATAAAG GCCCCCCTGA ACAACACCAC TGCCCCGGCC 
CTGCTGGAAC AGGCTGCCGA AAGCGCCCGC CGTGCCACCG CCTTCTCACC ATGGAGCGCA 
ACCGCCCACA CACTTCTCGG AGACGCCGCC TTTTTCTCCG GCAACCCGGA ACAGGCACTG 
GACGCCTATC AGCAGGCCCT CTGTTTTACA CCCACCCGAT CAACACTGCT TCAAAAGGCC 
GGCCAGGCCG CCCGCAATGC CGGCCTGCCC CTTTCCCGGG CCGAGGCCCT TATGGCCGCC 
GGTGTAAAAA CCTATCCCAT GCGACCCGGC GCGCATGGCG CCCACGCCGG GTTCCTGTTT 
GAAACCGGCA ATAAGGAAAA GGCCATGTCC GTGGTTCGAA CTGGTATTAA AACCCATCCT 
TCCCTGGCGC GACAGTTTTT TACCCTGATG ACTTATGCCG GCCTCACCCC CGCGGAAATG 
TTTACAGCCC TGCCTGCAAA TTCTTATGTG CTGACCCAGT TTGCCGCCCA TATCCAAAAC 
ACCGATTACG ACTTTATGCG AAGAACCATT CTGACCGCCG CCGTGAATGC CGCCGACCAG 
GAAGCCGAGC CCTCGCCAAA GGCTTATATT AACCTGGCCC ATCTTTACCT GCGGGAAAAA 
AATCATGACC AGACCATTAC TGTTCTGGAA CGTGGTGTCA CCCGATTGCC GGATCACCCC 
TATCTGCTTT ACCTGCTGGC CCGGACTTAT GAAGAAAACC AGATAGTCTA CAAGGCCCTG 
GATCTGTATA AAAAGCTCCA GATTATTTCC CCCGGCTACC GCGACACCGA ACAACGTCTT 
AAAGCCATGA AACGGTAA

Protein sequence

MLSISRFLYL ATLVFAPLAF GSVESWAFFF LTLLTGAAIS FYLLHTRRHA APIYRVPCML 
PLALLGLFIF LQIIPLPQAV LSLLSPNAAQ LRNETIGILL PDRAWPLTLN LHATLFELCR 
WLLWVGFYWI SVQLLSDKAM LRRTLLFLAF FAGIFAFSSI LQHIFTDNRA LWFRYISVQS 
CSIFGSYINR NHYAGLMAML FGPTLGLLLA LRPPRQFGTM REKILGLFEE KETPLFILLL 
LSASIMVMSV FISLSRGGMT SLCISSLFFI LMASGKKFSG RHTKMKITAA MLLCAVLMAL 
TWVGWETIDN RFSTIYAADD IMRIGRLRYW GRCLAGGLDF LTTGVGFGAF EVAGPIYQTY 
YMGAILDHAH NDYLELLIEG GIPGVLLFLV FFLCLFQVVQ KTLKKRKESY SILVCIGAIT 
GIVAILLHSF TDFNLHIPAN ALYLAFLCGL AVAAAHTRLR NHITPPTYLP PAPNRAALVT 
PFLFILLWPP LLALSMGQWM ADQHIQPFIK APLNNTTAPA LLEQAAESAR RATAFSPWSA 
TAHTLLGDAA FFSGNPEQAL DAYQQALCFT PTRSTLLQKA GQAARNAGLP LSRAEALMAA 
GVKTYPMRPG AHGAHAGFLF ETGNKEKAMS VVRTGIKTHP SLARQFFTLM TYAGLTPAEM 
FTALPANSYV LTQFAAHIQN TDYDFMRRTI LTAAVNAADQ EAEPSPKAYI NLAHLYLREK 
NHDQTITVLE RGVTRLPDHP YLLYLLARTY EENQIVYKAL DLYKKLQIIS PGYRDTEQRL 
KAMKR