Gene Dole_3233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3233
Symbol
ID	5696096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3876779
End bp	3877813
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	61%
IMG OID	641265853
Product	ApbE family lipoprotein
Protein accession	YP_001531113
Protein GI	158523243
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000188784
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAGGC GTTTAACAAA ATATTCAGGC CGGTGGATGC TGGCCGCGGC CTGCCTCTGC 
CTGGCTTTTG CCGGGTGCGA CGGCTCACGG CACAAGACCT TTTCCGGAAA AACCATGGGC 
ACCGAGTACC ATGTCACGGT GGTGACCGGA ATGCTGTCAC GCACCGCGCC CCTGCAAAAG 
AAGGTCGAGG CCCGGCTGGC CCACATCAAC GCCGGTATGT CCACGTATAT GGACACCAGT 
GAGATTTCCC GGTTTAACAA CGAGATCGGC CAGGACCAGC CCTTTGCCGT GTCCAAAGAT 
TTTTTGCGGG TGGCTGCCGA AGGCATGGCC CTGTTTCGGC TGACCGATGG GGCCTGGGAC 
GGGTCGGTGT GGCCCCTGAT GATCCTGTGG GGGTTTGACC GGCCGGAGCA GCAGCGTTTT 
GTACCGGATT CGGCCGAAAT CGACCAGGTG CTGACCTGCG TGGGATACGA TTCGCTTCAG 
ATTGATGAGG CAAACCGCCT GGTGAAAAAA ACGCCCTGCC TGTTTCTGGA CTTTGCCTCC 
ATTGCCAAGG GGTATGGCGT GGATGTCGTG GCCGAGGTGC TTCGGGAGGC CGGTGTCGAC 
AATTTTATCG TGGAAGTCGG GGGCGAAGTG TATGCCGCCG GTGTACGGGA AACCGGGGAT 
CCCTGGCGTA TCGGCATCAA CACGCCTGAA CCGGGTGCGC CGGTGGACCG GGTGCGCCAG 
GTGGTGGCCC TGTCCGACCG GGCCATGGCC ACCAGTGGTG ACTACCGGAA CTATTTTGTG 
ATCGACGATC GGACCTACAG CCATGTGCTG GACCCCCGGA CCGGTTATCC CGTGGCCAAT 
GGTGTGGTCA GCGCCACTGT GGTGGCCGAC ACCTGCACCT TTGCCGACGG ACTGGCCACA 
GCCCTGATGG TGATGGGGGC CGAACCCGGA ACGGCCCTGG TAAACACCCT GGAAAACGTG 
GAGAGCTGCA TCACGGTCCG CCGGACCGAC GGCACGTACG AGGATTTTTG GTCAACCGGA 
TTTGTCGCGC AGTAA

Protein sequence

MMRRLTKYSG RWMLAAACLC LAFAGCDGSR HKTFSGKTMG TEYHVTVVTG MLSRTAPLQK 
KVEARLAHIN AGMSTYMDTS EISRFNNEIG QDQPFAVSKD FLRVAAEGMA LFRLTDGAWD 
GSVWPLMILW GFDRPEQQRF VPDSAEIDQV LTCVGYDSLQ IDEANRLVKK TPCLFLDFAS 
IAKGYGVDVV AEVLREAGVD NFIVEVGGEV YAAGVRETGD PWRIGINTPE PGAPVDRVRQ 
VVALSDRAMA TSGDYRNYFV IDDRTYSHVL DPRTGYPVAN GVVSATVVAD TCTFADGLAT 
ALMVMGAEPG TALVNTLENV ESCITVRRTD GTYEDFWSTG FVAQ