Gene Dole_2849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2849
Symbol
ID	5695707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3433011
End bp	3434222
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	55%
IMG OID	641265464
Product	type II secretion system protein
Protein accession	YP_001530729
Protein GI	158522859
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1459] Type II secretory pathway, component PulF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCTTT ATCTCTGGGA AGGAAAGCGA AAAGACCAGT CGACCCAGAA GGGCGAGATG 
GAGGCCCCCA GCGAGGAGGC GGTCCGTGCC CAGCTTCAGC GGCAGAGAAT CACGCCGATA 
AAAGTCAAGA AAAAACCAAA AGATCTGTTT GAAAACGTCG CCTTTCTTCA GCCCAGGGTC 
AAGGAAGAGA ATGTTATTAT TTTTGCCCGC CAGTTCTCCA CCATGATCGA TGCCGGTCTG 
CCCATTGTTC AGTGTCTGGA TATTCTTTTT TCCCAGGAGG ACAACCCCAC CTTCAGAAAG 
ATTCTTAAAA GTATAAAGGA CAGCGTGGAA GGGGGCCAGA CCCTGGCCGA CGCCATGAAG 
CCGTTTCCCG ATCAGTTTGA CAATCTGTTT GTCAACATGA TCGCCGCCGG TGAGGCCGGT 
GGTATTCTGG ATGTCATTCT GAAGCGGCTC TCCGCTTACA TGGAAAAGGC GGCCAAGCTC 
AAGCGGCAGG TCAAGGGTGC CATGATGTAC CCTCTGATCA CCCTGTCCAT TGCTGTTCTG 
GTGGTGATCG TGATTCTGGT GTTCGTCATT CCGGTGTTTC AGGAGATGTT TGCCGATTTC 
GGCAAAGAGC TGCCCGCCCC CACCCAGTTT GTCATTTTTC TTTCCGATAC GGTGAAATCC 
CAGATTCATT TTATCATCAT CGCCTTTGTA CTGCTTGTCC TGGCCTACCG CCAGTTTTAC 
AAGACGGAAA AGGGTCGCCT GTTCATGGAC GGCCTTTTTC TCAAGTTCCC CATTGTAGGT 
ATTCTGCTCC GCAAGGTGGC GGTTGCCCGA TTCACTCGCA CCATGGGTAC CATGCTGGCC 
AGCGGCGTCT CCATTCTGGA TGCTCTGGAT ATCGTGGCCC GCACCGCCGG CAACAAGGTG 
GTGGAAAACG CGGTCTTCAA GGTCCGTTCC GGCATTTCCG AAGGCCGCAC CATGGCCGAT 
CCCCTTCTGG AGAGCGGGGT CTTTCCGTCA ATGGTGTGCC AGATGATTTC CGTTGGCGAG 
TCCACCGGCG CTCTGGATGC CATGCTGGAA AAGATCGCCG ATTTTTATGA AGAAGAGGTG 
GATGCCGCCG TGGAAAGCCT GACCTCTGCC ATTGAGCCGC TGATGATGGT CTTCATGGGC 
GGATTGATCG GCGGCCTGGT GGTCTCCATG TATCTGCCCG TCTTCCAACT GGCCGGCGCG 
GTATCCGGCT AG

Protein sequence

MALYLWEGKR KDQSTQKGEM EAPSEEAVRA QLQRQRITPI KVKKKPKDLF ENVAFLQPRV 
KEENVIIFAR QFSTMIDAGL PIVQCLDILF SQEDNPTFRK ILKSIKDSVE GGQTLADAMK 
PFPDQFDNLF VNMIAAGEAG GILDVILKRL SAYMEKAAKL KRQVKGAMMY PLITLSIAVL 
VVIVILVFVI PVFQEMFADF GKELPAPTQF VIFLSDTVKS QIHFIIIAFV LLVLAYRQFY 
KTEKGRLFMD GLFLKFPIVG ILLRKVAVAR FTRTMGTMLA SGVSILDALD IVARTAGNKV 
VENAVFKVRS GISEGRTMAD PLLESGVFPS MVCQMISVGE STGALDAMLE KIADFYEEEV 
DAAVESLTSA IEPLMMVFMG GLIGGLVVSM YLPVFQLAGA VSG