Gene Dole_1015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1015
Symbol
ID	5693850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1194190
End bp	1195155
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	58%
IMG OID	641263612
Product	hypothetical protein
Protein accession	YP_001528902
Protein GI	158521032
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID	[TIGR00996] virulence factor Mce family protein

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCTCAA TGCGGACCAA CTTTATCGTG GGCCTGTTTC TGATTATCGG CATCGCCGTT 
ACCGCTGCCA CCGTGATCTA CGTGGGGGCC ACCAGCTATT TTCAGAAGGG CAGCCTCTAC 
GTAAGCTATT TTGACGAATC GGTTCAGGGT CTGAACAAGG ACTCACCGGT CAAGTACCGG 
GGGGTCTCCA TTGGCCAGGT CCACGACATC CGCATATCAA AGGACGACCG GCTCATTGAG 
GTGATGCTGC GGATTGACCC GGACTGGAAG CCGGGAACCG ATACCATTGC ACAGCTCAAG 
TCCATCGGTA TCACGGGCAT CATGTTTGTG GAGCTCGACC TGAAAAAACC GGGGGAATCG 
GTCCTGCTTC CCACTCCGGC CCATGCCTCC ACCTATCCCG TTATTCCCAC CCGCCCCTCC 
GACATCCGGG AATTGCTGGG GGGCGTTACC GAGGTGGTGG AACAGCTCAA GGGGCTCGAC 
CTGGCAACAA TATCCGATGG GCTGAAAGAG ACCCTGGCGG CGATCAATAA AACCCTGGCA 
GACGCCCAGG TCAAGACCAT CTCCGATCGC CTGGACACCG CTATTTTGAA CGCCAACCGG 
GTAATCTCCT CCTTTGAGTC CGCAGCTCCC GGCCTGAACA GATTGACCTC CCGGGCAAGC 
CAGGCCGCCA CCCGGGTGGA CGACCTGATC ACGGCCAACG AGAAGGAGCT CAGCGACGCC 
ATCGCCAACA TGAAAGCGGC CATGATCCAG ATTCGGGAGA TCACAACCAC CGGGACCGCC 
ATGATGGGAC GGGCCGATAC CCGCATCGAC ACCTTTGAGA GCCGCCTGCT TGTCACCATC 
GGCCATCTTG AAGAGATCAG CAGCAACCTG CGACAGATGA CCGCCAAGGG TGCCAGCCAG 
CCTTCCCAGC TTTTTTTCGC GGCCCCCCTG CCGGAGAAAA ACATTGAGCC TTATGATACG 
CCATAG

Protein sequence

MASMRTNFIV GLFLIIGIAV TAATVIYVGA TSYFQKGSLY VSYFDESVQG LNKDSPVKYR 
GVSIGQVHDI RISKDDRLIE VMLRIDPDWK PGTDTIAQLK SIGITGIMFV ELDLKKPGES 
VLLPTPAHAS TYPVIPTRPS DIRELLGGVT EVVEQLKGLD LATISDGLKE TLAAINKTLA 
DAQVKTISDR LDTAILNANR VISSFESAAP GLNRLTSRAS QAATRVDDLI TANEKELSDA 
IANMKAAMIQ IREITTTGTA MMGRADTRID TFESRLLVTI GHLEEISSNL RQMTAKGASQ 
PSQLFFAAPL PEKNIEPYDT P