Gene Dole_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2006
Symbol
ID	5694846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2430943
End bp	2432034
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	57%
IMG OID	641264604
Product	hypothetical protein
Protein accession	YP_001529887
Protein GI	158522017
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000247505
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGGAA TGTTAAAAGA GTGGTACCGG CGGTATGCCA ATGATCCCCA GATCATCATC 
CTGTTTGCCA TTCTTGTGGT GGGGTTTGTA CTTGTGCTCA CCATGGGCGA TATGCTGGCC 
CCGGTGATTG CGGCAATTGT CATTGCCTAC CTGCTCGAAG GCCTGATCAA CGTGCTGGAG 
CGGCTGAAGG TCTCCCGAAT GATCGCCCTG GTAACGGTTT TTACCCTTTT TCTGGCCGGC 
ATGGTGGCGG TGATCGTCTT TTTTCTGCCC CTGCTCTCCC GGCAGATCGC CGAGATGTTC 
CAGGAACTGC CGGCCCTTAT GGCCAACGGC CAGAAGCAGC TCATGCGGCT TCCGGAGCGG 
TATCCGGAAC TCATCGCCCA GGAGCAGATC TCCCAGTTTA TCAGTTTCTT AAAATTCGAG 
ATCACCCAGT GGGGTCAGCA CCTGGTCTCC ATCTCCATCG CGTCGGTTCG AGGGCTTATC 
ACGGTGGTGG TTTACCTGAT CCTGGTGCCG CTGCTGATCT TCTTTTTTTT AAAAGATAAA 
ACCAAAATCC TGGGCTGGCT CAAGCTGTTT CTGCCGAAAA ACACCCGCCT GGCCGCCGAA 
GTGTGGCACG AAGTCAACCA GCAGATCGCC AATTACGTGC GCGGCAAGAT ATGGGAGATC 
CTGATTGTCT GGACCGCCGC TTATGCCCTG TTCGCGGCCC TGGGGCTGAA GTTTGCCGTT 
CTGATCTCTC TGGCCGTGGG CCTTTCCGTT CTGGCGCCCT ACATCGGCGC CACCCTGATG 
TTCTTTCCCG TGGCCCTGGT GGCCTTTTTC CAGTGGGGGC TTTCCCCCAG CTTTACCTGG 
ATCGTGGTGG GCTATCTCAT CCTTCAGGCC CTGGACGGCA ACCTGCTGGC CCCGCTCCTG 
CTCTCCGAGG TGGTGGACCT GCACCCGGTG GCCATTATCG TGGCCCTGCT GGTATTCGGC 
GGCATCTGGG GCATGTGGGG CCTGTTCTTT GCCATTCCCC TGGCCACCCT TGTTCATGCC 
GTGTTAAAAA CGTGGTTCCG GTACATGAAA GAAAAGAACC CGCCCGCAAC CGAAGAACCA 
CACCCGGCAT GA

Protein sequence

MIGMLKEWYR RYANDPQIII LFAILVVGFV LVLTMGDMLA PVIAAIVIAY LLEGLINVLE 
RLKVSRMIAL VTVFTLFLAG MVAVIVFFLP LLSRQIAEMF QELPALMANG QKQLMRLPER 
YPELIAQEQI SQFISFLKFE ITQWGQHLVS ISIASVRGLI TVVVYLILVP LLIFFFLKDK 
TKILGWLKLF LPKNTRLAAE VWHEVNQQIA NYVRGKIWEI LIVWTAAYAL FAALGLKFAV 
LISLAVGLSV LAPYIGATLM FFPVALVAFF QWGLSPSFTW IVVGYLILQA LDGNLLAPLL 
LSEVVDLHPV AIIVALLVFG GIWGMWGLFF AIPLATLVHA VLKTWFRYMK EKNPPATEEP 
HPA