Gene Dole_1102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1102
Symbol
ID	5693936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1312212
End bp	1313309
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	57%
IMG OID	641263696
Product	hypothetical protein
Protein accession	YP_001528986
Protein GI	158521116
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00400546
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGAAA AAAATTCATT TCATACCAGG CTGACCATTG CCCACTACTT TCTTTTTTTC 
CTGCTGTTTG TCGCCCTGTT TGCCAGCTAT AAAATGATCG CGCCCTACCT GGACCCGATC 
CTGCTGGCGC TTATCTTCGC GGCCATGGCA AATCCGGTCT ACCAGTGGTT TGTCAAGAAA 
ACCAAGGGCC GGGAAAACCT CTCCGCCGGT CTGGTCTGCC TGCTGCTGAC CCTGGTGATC 
GTGATCCCGT GCATGATCAT GCTGACGGTG ATCATCGCCC AGGGCATCGA CTCGGTGGGC 
GCCATCAATC GGTGGGTGGC GGCCGGCAAC CTGGAAAAGC TCAAGGACGC GCCCCTGGTC 
AGAACAGCGG TGGACTTTAT GCAGCGCTAT CTGCCGTCCA GTGTGCTGGC AGGGGTGGAC 
CTCCAGGCCC TGGCCATCAA AAGTTCATCT GCCGCCGGCA AGTTGCTGGT AAGCCAGAGC 
GGGGCGATTC TCGGCAACAT CTCCATGGTG GTGGGCAAAT TTTTTCTCAT GATTTTTGTT 
TTCTTTTTCG TGCTCAAGGA CCAGCAGCGG CTTTATGATT ACATTCTTCA CCTGGTGCCC 
ATGTCTGCCG AGCACGAGAC CGTGTTGATT CAGAAGATGA AGGATGTCTC CCGGTCCGCG 
GTGCTGGGCA GTTTTCTCAC GGCCCTGGCC CAGGGCGCGG CCGGAGGCCT CGCCTTTGCC 
ATCTGCGGAA TGCCCGGATT CTTCTGGGGC GCGGTCATGG CCTTTGCGTC GCTGATCCCG 
GTGGTGGGCA CGGCCCTGGT TTGGGTGCCC GCGGCAGCGT ACCTGCTGAT TTCCGGAAAA 
ATCGGCCTGG GGGTTTTTCT GATTATCTGG TGCGTGGTGG TGGTGGGCAT GATCGACAAC 
CTGCTGCGAC CCCTGTTCAT GAGGGGCGGG GCCGGAATGA GCACGGTGGT GATCTTTTTT 
GCCATTTTAG GCGGCATTCA TCTGTTCGGC CTGATCGGCC TGATCTACGG CCCGCTGATC 
TTCGGCATCA CCATGGTGAT GCTCTATATC TACGACCTGG AGTTTGACGC CTTTTTAAAG 
GGCCAGGACA GGATATGA

Protein sequence

MTEKNSFHTR LTIAHYFLFF LLFVALFASY KMIAPYLDPI LLALIFAAMA NPVYQWFVKK 
TKGRENLSAG LVCLLLTLVI VIPCMIMLTV IIAQGIDSVG AINRWVAAGN LEKLKDAPLV 
RTAVDFMQRY LPSSVLAGVD LQALAIKSSS AAGKLLVSQS GAILGNISMV VGKFFLMIFV 
FFFVLKDQQR LYDYILHLVP MSAEHETVLI QKMKDVSRSA VLGSFLTALA QGAAGGLAFA 
ICGMPGFFWG AVMAFASLIP VVGTALVWVP AAAYLLISGK IGLGVFLIIW CVVVVGMIDN 
LLRPLFMRGG AGMSTVVIFF AILGGIHLFG LIGLIYGPLI FGITMVMLYI YDLEFDAFLK 
GQDRI