Gene Dole_1148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1148
Symbol
ID	5693982
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1365638
End bp	1366906
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	55%
IMG OID	641263741
Product	hypothetical protein
Protein accession	YP_001529031
Protein GI	158521161
COG category	[S] Function unknown
COG ID	[COG4269] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGTGGT TTTACATGGA CGGAGACCGG GAGGTCGGCC CGATAAGCAC GGCCGACATG 
CAGCAGCTGA TCAACACAAA ACAGATTACC GGCAAAACCC TGGCCAGGAA ACAGGACATG 
GACCGGTGGC ACCCCCTGGC GGAGTTGACC AAAGCCAAGA AGCCGGACAG TCAGGCACCG 
CCGCCGGCCG ATAATCCGCC TTCAGCAAAC GAAGCGCCAC CGCCGGCGCC ACCTGTCAGT 
GAACCACCCT CTCCTGCCCC CGCCGCTGTG AGCACCACCC CCCAACGCGC CGTGCCCGAC 
AACATCCCGT TTCAATTCAA AGGAACAGGC GGAGAGTATT TTAAAATCTG GATTGTCAAC 
GTGCTTTTGT CCATTCTCAC CCTGGGTATC TATTCGGCCT GGGCCAAGGT TCGCCGGAAA 
CAGTATTTTT ACGGGAACAC TCAGGTGGCG GGCGCGGGGT TCCGCTACCT TGCCGACCCG 
GTTAAAATTC TCAAAGGCCG CCTGATCGTT TTTGTCTTCT TTATTCTCTA CTCCACCGCC 
GGCGAATTTA TCCCTGTCCT GGGGGGCATC ATGATGCTGG CATTTCTCAT TTTTCTTCCC 
TGGCTGGTGG TGCGGTCCCT GGCATTTAAC GCCCGCAACA GTTCACTGCG AAACATCCGT 
TTCAATTTCA CCGGCACTTA TGGCCAGGCC GCCAAGGCGT ATCTGCTTTT TCCGATCCTG 
AGCGTCCTGA CTCTGGGAAT CCTGTTGCCA TATGCCTTTT TCCGGCAGAA ACAGTTTGTG 
GTTGAAAACT CTTCATACGG CACAACCCCG TTTCGTTTTC ATGCCACGGC AAAAGATTAC 
TACCGCATCG TGGGATTGTT TATTCTCCAC GCGCTGATTT TCATCGTGGC GGCGGTGGTC 
GTCAGCCTGC TGTTTGCCCC CCTTTCAGCA CTGATCATCA TGGTGCTCTA CCTTTACGCC 
ATGGCCTATT TCAGCGTCAA GACCACCAAC CTGCTTTACA GCTCCGGCAC ACTGGCAGAC 
CACCGGTTTT CAGCGAACCT GGGAATAAAA GACTACGCCC TGATCATCCT CACCAATTCC 
CTGGCCACGG TTGCCACCCT GGGGCTTTTT TACCCTTTTG CCGTGGTGCG GGCGCTGCAA 
TACAAAATCG ACCACCTGTC CCTTCTGCCG GGCAGCGATC TTGACCGTTT TGTGGCCGCG 
GAGATCAAAG AGACCAGTGC GCTGGGAGAA GAGATGTCCG ATTTTATGGA TTTTGATTTC 
GGATTATAG

Protein sequence

MMWFYMDGDR EVGPISTADM QQLINTKQIT GKTLARKQDM DRWHPLAELT KAKKPDSQAP 
PPADNPPSAN EAPPPAPPVS EPPSPAPAAV STTPQRAVPD NIPFQFKGTG GEYFKIWIVN 
VLLSILTLGI YSAWAKVRRK QYFYGNTQVA GAGFRYLADP VKILKGRLIV FVFFILYSTA 
GEFIPVLGGI MMLAFLIFLP WLVVRSLAFN ARNSSLRNIR FNFTGTYGQA AKAYLLFPIL 
SVLTLGILLP YAFFRQKQFV VENSSYGTTP FRFHATAKDY YRIVGLFILH ALIFIVAAVV 
VSLLFAPLSA LIIMVLYLYA MAYFSVKTTN LLYSSGTLAD HRFSANLGIK DYALIILTNS 
LATVATLGLF YPFAVVRALQ YKIDHLSLLP GSDLDRFVAA EIKETSALGE EMSDFMDFDF 
GL