Gene Dole_3242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3242
Symbol
ID	5696105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	3886846
End bp	3888144
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	63%
IMG OID	641265862
Product	hypothetical protein
Protein accession	YP_001531122
Protein GI	158523252
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATCG AAAAATTTCA TGAAATATTC GGGGCAATTG TGTCAACCGA CACCCGTGTA 
CTGGTGGTGG GCACCACCTC CGACTATGTC GACTGGATTC GACGCGCAGC GCCCGGCCGG 
GCGCTGTTTT TGACCGACCC GGTGCTTCGG CAAAAGGCAA AAGAGCCGGC ACCCGGTCCG 
GACGAGGAGG TGTGCGGCGA CCTGGAGCGG CCGGAGCGTC TCCTTGAAGC CCTGTCGGCC 
CACACCCGGC AGCGGGGCCT TGCCATTGAC GGCGTGGCCT GCTTTGACTG CGAGTCCCTG 
CCGGTTGCCG CTTTTCTTGC GCAACAGCTT GGCCTTGACT TTGTGTCGCC CGCGGCAGTG 
GCCGCCTGCC GGGACAAGTA CGCATCCAAA CGACTGTGGT GGGAAAAGGG TGTTTTGTGC 
CCTGCTTTTG CCCCGGTTTT TTCCAAAGCC GACGCCGTCG CCTTTTTTGA GGCCCACGGA 
ACCTGCGTGA TCAAGCCGGT ATCCGGCGCG GGCAGCGAAC TGGTGTTCTG CTGCGACACG 
AAAGAAGCCT GCGGCCATGC CTTTGGTCTT GTCAAAGAGG GCCTGTTGCG CCGGGCCCAC 
ACCCGCCTCT ATCACACCCC CGATAACAGC GCGGCGATTG TTGCCGAAAC ATGGCTTACC 
GGCCCGGAGT TCAGCTGCGA CTTTCTGGTC GATGGGGGCC GGGCCGTGAT CGTGCGGCTG 
ACAAAAAAAA TTGTCGCGCC TGATATCGCT TTCGGCACCG CCATGGCTTA TGTGCTGATC 
AACCGGCTGC CGGGGCTTGA AAATCATGCG CTGGCCCGGC ACCTGGCCGC CGGGGCCGGG 
GCACTGGGCA TTGACCGGGC CCTGTGCATG GCCGATTTTG TGCTTGAAAA CGGCCGGCCG 
GCCTTTCTGG AGATCACCCC CCGGCCCGGC GGCGACTGCC TGCCGGACCT GGTCCGCCAT 
GGCCTGGGCA TTGACACCCT CTTGCTGGAC CTGGACCTGG CTCAGCACCG GCCCCTGCCG 
AAAGCGTTCG GCCCGCCCGT TGCCCCCATG GCCGGGCTTC GGTTTCACGC GCGTCAGGCC 
GGGGTGTTGA CAACCATCGA CTGGTCCCGG GTTGCCGCCG CTCCCGGGGT CCGGGAGGTG 
ACGGGCCTGC AACAGCCCGG CCATACCATT GTGCTGCCGC CGGACGATTA TGATTCATTT 
CTGCTGGGAA GCGCCATCTT TGCCCTTAAA AATCCGGCTG ACCCGGCCGA AGAATGCCAG 
GCCCTGTTAA CCCGCCTGAT CGTGGAGATT GCCCCATGA

Protein sequence

MNIEKFHEIF GAIVSTDTRV LVVGTTSDYV DWIRRAAPGR ALFLTDPVLR QKAKEPAPGP 
DEEVCGDLER PERLLEALSA HTRQRGLAID GVACFDCESL PVAAFLAQQL GLDFVSPAAV 
AACRDKYASK RLWWEKGVLC PAFAPVFSKA DAVAFFEAHG TCVIKPVSGA GSELVFCCDT 
KEACGHAFGL VKEGLLRRAH TRLYHTPDNS AAIVAETWLT GPEFSCDFLV DGGRAVIVRL 
TKKIVAPDIA FGTAMAYVLI NRLPGLENHA LARHLAAGAG ALGIDRALCM ADFVLENGRP 
AFLEITPRPG GDCLPDLVRH GLGIDTLLLD LDLAQHRPLP KAFGPPVAPM AGLRFHARQA 
GVLTTIDWSR VAAAPGVREV TGLQQPGHTI VLPPDDYDSF LLGSAIFALK NPADPAEECQ 
ALLTRLIVEI AP