Gene Dole_0654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0654
Symbol
ID	5693484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	780932
End bp	782062
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	58%
IMG OID	641263246
Product	hypothetical protein
Protein accession	YP_001528541
Protein GI	158520671
COG category	[S] Function unknown
COG ID	[COG5345] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000103467
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAAG AGAAATTCAG CGCTTATGCG GTGCCACGGG TGGTCGCGGC CGTGGTGATC 
GTGGCGCTTG TGGTGTGGGG AACATCTTTT GTCTTAAACT TTCTAAGCCC TGAAAGCGAC 
GACCATGCAG CCGTTGACAG TCATGGCCCG GCTTCCGTTG TCACGGCGGA CGCCGCCGGT 
CATGGAGAAA CCAGTGCTGT CGTGACGGAG CATGCGACTG ATGATGCCGC TGCACCTCCT 
GCTGCCGTCG ATACACACAC CCCGGTGGCC GCGGAAAAAG CCGATAAAAA ACGCAAAACC 
GTGGTCACCA CCACGCCGGC CCCTTATGCC CCGGCGTCTG AACACGGGGG CGCGGCCGGC 
GCGGCCGGTT CAAAACCCAA AACCAAGGGG CTGGCTTTTG TCAATGCCAT GATCAAACCC 
ATGGAATACG AGCTCAGCGA ACGGTTCATG GGGTGGCGGC CCAATGATAT TGTTCAGCCC 
ACCGACAACG TCAATAATTT TCAGCTGGGC GTTCTGGAAG TGACCCGCCG AACCGCGGTG 
ATGCTGGCCG AACGGCTCTC CCGCACCGGC ACCACCGATA TTATGGACGA AAATCTGGAA 
CGGGCCATGA ACTGGTTCAT GGTGGCCGCA GACAGTTACT GGCTTCCTTC CGCTGAAAAC 
AAATACCAGG AGGGCGTTGA GGAAGTGCGG GCCTATGGCC ACAAGCTGAC CAGGGGCGAA 
GCCAGGTTTT TCACCCGTTC GGACAACATC ATCCCCCTGT TTAAAACCTA TGCCGATGTG 
CTGGGCGGAT GCGACGAGAA CCTTGTCAAG TCCCATGAGA AAGACGGCAG CCGGGTGAGC 
ACCTTTGCCG CGGATGATTA TTTCTATTAT GCCAAGGGCG TGGCCAGCAC CATGCTGGTG 
ATCCTGGAGG CAGTGGCCGA GGATTTTCAT GAAACCCTTG AGACCCGGGG TAGCGCGGAT 
ACCCTTCACC ACGCCATCGA GTCCTGTCAT CACGCGGCAA ACCTGGATCC CCTGATCATT 
CTGGAAAGCG ACCTGGACGG CATTTTTGCC AATCACCGGG CCAACATGGC GGCCCATATC 
AGCCATGCCC GGTTCTACCT GGATGTGCTG GTCAACGCGC TGTCCACATA A

Protein sequence

MNEEKFSAYA VPRVVAAVVI VALVVWGTSF VLNFLSPESD DHAAVDSHGP ASVVTADAAG 
HGETSAVVTE HATDDAAAPP AAVDTHTPVA AEKADKKRKT VVTTTPAPYA PASEHGGAAG 
AAGSKPKTKG LAFVNAMIKP MEYELSERFM GWRPNDIVQP TDNVNNFQLG VLEVTRRTAV 
MLAERLSRTG TTDIMDENLE RAMNWFMVAA DSYWLPSAEN KYQEGVEEVR AYGHKLTRGE 
ARFFTRSDNI IPLFKTYADV LGGCDENLVK SHEKDGSRVS TFAADDYFYY AKGVASTMLV 
ILEAVAEDFH ETLETRGSAD TLHHAIESCH HAANLDPLII LESDLDGIFA NHRANMAAHI 
SHARFYLDVL VNALST