Gene Dole_1997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1997
Symbol
ID	5694837
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2418287
End bp	2419567
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	55%
IMG OID	641264595
Product	hypothetical protein
Protein accession	YP_001529878
Protein GI	158522008
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000131605
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGACTTT ACAGAAGAAG ATTTTGGGTT GTGGCCCTGG TTGCGCTTTT GGTATGCCCG 
GCCGGCGCCG TTGGCATGAC ACTGGAAGAC CTCCAGATCC ATGGTTTTAT CAGCCAGGGG 
TTCCTCTATT CAACAGACGA CGCGGACTTT CTGGCAAAAG ACTCCCACAA GGGGACACTG 
GAATTCAATG AAATGGCCAT CAACTTTTCC GCCACTCCCA CCGATGATCT TTCCGTGGGG 
ATGCAACTGG CCGCCTTTGA CCTGGGCACG ATCGGTAACG ACGAGGTGAT GGTGGACTGG 
GCCTTTGGCG ACTATTCGTT CCGTGACTAC CTGGGGCTAA GGGCCGGCAT TATTAAAATT 
CCCCTTGGCC TCTATAATGA TGTGCGCAAG ATCGACATGG TGCGCACCAG CATTCTGCTG 
CCAACAAGTG TCTATCCGGA ATGGTTCCGG GAGGCCTTTG CCCGGATTAA GGGGGTGGGG 
CTTTATGGCA CCCTGCCCGG CAACATCTCC TATCAGGCGT TGTATGGCAC TGTGGATATC 
CAGACGGACG GGGGCCTGTC CGACGGTCTG GAGTCCCTGA TGGAGGGTTT AGGGGGCATG 
GACACCAACT ATACGGATAC AAACTGTGCC TATGCCGGCA AACTCCAGTG GGACGCGCCC 
GTGGGTCTCA AGCTGGCCGC CAGCGTATAT ACGCTGGATG GTTTAGAGAC AAACATGAAC 
AGCATCAATT ATATCGATCC GGCTCCATTG GGGCTGCCGC TTCCTGTATA TCTGCCCGTT 
GCCATGGACG CCTACATGCG TTTTGAACCG ATCACCACCT GGGTGCTGTC CGCCGAATAC 
ATAACCGACC GGCTCACCCT GGCCGCTGAG TACGCCGAAT ATGACCTTGA GTTTAACGTC 
GACATCACGA CTAACCTGGA TCCGGCGTTC AGCGCGTTCA TGGGCATTCC TCCCCGGGTG 
GGGGACAAAA CCACCATGCA GGGCTATTAT GGCAGTGCTT CCTACCGCGT GCTCGACAAC 
CTGGAGGTCG GCACCTATTA TTCCGAGTTT TATTATGACA AGGATGACCA TGACGGCGGC 
AAATATGCCG CCAAATACGG TTTACCGAAA TACAATTCAT GGCTCAAGGA CACCTGCCTG 
TCGGCCCGTT ATGATATTTC ACCCAACTGG TGTGCCAAGA TCGAAGGCCA CCTCATGGAC 
GGCACTTACC TGGCCCTGGG CGCCCCTGCC GGCGTCGATT CCTGGGAACT TTACGCGGCC 
AAGCTGACTT ACAGCTTCTA G

Protein sequence

MGLYRRRFWV VALVALLVCP AGAVGMTLED LQIHGFISQG FLYSTDDADF LAKDSHKGTL 
EFNEMAINFS ATPTDDLSVG MQLAAFDLGT IGNDEVMVDW AFGDYSFRDY LGLRAGIIKI 
PLGLYNDVRK IDMVRTSILL PTSVYPEWFR EAFARIKGVG LYGTLPGNIS YQALYGTVDI 
QTDGGLSDGL ESLMEGLGGM DTNYTDTNCA YAGKLQWDAP VGLKLAASVY TLDGLETNMN 
SINYIDPAPL GLPLPVYLPV AMDAYMRFEP ITTWVLSAEY ITDRLTLAAE YAEYDLEFNV 
DITTNLDPAF SAFMGIPPRV GDKTTMQGYY GSASYRVLDN LEVGTYYSEF YYDKDDHDGG 
KYAAKYGLPK YNSWLKDTCL SARYDISPNW CAKIEGHLMD GTYLALGAPA GVDSWELYAA 
KLTYSF