Gene Dole_3023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3023
Symbol
ID	5695882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3625597
End bp	3626757
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	60%
IMG OID	641265639
Product	radical SAM domain-containing protein
Protein accession	YP_001530903
Protein GI	158523033
COG category	[B] Chromatin structure and dynamics [K] Transcription
COG ID	[COG1243] Histone acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAACA AGAAAACTGA GCCATACCAG GGATTTGAGC AGGGGCCCAT TCGGCCGCCC 
AGCGAGGCGG CCAGCCTGCT GATCCGGATC ACGCGAAACT GCCCCTGGAA CCGGTGCACC 
TTCTGCCCTG TTTACAAGGG GTCCCGTTTC TCCCTGCGGC CGGCGGAGCA TGTCAAGGCC 
GACATCGACA TGGTGCACAA GTATGTGTCC ATGCTCCGGC AAGGTGCGGA CGCCTCCGGC 
CGGCTGGATC GCCAGGGGTT GTCCGACCTG TCGGACCGGG TGGACCGCGA TGAATATGCG 
GCCTTTAACG CGGCCCTGCA CTGGACCAGC GGCGGCATGG AATCGGTTTT TCTTCAGGAT 
GCCAACAGCC TGATTCTTCC GCCTGATGAC CTGATCGACA TTGTGAAACA CCTGCACAGC 
CGGTTCCCCT GGATTCAGCG GGTCACCTCC TACGCCCGGT CCCATACGGT GCGCCGGATT 
CCCGAGGACA AGCTGGCCGA AATTCGTCAG GCCGGCCTGA ACCGCATTCA TATCGGCCTG 
GAATCCGGGT CAGACAAGGT GCTGGAGCTG GTTAAAAAAG GGGTGACCAA GGCCGACCAT 
GTCGAAGCCG GTCAAAAGGT CAAGGCCGCC GGGTTCGAGC TGTCCGAATA CGTGATGCCC 
GGCCTGGGCG GGGTGGCCCT GTCGACGGAA CATGCCGCAG AATCGGCCGA TGCCTTAAAC 
CGGATCAACC CCGATTTTAT CAGGCTGCGC ACCCTGGCCG TGCCGCCGGG ACTCCCCCTT 
CACGAGGAAT ACAGGACGGG CCGGTTTAAA AAGCTCACGG ACGTGATGGT GGCAAAAGAG 
CTGCTGCTTT TTCTCGAATC CCTCGAAGGC GTTACCTCCA TGGTTAAAAG CGATCATATC 
TTAAACCTGT TTGCCGAGGT GGAAGGCCGG TTGCCGGAAG AAAAGCAGGC CATGACCCGG 
CCCATTCGGG CGTTTCTGGA TATGGCCCCG GAAGACCGGG TGGTCTACCA GATCGGTCGC 
CGGCTTTCCG TGTTCAACAC GCTGGAAGAG ATGAAGGACG ACCGGCGCGC GGCCCGGGTG 
CGGAACCTGT GCGCGGAAAA CAATATCACC CCGGACAATG TGGAGTCGGT CATCGAAGAA 
GCGATGAACC GGTTTATCTA A

Protein sequence

MKNKKTEPYQ GFEQGPIRPP SEAASLLIRI TRNCPWNRCT FCPVYKGSRF SLRPAEHVKA 
DIDMVHKYVS MLRQGADASG RLDRQGLSDL SDRVDRDEYA AFNAALHWTS GGMESVFLQD 
ANSLILPPDD LIDIVKHLHS RFPWIQRVTS YARSHTVRRI PEDKLAEIRQ AGLNRIHIGL 
ESGSDKVLEL VKKGVTKADH VEAGQKVKAA GFELSEYVMP GLGGVALSTE HAAESADALN 
RINPDFIRLR TLAVPPGLPL HEEYRTGRFK KLTDVMVAKE LLLFLESLEG VTSMVKSDHI 
LNLFAEVEGR LPEEKQAMTR PIRAFLDMAP EDRVVYQIGR RLSVFNTLEE MKDDRRAARV 
RNLCAENNIT PDNVESVIEE AMNRFI