Gene Dole_1501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1501
Symbol
ID	5694338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1792143
End bp	1793168
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	60%
IMG OID	641264096
Product	radical SAM domain-containing protein
Protein accession	YP_001529382
Protein GI	158521512
COG category	[B] Chromatin structure and dynamics [K] Transcription
COG ID	[COG1243] Histone acetyltransferase
TIGRFAM ID	[TIGR01212] radical SAM protein, TIGR01212 family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.166226
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACAG GGCAGCGGCC CTTTATTGTT CCGGTTTTTC TCCCCCACGC AGGATGCCCC 
CACCGGTGCG TGTTCTGCGA CCAGGACGCC ATCACCGGAC AAAAAGCATC GCTGACCGCC 
GACGATCTGC ACGACCATGT ACACCGTTAT CTGCAATACA GGGGCGACAA CCGGGGCCAT 
GCGCAGATCG CGTTTTACGG GGGCAACTTT CTCGGTCTTG AAAGAGAATC CCTTACGCAG 
ATGCTCCATG CGGCTTCTGC TTTTGTCGAT CAGGGCCTGG TCCAGGCTAT CCGTTTTTCC 
ACCCGGCCCG ACACCATCAC CCAAAAAAAC CTTGACCTGC TGAAAGACTA TCCGGTGACC 
ACGGTCGAGG TGGGGGTGCA GTCCATGGAT GACCGGGTGC TTGAAAAGGC AAGGCGGGGC 
CACACCGCCG AACAGTCCAC AGCCGCCCTT CTGCTTTTAA AGCAGGCCGG ATACGAAACC 
GGGGCACAGC TCATGACCGG GCTTCCCGGT GACGACGGCC GGGTTTCCAT TGAAACCGCC 
AAAAAGGTGG CGGTCCTTAA ACCTGATTTT GCCAGAATTT ACCCCACCCT GGTGATCACG 
GGAAGCCCCC TGGCCCGGCA CTACCGGCAG GGAGAATATA TGCCCCAGAC CCTTGATGCG 
GCCGTGGCCG TTGCCACGAC CATGTGCCTG ACACTGGAAA GTCAGGGGAT CACCGTGATC 
CGCATGGGGC TTCAGCCTTC CGAAGAACTG GCCGACAGTG CCACCCTGCT GGCCGGCCCC 
TATCACCCGG CCTTTGGCCA CCTGGTGCGC TCGGAAATCC TGTTTGACCG GGTTTCGTCT 
CTTATCGCCG ACCGGCAGAT CTCTCCCGGC GCCGACCTGA CACTGGCAAT TCATCCCCGC 
CAGGCTTCTG CTCTGCGGGG CCAGAAAAAC GCCAACCTTG CCCGCCTGAA AAAGAGGTTT 
GACCTGAAGT CGATTCGCAT CCTGGAAGAC CCGGCACTGG CGGAGGATCA AACCATCTGC 
CAATAA

Protein sequence

MTTGQRPFIV PVFLPHAGCP HRCVFCDQDA ITGQKASLTA DDLHDHVHRY LQYRGDNRGH 
AQIAFYGGNF LGLERESLTQ MLHAASAFVD QGLVQAIRFS TRPDTITQKN LDLLKDYPVT 
TVEVGVQSMD DRVLEKARRG HTAEQSTAAL LLLKQAGYET GAQLMTGLPG DDGRVSIETA 
KKVAVLKPDF ARIYPTLVIT GSPLARHYRQ GEYMPQTLDA AVAVATTMCL TLESQGITVI 
RMGLQPSEEL ADSATLLAGP YHPAFGHLVR SEILFDRVSS LIADRQISPG ADLTLAIHPR 
QASALRGQKN ANLARLKKRF DLKSIRILED PALAEDQTIC Q