Gene Rcas_4109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4109
Symbol
ID	5541620
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5320923
End bp	5321915
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	60%
IMG OID	640896221
Product	dihydroxyacetone kinase subunit DhaK
Protein accession	YP_001434159
Protein GI	156744030
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2376] Dihydroxyacetone kinase
TIGRFAM ID	[TIGR02363] dihydroxyacetone kinase, DhaK subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.987034
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0344371
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGATGC TCATCAATTC AGCCGATACG ATCATATCGG ACGCGCTGGA AGGTTTTGCA 
CAGGCGTATC CGGGCATGGC GCGCGTGATA CGCAACCCGG ATTATGTCAT CAGAGCCGAT 
GCGCCGCTCC AGAACCAGGT TGCTATCATT TCCGGCGGTG GCAGCGGGCA TGAGCCGATG 
CACATCGGAT ACGTCGGTCG GGGAATGCTG ACAGCCGCCT GTCCCGGTGC GATTTTCACC 
TCGCCAACTC CCGATCAGAT TCTGGCGGCG ACGCATGCTG CGGCAGGCGA TGCGGGAGTG 
CTGTACATTA TCAAAAACTA TGCTGGCGAT CGGATGAATT TCGAGATCGC TATCGAGACT 
CTTTTGCACG AAGGTGTGCC GACGGCAACG GTCGTTGTGG CAGACGATGT TGCCAACCCG 
GCGCAGGACC TTCGGCGCGG CACCGGCGCC ACGATCATCG TCGAGAAGAT CGCCGGCGCG 
GCTGCGGAAA TGGGCGCCTC GCTCACGGAG TGCGCACAGG TTGCGCGCCG CGCGCTCCGC 
GAAAGCCGTT CGATAGGGGT CGCGCTTTCT GCCTGCACCA TACCTGCGTT GAATCGACCA 
TCCTTTCATC TTGGCGACGA CGAGATCGAG ATTGGCATCG GCATTCATGG CGAAGCGGGT 
CGGCAACGAA CTGCGCTCGC GCCGGTTTCA CAGATTGTCG ATCTGTTGTG CAGCGCGCTT 
GCCGATGATC TCGGTCTGCA TACCGGGGAT CGCACGCTGG CGCTTGTCAA TGGACTCGGC 
GCGACAACGC AGATCGAGTT GTATGTCGCC TTTTGCGAAG TTGCGCAATG GTGTGCAGCG 
CGCGGCATTG CTATCGAACG CAGTCTGGTG GGCAACTATA TGACATCGCT CGATATGGCG 
GGATGCACCA TCACACTGAT GCGACTGGAC GATGAGCTGC TTCAGTTGTG GGATGCTCCG 
GTATGCACAC CCGCTCTGCG CTGGGGCAAG TGA

Protein sequence

MKMLINSADT IISDALEGFA QAYPGMARVI RNPDYVIRAD APLQNQVAII SGGGSGHEPM 
HIGYVGRGML TAACPGAIFT SPTPDQILAA THAAAGDAGV LYIIKNYAGD RMNFEIAIET 
LLHEGVPTAT VVVADDVANP AQDLRRGTGA TIIVEKIAGA AAEMGASLTE CAQVARRALR 
ESRSIGVALS ACTIPALNRP SFHLGDDEIE IGIGIHGEAG RQRTALAPVS QIVDLLCSAL 
ADDLGLHTGD RTLALVNGLG ATTQIELYVA FCEVAQWCAA RGIAIERSLV GNYMTSLDMA 
GCTITLMRLD DELLQLWDAP VCTPALRWGK