Gene Sare_1165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1165
Symbol
ID	5704257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1313771
End bp	1314724
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	76%
IMG OID	641270683
Product	thiamine monophosphate kinase
Protein accession	YP_001536064
Protein GI	159036811
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000347409
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

GTGAGCGAAC GCGGCAGTGG CCTCGTGGGG CTGGGTGAGT TCGGTCTCAT TGACCGGGTG 
ACCGCTCGGT TGTCGTACGG ACCGACCGTC CTGCTCGGGC CCGGGGACGA CGCGGCGGTG 
GTGGCGGCCC CGGACGCCCG GGTGGTCGCC TCCACCGACG TGCTGGTGGA GGGGCGCCAC 
TTCCGCCGCG ACTGGTCCGG CGCGCGTGAC ATCGGCCACC GGGCAGCCGC GGCGAACCTC 
GCCGATGTCG CCGCGATGGG CGCGCGACCG ACAGCCCTGC TGGTCGCGCT CTGCATCCCT 
CCCGACCTGG CGTCCGGGTG GGCGGAGGAC CTGGCCGACG GCCTGGCCGC GGAGGCGGCC 
ACGGTGGGAG CCAGCGTGGT GGGCGGCGAC ATGTCGGCGA GTCCGACGTT GACCATCGCG 
GTGACCGTGC TCGGTGACCT GGGGAGCCGT CCGCCGGTGA CCCGGGCCGG GGCGCTCCCC 
GGTGACGTCG TGGCCCTCGC CGGCCGGACC GGGTACGCGG CGGCCGGCCT CACCGTGCTG 
TCCCGGGGCT TCCGGACGCC ACGGCTGCTG GTCGAGGCCT ACCGGCGACC CGAGGTGCCG 
TACCCGGCCG GGCCGGCAGC GGCCGGGGCC GGAGCGACGG CGATGATCGA CGTGTCGGAC 
GGGCTCCTCG CCGACCTCGG GCATGTGGCC CAGGCGAGCG GGGTCGCGGT GGACGTCCGT 
CGGGATGCCT TCGAGGTGCC CCGGCAGATG CGGGACGCGG CCCAGGCGCT CGGGGTCGAT 
CCGTACACCT GGCTCCTGAC CGGTGGCGAC GACCACGCGC TCGCGGCGAC CTTCCCCCCG 
GCGGTGGCGT TGCCGGCGGG CTGGCGGCCG ATCGGCGGAG TCGCCGCTGG TTCCGGGGTG 
ACCGTCGACG GCCGGCAGTG GGAGGGAGCA GCCGGCTGGG ACCACTTCCG GTAG

Protein sequence

MSERGSGLVG LGEFGLIDRV TARLSYGPTV LLGPGDDAAV VAAPDARVVA STDVLVEGRH 
FRRDWSGARD IGHRAAAANL ADVAAMGARP TALLVALCIP PDLASGWAED LADGLAAEAA 
TVGASVVGGD MSASPTLTIA VTVLGDLGSR PPVTRAGALP GDVVALAGRT GYAAAGLTVL 
SRGFRTPRLL VEAYRRPEVP YPAGPAAAGA GATAMIDVSD GLLADLGHVA QASGVAVDVR 
RDAFEVPRQM RDAAQALGVD PYTWLLTGGD DHALAATFPP AVALPAGWRP IGGVAAGSGV 
TVDGRQWEGA AGWDHFR