Gene Sala_2024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2024
Symbol
ID	4079961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2136430
End bp	2137383
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	70%
IMG OID	638010400
Product	thiamine-monophosphate kinase
Protein accession	YP_617068
Protein GI	103487507
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.908086
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0114447
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTATCC CCTACGCTTC CGCGATGACC GAAGCCGATT TCATCGCCCG CCTGCGCGCC 
ATCGCGACCG ATCCCGCCGC GCGCGGGCTC GCCGACGATG CTGCGGTGTG GGAAGGGCTG 
GTGCTCACCC ACGACATGAT CGTCGAGGGC GTTCATTTCC TGCCCGACGA CCGGCCGCAG 
GATGTTGCGT GGAAACTTGT TGCGGTGAAC CTGTCCGACC TGGCGGCGAA GGGGGCGGCG 
CCGGTCGGCG TGCTCGTCGG GTACAGCCTT GGCGACGCGG CGTGGGACGC GGGCTTTGTC 
GAGGGGCTCG ATGGAGCGCT GCGCCGCTTC GGGGTCGCCC TGCTCGGCGG CGACACGGTG 
CGCGCGCCCA CGGGAACACC GCGCAGCTTC GGCCTCACCG CCATCGGTCG GGCGCCCGAA 
GGCGGCGCGC CGACGCGCGG CGGCGCGCGG CCGGGCGACC AGATCTGGGT GACGGGGACG 
ATCGGCAATG CCGGTCTGGG CCTCGCGATG CGGCTGGGGC AGGTCGAGCC GAACGAGACC 
TGCCTTGCCG CCTATTGCCG GCCGCAGCCG CAGCTGACCT TTGGGCAGGC AGTGGCGCCG 
CATGTTCATG CGATGATGGA CCTATCCGAC GGACTGTTGA TCGACGCACA GCGCATGGCG 
GCGGCGAGCG GGTGCGAACT GGGCATCATG ATGGATGCGA TCCCCCTGTC GGCGGCGCTG 
CTGGCGGTGC GGCCCGATGT GCTCGACACG CGGCTCGCCG CAGCGACCGC GGGTGACGAT 
TATCAGCTCT TGTTCGCGGC CGTCCCCGCC GCGGCCGATG CGATCCGCGA AATTGCGGCC 
GGGCTGAATG TTGCCGTGAC CGCAATCGGC CATGCGGGGG TGGGCGAGGG GATCGTGCTG 
ACACACCATG CAAAGCGTGT TGCGGTGCCC GATCGACCCG GATTCATGCA CTGA

Protein sequence

MAIPYASAMT EADFIARLRA IATDPAARGL ADDAAVWEGL VLTHDMIVEG VHFLPDDRPQ 
DVAWKLVAVN LSDLAAKGAA PVGVLVGYSL GDAAWDAGFV EGLDGALRRF GVALLGGDTV 
RAPTGTPRSF GLTAIGRAPE GGAPTRGGAR PGDQIWVTGT IGNAGLGLAM RLGQVEPNET 
CLAAYCRPQP QLTFGQAVAP HVHAMMDLSD GLLIDAQRMA AASGCELGIM MDAIPLSAAL 
LAVRPDVLDT RLAAATAGDD YQLLFAAVPA AADAIREIAA GLNVAVTAIG HAGVGEGIVL 
THHAKRVAVP DRPGFMH