Gene Strop_1914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1914
Symbol
ID	5058376
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	2186619
End bp	2187797
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	68%
IMG OID	640474187
Product	thiamin pyrophosphokinase, catalytic region
Protein accession	YP_001158754
Protein GI	145594457
COG category	[S] Function unknown
COG ID	[COG4825] Uncharacterized membrane-anchored protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0967076
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.164651
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTAC CTACGTTGCG CTGGACTCGA CCCGCCGAGC CGGGTCGGGC GGGCGGCACC 
GCCCGCCTGG ACCGTCGGAC CAAACGTCTG GTTGGCCGGC TCCGTCCCGG TGACGTCGCC 
GTGATCGACC ACGTCGACCT GGACCGGGTC GCCGCCGATT CGCTGGTCGC GGTCGGTGTC 
GGGGCTGTCC TCAACGCCAA GCCGTCGGTC TCGGGCCGCT ATCCCAATCT CGGCCCGGAA 
GTGCTGATCG AGGCTGGTAT CCCGCTCCTG GACGACCTGG GCGAGGATGT CTTCGAACGG 
ATCCAGGAGG GCGACACCGT CCGGATCGAG GGCAACACGG TCTATCTCGG CGAAGAGCCG 
GTGGCCCACG GTGATCTGCA GGACGCGGAG ACCATCGGCA AGGCGATGGC CGATGCCCGG 
GAGGGGCTAT CGGTCCAGCT GGAGGCGTTC GCAGCGAACA CCATGGTCTA CCTGAAGCAG 
GAGCGGGACC TGCTGCTGTA CGGGGTGGGC GTTCCGGACA TCCGTACCGA GATTCAGGGC 
CGGCACTGCC TGATCGTGGT GCGCGGCTAC GACTACAAGG CCGACCTGGA TGTGCTGCGC 
CCGTACATCC GGGAGTTCAA GCCGGTGCTC ATCGGCGTCG ACGGCGGGGC GGACGCCCTG 
GTCGAGGCCG GCTATCCACC CGACCTGATC ATCGGTGACA TGGACTCGGT GACCGACGAC 
GTGCTGCGTT GCGGCGCCGA GGTCGTGGTA CACGCCTACC CAGACGGTCG TGCGCCCGGG 
CTGGCCCGGG TCAATGGTCT CGGCGTTCCG GCGGTCACCT TTCCCGCCGC CGCCACCAGC 
GAGGACCTGG CGATGCTGCT CGCCGACGAG AAGGGGGCCT CGCTCCTGGT GGCGGTCGGC 
ACACACGCCA CGCTCGTCGA GTTCCTGGAC AAGGGACGGG GCGGGATGGC GTCGACCTTC 
CTCACCCGGC TGAAGGTCGG CGGCAAGCTG GTTGACGCCA AGGGCGTAAG CCGGCTCTAC 
CGGCAGAGCA TCTCCGGATC CTCACTGCTG CTGCTGGTGC TGTCCGCGAT TGCCGCGATG 
GCCTCGGCTG TTGCGGTCTC CACCGTCGGC AAGGCGTACC TGGGTGTGGT CTCCGAGTGG 
TGGAGCAATT TTGTGTTCCA GCTGGAACGG CTCTTCTGA

Protein sequence

MRLPTLRWTR PAEPGRAGGT ARLDRRTKRL VGRLRPGDVA VIDHVDLDRV AADSLVAVGV 
GAVLNAKPSV SGRYPNLGPE VLIEAGIPLL DDLGEDVFER IQEGDTVRIE GNTVYLGEEP 
VAHGDLQDAE TIGKAMADAR EGLSVQLEAF AANTMVYLKQ ERDLLLYGVG VPDIRTEIQG 
RHCLIVVRGY DYKADLDVLR PYIREFKPVL IGVDGGADAL VEAGYPPDLI IGDMDSVTDD 
VLRCGAEVVV HAYPDGRAPG LARVNGLGVP AVTFPAAATS EDLAMLLADE KGASLLVAVG 
THATLVEFLD KGRGGMASTF LTRLKVGGKL VDAKGVSRLY RQSISGSSLL LLVLSAIAAM 
ASAVAVSTVG KAYLGVVSEW WSNFVFQLER LF