Gene Nther_1687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_1687
Symbol
ID	6315551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	-
Start bp	1761827
End bp	1762975
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	34%
IMG OID	642644063
Product	Thiamin pyrophosphokinase catalytic region
Protein accession	YP_001917849
Protein GI	188586304
COG category	[S] Function unknown
COG ID	[COG4825] Uncharacterized membrane-anchored protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.677284
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.00191184
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGATCAGTC CAATCAAGCA AGGGAAAATA AAAGGAAGAG GGAAATTAGG ATTTAAAACT 
AAAGATTTAA CACCACTGCT TGATTCCGGT GATATAGCTA TTATAAGACA TGAAGATATT 
GATGAAATAG CCGCCAGATC ATTGTGTGAA GCAAATATAA AGGCTGTTAT TAATCTCAGT 
GACAGCATGA CTGGATATTA TCCTAATCAA GGTCCGAGGG TATTTATTGA ACACAGTGTT 
CCATTGATTG ATCAAGTTGA TGAAAATATT ATAGATAAAT TAAAACCAGA AAGAGATATA 
TTCATAGATG GTGAGTGTAT ATATCAAGAT GACGAATTAA TAGGTAGAGG TCGAATTGTA 
AATTTACAAG TTATTAGCCA GTTAGAAAAA ATCGCTGAAA ACAATTTTGA AACTCGCCTG 
AGAGAGTTCG TAGAAAACAC TTTTCAATAT GCAATTAAAG AAAAAGATTT AATGTTAAAA 
GATCTGTATA CCGATGAGTT ATCATCTGAT CTTGTTAATT TATTTTATAA TAGACATTGT 
GTGATTGTTG TTAGAGGTAA AGATTATCGT AAAGATTTAG ATGCCATCTC AGAATATATA 
AATGAAGAAA ATCCTGTACT TATTGGGGTT GATGGAGGAG CAGATGCATT AATAGAATAT 
GGCTTCTCAC CTGATATTGT AATAGGAGAT ATGGATAGTA TTTCAGATTA TGCTCTTAAT 
AAAATCAAAA ATCGAATTGT GCATGCTTAC CCCAATGGAA GTGCGCCTGG TGCGAAAAGA 
TTAAAAAAAC TAGGTTTAGA TTATAATGAT ATCCCTGCAC CTGGGACCAG TGAGGATCTA 
GCTTTATTAC TGGCTTACCA AATGGAAGCT CGTCTATTAG TAGCTTTGGG GACTCATACT 
CATGTAATTG ACTTTTTAGA AAAGGGCCGT CAGGGAATGG CAAGTACTTT TTTAGCAAGA 
CTAAAGGTTG GTGAAAAATT AGTTGATGCC AAGGGAGTTA GTCAACTTTA TCGGCCGAGA 
GTTAAGTTAC AATCTTTAGG TTTAATTGTA GTTTCAGCCA TATTACCTGT AGTGATATTA 
GCTATGCTTT CCCCAATAGT GGCGCATTTT TTTAGGTTAT TGTATCTATA TGTACGTTTG 
TTTTTCTGA

Protein sequence

MISPIKQGKI KGRGKLGFKT KDLTPLLDSG DIAIIRHEDI DEIAARSLCE ANIKAVINLS 
DSMTGYYPNQ GPRVFIEHSV PLIDQVDENI IDKLKPERDI FIDGECIYQD DELIGRGRIV 
NLQVISQLEK IAENNFETRL REFVENTFQY AIKEKDLMLK DLYTDELSSD LVNLFYNRHC 
VIVVRGKDYR KDLDAISEYI NEENPVLIGV DGGADALIEY GFSPDIVIGD MDSISDYALN 
KIKNRIVHAY PNGSAPGAKR LKKLGLDYND IPAPGTSEDL ALLLAYQMEA RLLVALGTHT 
HVIDFLEKGR QGMASTFLAR LKVGEKLVDA KGVSQLYRPR VKLQSLGLIV VSAILPVVIL 
AMLSPIVAHF FRLLYLYVRL FF