Gene Nther_2156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_2156
Symbol
ID	6316020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	-
Start bp	2281260
End bp	2282396
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	40%
IMG OID	642644543
Product	protein of unknown function DUF453
Protein accession	YP_001918310
Protein GI	188586765
COG category	[S] Function unknown
COG ID	[COG2828] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.738715
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATCAGG AAAAAGTCCC AACAACTATT ATGAGAGGCG GCACGAGTAA AGCCATTTTT 
CTTAAGGATA AAGATCTTCC GACAAATCAG GAAGAAAGAG ATAATTTGAT TCTAAGAATT 
TTTGGAAGCC CCGATCCAAG GCAAATTGAT GGCCTTGGGG GGGCAGACCC TCTAACAAGT 
AAACTTGCAA TTATTGGACC ACCCACTAGA GAAGATGCTG ATATTGATTA TACTTTTGGG 
CAAGTTTCAT ATACTGCTGC CAAAATTGAT TATTCCGGTA ATTGCGGGAA TGTATCCTCA 
GCTGTAGGAC CGTTTGCAAT AGATAAAGGT TATGTCCAAG CTGAAGAACC ATATACTACT 
GTGAGAGTTC ATAACACAAA TACTAACAAG ATTTTGATTG AGAAAGTACC TGTTGTAGAT 
GGCTTATCCA AAGTAATTGG TGATTATCAA ATTGATGGTG TTCCTGGGCA AGGTGCTCCA 
ATATCTATAG ACTTTTCCGA TACTGCCGGT GCAAAAACAG GTGAATTACT TCCTACAGGC 
GAGGAAGTGA ACAAAATTTC GACTGAATCT TGTGGAGAGA TTGAGGCATC TTTAGTTGAT 
GCTGGTAACC CCATGGTTTT TGTTAGAGCT GAGGACTTGG GTTTACGAGG AAATGAAACC 
CCCGAAGAAA TTGACAATAA TGAAGAAGCT TTAAAAACCC TTGAAGAAAT AAGGGGAAAA 
GCAGCTGTAA TGATGGGAAT TGAAACTGAT TGGAAACAAG CTGAACAAAA TAATCCGGCT 
TTTCCAATGG TAGCTTTTGT ATCACCAGCT TCAGATTCAC AACAGGAAAG TGGCATAGAT 
TTCAATTCCC GTTTGATGTT TATGCAGGTT ATGCACAAAA CTTATGCTGG TACTGGCACC 
ATCTGTACGG GTTCAGCAGC TATGATTAAA GGCACCATTG TTAATCAGGT TATGAGTTCC 
AAAAAAGACC AAGATGAAGC AACTATTAAG ATCGGACATC CAGCAGGATT TATTGAAATT 
GAAGTCCGGG TCGATGAGGA TGAACAAAAT GGAAATTGGA TATTGAACAA AGCTGCTATT 
AATCGGACAG CTCGAAGAAT TATGGATGGG AACTGTTATA TACCAAAAGA AGGCTAG

Protein sequence

MDQEKVPTTI MRGGTSKAIF LKDKDLPTNQ EERDNLILRI FGSPDPRQID GLGGADPLTS 
KLAIIGPPTR EDADIDYTFG QVSYTAAKID YSGNCGNVSS AVGPFAIDKG YVQAEEPYTT 
VRVHNTNTNK ILIEKVPVVD GLSKVIGDYQ IDGVPGQGAP ISIDFSDTAG AKTGELLPTG 
EEVNKISTES CGEIEASLVD AGNPMVFVRA EDLGLRGNET PEEIDNNEEA LKTLEEIRGK 
AAVMMGIETD WKQAEQNNPA FPMVAFVSPA SDSQQESGID FNSRLMFMQV MHKTYAGTGT 
ICTGSAAMIK GTIVNQVMSS KKDQDEATIK IGHPAGFIEI EVRVDEDEQN GNWILNKAAI 
NRTARRIMDG NCYIPKEG