Gene Nther_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_1044
Symbol
ID	6314225
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	+
Start bp	1108163
End bp	1109977
Gene Length	1815 bp
Protein Length	604 aa
Translation table	11
GC content	33%
IMG OID	642643416
Product	hypothetical protein
Protein accession	YP_001917216
Protein GI	188585671
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.0661829
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAGGAA GAAAATTAGT TTATTTAGTA ATAGTAATAA GCTTAATGGT TTTAACAGTT 
TTTGTGACAG GCTGTACTCA AGAGAAAAAA GCAGGAGATG AACAGGCTAA ACAGGATGAA 
GATGAACCAA ATGAATACAA AGTAGAGGTA CAAGCTAATC CTGAAGAAGC TGGTGAGATA 
ACAGGAGAAG GTACTTATGA AGAGGGGGAA AAGGTTGAAC TAGAAGCAGT ATCAAAAGAA 
GGTTATGAAT TTAAGAAATG GCATTTAGAA GGAGAAGATA TTAGTGAGGA TAAAAAATAT 
AATTTTACAA TGGAAAAAGA TAAAAAGTTC CAGGCAGTAT TTGAGACAGA ATATAATTCG 
GATAAGTTTG AACAGATAAC CACAGAAACA GATGATGGTA CTATTAAAGA AACTATCATG 
GGAGCAAATT TAATAGATGA ATTAGACCCT GTAAAATCAA ATGCATTAAC TGACGAGCCA 
ATTTATATAG GAGAAAATTA TATTGCTCAA CCTGATGAAG AAAAAGGTGA CTTGGTCATT 
TACCAAAAAG ATAATTTAGA ACATTTTGAT ACCGTAGAAG GAATAGTTAC AAAAGAAGGG 
ACTAATGAGA AATGTGTAAT TATTGAAGAT CAGTTGATTT ATATACCAAA TACCGGTCAA 
AGAGCGTATT TTTATAGTCT CGAAGAGGAA CAAGCTTCAA AAGAAAAAAA ATTAAATATA 
CAAGATTTAG AATGGGACAT ACCAGAGGGT TTAGAGAAGG ATGGGAGAGG AAAATTCTTT 
ATAAACATAC ATAACAATCT ACACTTTCAA ACTAGTGTTA TTGGCAATCA CCTATTTCTT 
TACGCAGATC ATTCTTGGGT AGTAAGGCAT GAAAAACCAC CCAGAGTTGA AAAACCTTTT 
TTAAAAGTAT TCGAGTTATC TGAAGATGGA TTTAAACAAA AAGAGATAAA TTTTGAAGAG 
GAGTTTGAAG AGTCCCCGTT AATTACGGAT ATAGCAATAT ACGATGATAA TAGCGCTATT 
ATAGCTAGTG GTGATAAAGG ATTTAGTTTA ATAGATTTAA ACAATTTCTC TATAGAACAT 
TTGGAGGTAG GCGGTACTAG TCATGAGGGG GAAGTCCCTG GCGAAGGTGA TTCAAATTTT 
GTGTCCCATA AAATTTTAGG AGTCAATGAA TATGGCATTT TACTTACTAA AAGTGAAGTG 
CCAATACATG CCTGTTCTGC TAGAAGTATA GAAATATGGG CTCCGGATAG CAATAATTCC 
CTCGATTTAA CAGCAAGCAC TGTACAGCAC CTTCCCGGTG GTTTTGAAGA GGAAAAAGAT 
GATGTAATGT TGGTAGGTGC TATCCCAGAT GAAAAAGGGA TTAAAAACAA TTTATGGCCT 
ACTAATATGA CTGAATCTGA GCAAATTGAG GAAGGCAAAA GAAAATCTTC ATTACAGATA 
TCTGCTTTTG TAAGTTTAGA TAATAATAAA GTGATGAAAG ATGTTGGTGA AAATAATTCT 
AAATTGAGTG AGTACCTACA CAAAGAATTA GATTTTGCTC AAACATTAGA TAATGGAGAG 
ATAGACCAGC TTCCGGTTAT TGTAAAAGAT ACAGATAAAG ATCATTTACA CCATACATTT 
GACGATCCGC GTCCTCCTAT TGAAGCTCCT GTTTTTGCGT CAACTAATCT AAACGCGAAT 
AGTTTAGATA TAGAATTGGT TTATCTTAAA GATAATATTA AGCTTATCCA AATTGATCCT 
GAAGATCAGG ATATTTACTT AAAGAAAGAT GATTCAGTTT ATCAGATAGA GTATGATTCT 
TTGTTTAGTC ATTAA

Protein sequence

MSGRKLVYLV IVISLMVLTV FVTGCTQEKK AGDEQAKQDE DEPNEYKVEV QANPEEAGEI 
TGEGTYEEGE KVELEAVSKE GYEFKKWHLE GEDISEDKKY NFTMEKDKKF QAVFETEYNS 
DKFEQITTET DDGTIKETIM GANLIDELDP VKSNALTDEP IYIGENYIAQ PDEEKGDLVI 
YQKDNLEHFD TVEGIVTKEG TNEKCVIIED QLIYIPNTGQ RAYFYSLEEE QASKEKKLNI 
QDLEWDIPEG LEKDGRGKFF INIHNNLHFQ TSVIGNHLFL YADHSWVVRH EKPPRVEKPF 
LKVFELSEDG FKQKEINFEE EFEESPLITD IAIYDDNSAI IASGDKGFSL IDLNNFSIEH 
LEVGGTSHEG EVPGEGDSNF VSHKILGVNE YGILLTKSEV PIHACSARSI EIWAPDSNNS 
LDLTASTVQH LPGGFEEEKD DVMLVGAIPD EKGIKNNLWP TNMTESEQIE EGKRKSSLQI 
SAFVSLDNNK VMKDVGENNS KLSEYLHKEL DFAQTLDNGE IDQLPVIVKD TDKDHLHHTF 
DDPRPPIEAP VFASTNLNAN SLDIELVYLK DNIKLIQIDP EDQDIYLKKD DSVYQIEYDS 
LFSH