Gene Nther_1838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_1838
Symbol
ID	6315665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	-
Start bp	1913792
End bp	1915210
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	36%
IMG OID	642644216
Product	transcriptional regulator, ArsR family
Protein accession	YP_001917998
Protein GI	188586453
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.240001
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.27249
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAGACT ATCAGCTATT AAACAATCCA GAAGCAATTA AAGCATTAGG TCATCCCCTT 
CGAATGAAAA TAATTGATTT ACTAACTCAA AAAAAGGCTT CAGTTGGACA GATTTCTCAG 
GAACTTGATC TGGCTCATGC TAAAGCTTTT TACCATGTAA AAGAACTCAA AAAGCTAGGT 
TTGATAGAAC TAGTAGATAC CAGAATGATT CAAGGTATTC AGGAAAAATA TTATCAAGCC 
GTTGCGCAAA CTTTTTTCTT AGGGCAATCC TTGGGTCAGG GTCCCTCTGA AAGCATTGAC 
AATGCTAGTC AGGCAGTTCA AGGAAGTTTA AGAGAATGGC GGAGAAGGCA GATATTAAAC 
GTTGATTTAG AAAATCTGGC TCAGAAGGTT ATAACAGACG TATTGGCACT TAAACCCGGG 
GAAAAAGTAC TTTTTAGTGG TGAAGCGGAA GTGATGGATT TTTGTCACGC TATGACTGTG 
AGTTGCCGTA AAGCAGGAGG AGAAGGAATG GTCCATAATA TTGATTTAGA AACATTTGCA 
ACCATGATAT CTGAAACACC ATTGGAAATA TTGAAGGAAA CCCCACCTTT AACCGAAGCT 
TTATACCGAG AGTTAGATTA CTGGGTTGTT TTTGTACCTT TAATACCAGA AGATTATTTG 
AAAGAAGTAT CCTTAGAGAA AATAGAAACT TTAAAAAAAG TAGATGCTCA ATTACATTAT 
AAATATTGTA CCGATTTAAA AACCGTCTTT GTCGCTTATC CTTTACCACA GCTTTCGCAT 
CGTTATTTAG TAGATTATCA AGTTTTATAT GATGCCTTTT GGAAAGGCAT GAACGTCAGT 
AGGCAAAGAA TAAAAAATGA AGCTAAAAAT ATTGAAGAAA TTTTAAAAAC TGGAAAAACA 
TACTCAATTT GGAATGAACT AGGTACACAT TTACAATTTA AACTTAAAGC TGATTCACAA 
CCAGCTTTAG ATAGCGAGTT ATTTCAGGAT AAAAAAAATG GCGGTGAAAT AACCTTACCT 
GAAGGTGTTA TCTTTTCATT TCTTGATGAA GAAACAGTAT CTGGTCAGAT TGTAGTGCCG 
CGTAAAGAGT TTCGGGGAAA GCTAATTTAT AATCTTAAAA TATTTATTGA GAGCGGTCAT 
GTAACAGCCA TTGAAGATTC GTCTTCTTGT CCTGAAGGTT TACTACAATA CTTAAAAGAA 
ATGCCTGATT TAAAAAAGGT GACCGCTTTA GGCATTGGTG TTAATCCAGA AATACAAGGT 
GATGAGTTAC CAGAAAACTT ATTACTTAGA AGTCCAGGGC AATTCCAGGT TATTTTAGGA 
GATAACTCCA GACTTGGAGG GACAGCCAGG GCATCCACCT GGTTGTCTAT GCCTATTGGT 
AGAGTGGAAA TAGAACAAAC AGACGGATCC TTCGCATAA

Protein sequence

MKDYQLLNNP EAIKALGHPL RMKIIDLLTQ KKASVGQISQ ELDLAHAKAF YHVKELKKLG 
LIELVDTRMI QGIQEKYYQA VAQTFFLGQS LGQGPSESID NASQAVQGSL REWRRRQILN 
VDLENLAQKV ITDVLALKPG EKVLFSGEAE VMDFCHAMTV SCRKAGGEGM VHNIDLETFA 
TMISETPLEI LKETPPLTEA LYRELDYWVV FVPLIPEDYL KEVSLEKIET LKKVDAQLHY 
KYCTDLKTVF VAYPLPQLSH RYLVDYQVLY DAFWKGMNVS RQRIKNEAKN IEEILKTGKT 
YSIWNELGTH LQFKLKADSQ PALDSELFQD KKNGGEITLP EGVIFSFLDE ETVSGQIVVP 
RKEFRGKLIY NLKIFIESGH VTAIEDSSSC PEGLLQYLKE MPDLKKVTAL GIGVNPEIQG 
DELPENLLLR SPGQFQVILG DNSRLGGTAR ASTWLSMPIG RVEIEQTDGS FA