Gene Nther_2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_2022
Symbol	tnaA
ID	6315834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	-
Start bp	2133139
End bp	2134527
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	37%
IMG OID	642644410
Product	tryptophanase
Protein accession	YP_001918177
Protein GI	188586632
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3033] Tryptophanase
TIGRFAM ID	[TIGR02617] tryptophanase, leader peptide-associated [TIGR02618] tyrosine phenol-lyase

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTAATA TTATTGATGA AATGATGGCG GCTGAACCGT TTAGGATTAA AATGGTTGAG 
CCGATTAAGA CAACTACCAA GGAAGAACGC CAGAGAAAAA TTAAAGAAGC GGGTTATAAT 
GTTTTTAATT TGGAATCTAA GGATGTTTAT ATCGATTTAT TAACAGATAG TGGAACAAGT 
GCCATGAGTG ATAATCAATG GGCTGGTATG ATGTTAGGAG ATGAGGCATA TGCTGGTAGT 
AAAAACTTCT ATAATCTCAA GGATGCCATC AAAGAAGTGA TGGGTTATGA CTACTTTTTA 
CCTACACATC AAGGGAGAGC CGCAGAAAAT GTACTTTTTC AATTATACGT GGAAGAAGGA 
AATTATGTAC CTAATAATAT GCATTTTGAT ACCACAAAGG CACATGTTCA AGATAAACGT 
GGGCGACCTG TCAATTTAGT TATAGATGAA GCTTATGATG CCAAGAAAAA TGTGCCATTT 
AAAGGAAATA TGGATATTGA TAAACTAGAT AATTTCTTAA AAGAGCACAG TGATAACGTT 
CCCATTGTAT TATTGACAGT AACGTGTAAT AGCGGTGGTG GTCAACCCGT TTCTATGGAA 
AATATCAAAG AAGTGTCAGA AATTTGTAAG AAATATAATA AACCTTTCTA TTTAGATGCT 
TGTCGCTTCG CAGAAAATGC TTATTTTATT AAACTAAGAG AGCCAGGCTA TGCCGATAAA 
TCCATTCCAG AGATAACCCG GGAGATGTTC TCTTATGCAG ATGGTTGCAC CATGAGTTCC 
AAAAAAGATG CTTTAGTTAA TATTGGTGGT TTTTTAGCAA TGGAAGATGA GAAACTACTT 
GATAAAGCAA AAGTTTTAGG AGTACTATAT GAAGGGTTCC CTACTTACGG GGGTATGGCT 
GGCAGAGATA TGGAAGCCAT GGCCCGTGGA TTACTTGAAG TTGTGGAAGA AGAATATTTA 
CAATACAGAA TAAACCAGGT TAATTATTTA GGTGAAAAGT TGAAGGAAAA GAAAGTACCT 
ATATTGGAAC CCGTTGGTGG ACACGCTGTA TATCTAGATG CTGGTCGTTT CTTACCAAAT 
ATTCCAAAAG ACCAATTTCC TGGTCAAGCT TTAACAGTAG CACTTTACGA AGAGGGCGGT 
ATTAGAGGTG TTGAAATAGG AACTGTCTTA AGTGGAAGAG ATCCTGAAAC CGGAGACCAT 
GATTATCCCG AATTAGAACT GGTTCGTTTA ACTATACCCA GAAGAGTATA TACTTATCGA 
CATATGGATG TTGTGGCAGA GGCTGCTAAA ATAATTCATG ATAAGCGAGA TGAAATTGGT 
GGCTATAAAT TTACTTATGA ACCTGAGATC TTAAGGCATT TTACTGCCAG ATTTGCTCCT 
GTAAAATAA

Protein sequence

MGNIIDEMMA AEPFRIKMVE PIKTTTKEER QRKIKEAGYN VFNLESKDVY IDLLTDSGTS 
AMSDNQWAGM MLGDEAYAGS KNFYNLKDAI KEVMGYDYFL PTHQGRAAEN VLFQLYVEEG 
NYVPNNMHFD TTKAHVQDKR GRPVNLVIDE AYDAKKNVPF KGNMDIDKLD NFLKEHSDNV 
PIVLLTVTCN SGGGQPVSME NIKEVSEICK KYNKPFYLDA CRFAENAYFI KLREPGYADK 
SIPEITREMF SYADGCTMSS KKDALVNIGG FLAMEDEKLL DKAKVLGVLY EGFPTYGGMA 
GRDMEAMARG LLEVVEEEYL QYRINQVNYL GEKLKEKKVP ILEPVGGHAV YLDAGRFLPN 
IPKDQFPGQA LTVALYEEGG IRGVEIGTVL SGRDPETGDH DYPELELVRL TIPRRVYTYR 
HMDVVAEAAK IIHDKRDEIG GYKFTYEPEI LRHFTARFAP VK