Gene EcE24377A_4217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4217
Symbol	tnaA
ID	5587073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	4205492
End bp	4206907
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	50%
IMG OID	640927833
Product	tryptophanase
Protein accession	YP_001465192
Protein GI	157155675
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3033] Tryptophanase
TIGRFAM ID	[TIGR02617] tryptophanase, leader peptide-associated

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.770521
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAACT TTAAACATCT CCCTGAACCG TTCCGCATTC GTGTTATTGA GCCAGTAAAA 
CGTACTACTC GCGCTTATCG TGAAGAAGCA ATTATTAAAT CCGGTATGAA CCCGTTCCTG 
CTGGATAGCG AAGATGTGTT TATCGATTTA CTGACCGACA GCGGCACCGG GGCAGTAACC 
CAAAGTATGC AGGCAGCGAT GATGCGCGGC GACGAAGCCT ACAGCGGCAG CCGCAGCTAC 
TATGCGTTAG CCGAGTCAGT GAAAAATATC TTTGGTTATC AATATACTAT TCCGACTCAC 
CAGGGCCGTG GCGCAGAGCA AATCTATATT CCGGTACTGA TTAAAAAACG CGAGCAGGAA 
AAAGGCCTGG ATCGCAGCAA AATGGTGGCA TTCTCTAACT ATTTCTTTGA TACCACGCAG 
GGCCATAGCC AGATTAACGG CTGTACCGTG CGTAACGTCT ATATCAAAGA AGCCTTCGAT 
ACGGGCGTGC GTTACGACTT TAAAGGCAAC TTTGACCTCG AAGGATTAGA ACGCGGTATT 
GAAGAAGTTG GCCCGAATAA CGTGCCGTAT ATCGTTGCAA CCATCACCAG TAACTCTGCA 
GGTGGTCAGC CGGTTTCACT GGCAAACTTA AAAGCGATGT ACAGCATCGC GAAGAAATAC 
GATATTCCGG TGGTAATGGA CTCCGCACGC TTTGCTGAAA ACGCCTATTT CATCAAGCAG 
CGTGAAGCAG AATACAAAGA CTGGACCATC GAGCAGATCA CCCGCGAAAC CTACAAATAT 
GCCGATATGC TGGCGATGTC CGCCAAGAAA GATGCGATGG TGCCGATGGG CGGCTTGCTG 
TGCATGAAAG ACGACAGCTT CTTTGATGTG TACACCGAGT GCAGAACCCT TTGCGTGGTG 
CAGGAAGGCT TCCCGACATA TGGCGGCCTG GAAGGCGGCG CGATGGAGCG TCTGGCGGTA 
GGTCTGTATG ACGGCATGAA TCTCGACTGG CTGGCTTATC GTATCGCGCA GGTACAGTAT 
CTGGTCGATG GTCTGGAAGA GATTGGCGTT GTCTGCCAGC AGGCGGGCGG TCACGCGGCA 
TTCGTTGATG CCGGTAAACT GCTGCCGCAT ATCCCGGCAG ACCAGTTCCC GGCACAGGCG 
CTGGCGTGCG AGCTGTATAA AGTCGCCGGT ATCCGTGCGG TAGAAATTGG CTCTTTCCTG 
TTAGGCCGCG ATCCGAAAAC CGGTAAACAA CTGCCATGCC CGGCTGAACT GCTGCGTTTA 
ACCATTCCGC GCGCAACATA TACTCAAACA CATATGGACT TCATTATTGA AGCCTTTAAA 
CATGTGAAAG AGAACGCGGC GAATATTAAA GGATTAACCT TTACCTACGA ACCAAAAGTA 
TTGCGTCACT TCACCGCAAA ACTGAAAGAA GTTTAA

Protein sequence

MENFKHLPEP FRIRVIEPVK RTTRAYREEA IIKSGMNPFL LDSEDVFIDL LTDSGTGAVT 
QSMQAAMMRG DEAYSGSRSY YALAESVKNI FGYQYTIPTH QGRGAEQIYI PVLIKKREQE 
KGLDRSKMVA FSNYFFDTTQ GHSQINGCTV RNVYIKEAFD TGVRYDFKGN FDLEGLERGI 
EEVGPNNVPY IVATITSNSA GGQPVSLANL KAMYSIAKKY DIPVVMDSAR FAENAYFIKQ 
REAEYKDWTI EQITRETYKY ADMLAMSAKK DAMVPMGGLL CMKDDSFFDV YTECRTLCVV 
QEGFPTYGGL EGGAMERLAV GLYDGMNLDW LAYRIAQVQY LVDGLEEIGV VCQQAGGHAA 
FVDAGKLLPH IPADQFPAQA LACELYKVAG IRAVEIGSFL LGRDPKTGKQ LPCPAELLRL 
TIPRATYTQT HMDFIIEAFK HVKENAANIK GLTFTYEPKV LRHFTAKLKE V