Gene EcE24377A_1460 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1460
Symbol	trpB
ID	5588370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1450987
End bp	1452180
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	54%
IMG OID	640925153
Product	tryptophan synthase subunit beta
Protein accession	YP_001462558
Protein GI	157157226
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00292681
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACAT TACTTAACCC CTATTTTGGT GAGTTTGGCG GCATGTACGT GCCACAAATC 
CTGATGCCTG CTCTGCGCCA GCTGGAAGAA GCTTTTGTCA GTGCGCAAAA AGATCCTGAA 
TTTCAGGCTC AGTTCAACGA CCTGCTGAAA AACTATGCCG GGCGTCCAAC CGCGCTGACC 
AAATGCCAGA ACATTACAGC CGGGACGAAC ACCACTCTGT ATCTCAAGCG TGAAGATTTG 
CTGCACGGCG GCGCGCATAA AACTAACCAG GTGCTCGGTC AGGCTTTACT GGCGAAGCGG 
ATGGGTAAAA CCGAAATCAT CGCCGAAACC GGTGCCGGTC AGCATGGCGT GGCGTCGGCC 
CTTGCCAGCG CCCTGCTCGG CCTGAAATGC CGTATTTATA TGGGTGCCAA AGACGTAGAA 
CGCCAGTCGC CTAACGTTTT TCGTATGCGC TTAATGGGTG CGGAAGTGAT CCCGGTGCAT 
AGCGGTTCCG CGACGCTGAA AGATGCCTGT AACGAGGCGC TGCGCGACTG GTCCGGTAGT 
TACGAAACCG CGCACTATAT GCTGGGCACC GCAGCTGGCC CGCATCCTTA TCCGACCATT 
GTGCGTGAGT TTCAGCGGAT GATTGGCGAA GAAACCAAAG CGCAGATTCT GGAAAGAGAA 
GGTCGCCTGC CGGATGCCGT TATCGCCTGT GTTGGCGGCG GTTCGAATGC CATCGGCATG 
TTTGCTGATT TCATCAATGA AACCAACGTC GGCCTGATTG GTGTGGAGCC AGGTGGTCAC 
GGTATCGAAA CTGGCGAGCA CGGCGCACCG TTAAAACATG GTCGCGTGGG CATCTATTTC 
GGTATGAAAG CGCCGATGAT GCAAACCGAA GACGGGCAGA TTGAAGAATC TTACTCCATC 
TCCGCCGGAC TGGATTTCCC GTCTGTCGGC CCACAACACG CGTATCTTAA CAGCACTGGA 
CGCGCTGATT ACGTGTCTAT TACCGATGAT GAAGCCCTTG AAGCCTTCAA AACGCTGTGC 
CTGCACGAAG GGATCATCCC GGCGCTGGAA TCCTCCCACG CCCTGGCCCA TGCGTTGAAA 
ATGATGCGCG AAAACCCGGA TAAAGAGCAG CTACTGGTGG TTAACCTTTC CGGTCGCGGC 
GATAAAGACA TCTTCACCGT TCACGATATT TTGAAAGCAC GAGGGGAAAT CTGA

Protein sequence

MTTLLNPYFG EFGGMYVPQI LMPALRQLEE AFVSAQKDPE FQAQFNDLLK NYAGRPTALT 
KCQNITAGTN TTLYLKREDL LHGGAHKTNQ VLGQALLAKR MGKTEIIAET GAGQHGVASA 
LASALLGLKC RIYMGAKDVE RQSPNVFRMR LMGAEVIPVH SGSATLKDAC NEALRDWSGS 
YETAHYMLGT AAGPHPYPTI VREFQRMIGE ETKAQILERE GRLPDAVIAC VGGGSNAIGM 
FADFINETNV GLIGVEPGGH GIETGEHGAP LKHGRVGIYF GMKAPMMQTE DGQIEESYSI 
SAGLDFPSVG PQHAYLNSTG RADYVSITDD EALEAFKTLC LHEGIIPALE SSHALAHALK 
MMRENPDKEQ LLVVNLSGRG DKDIFTVHDI LKARGEI