Gene EcolC_2366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2366
Symbol
ID	6065466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2608212
End bp	2609405
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	55%
IMG OID	641601769
Product	tryptophan synthase subunit beta
Protein accession	YP_001725328
Protein GI	170020374
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.700104
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000273648
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACAACAT TACTTAACCC CTATTTTGGT GAGTTTGGCG GCATGTACGT GCCACAAATC 
CTGATGCCTG CTCTGCGCCA GCTGGAAGAA GCTTTTGTCA GTGCGCAAAA AGATCCTGAA 
TTTCAGGCTC AGTTCAACGA CCTGCTGAAA AACTATGCCG GGCGTCCAAC CGCGCTGACC 
AAATGCCAGA ACATTACAGC CGGGACGAAC ACCACGCTGT ATCTCAAGCG TGAAGATTTG 
CTGCACGGCG GCGCGCATAA AACTAACCAG GTGCTGGGGC AGGCGTTGCT GGCGAAGCGG 
ATGGGTAAAA CCGAAATCAT CGCCGAAACC GGTGCCGGTC AGCATGGCGT GGCGTCGGCC 
CTTGCCAGCG CCCTGCTCGG CCTGAAATGC CGTATTTATA TGGGTGCCAA AGACGTTGAA 
CGCCAGTCGC CTAACGTTTT TCGTATGCGC TTAATGGGTG CGGAAGTGAT CCCGGTGCAT 
AGCGGTTCCG CGACGCTGAA AGATGCCTGT AACGAGGCGC TGCGCGACTG GTCCGGTAGT 
TACGAAACCG CGCACTATAT GCTGGGCACC GCAGCTGGCC CGCATCCTTA TCCGACCATT 
GTGCGTGAGT TTCAGCGGAT GATTGGCGAA GAAACCAAAG CGCAGATTCT GGAAAGAGAA 
GGTCGCCTGC CGGATGCCGT TATCGCCTGT GTTGGCGGCG GTTCGAATGC CATCGGCATG 
TTTGCTGATT TCATCAATGA AACCAACGTC GGCCTGATTG GTGTGGAGCC AGGTGGTCAC 
GGTATCGAAA CTGGCGAGCA CGGCGCACCG CTAAAACATG GTCGCGTGGG TATCTATTTC 
GGTATGAAAG CGCCGATGAT GCAAACCGAA GACGGGCAGA TTGAAGAATC TTACTCCATC 
TCCGCCGGAC TGGATTTCCC GTCTGTCGGC CCACAACACG CGTATCTTAA CAGCACTGGA 
CGCGCTGATT ACGTGTCTAT TACCGATGAT GAAGCCCTTG AAGCCTTCAA AACGCTGTGC 
CTGCACGAAG GGATCATCCC GGCGCTGGAA TCCTCCCACG CCCTGGCCCA TGCGTTGAAA 
ATGATGCGCG AAAACCCGGA TAAAGAGCAG CTACTGGTGG TTAACCTTTC CGGTCGCGGC 
GATAAAGACA TCTTCACCGT TCACGATATT TTGAAAGCAC GAGGGGAAAT CTGA

Protein sequence

MTTLLNPYFG EFGGMYVPQI LMPALRQLEE AFVSAQKDPE FQAQFNDLLK NYAGRPTALT 
KCQNITAGTN TTLYLKREDL LHGGAHKTNQ VLGQALLAKR MGKTEIIAET GAGQHGVASA 
LASALLGLKC RIYMGAKDVE RQSPNVFRMR LMGAEVIPVH SGSATLKDAC NEALRDWSGS 
YETAHYMLGT AAGPHPYPTI VREFQRMIGE ETKAQILERE GRLPDAVIAC VGGGSNAIGM 
FADFINETNV GLIGVEPGGH GIETGEHGAP LKHGRVGIYF GMKAPMMQTE DGQIEESYSI 
SAGLDFPSVG PQHAYLNSTG RADYVSITDD EALEAFKTLC LHEGIIPALE SSHALAHALK 
MMRENPDKEQ LLVVNLSGRG DKDIFTVHDI LKARGEI