Gene EcE24377A_1461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1461
Symbol	trpC
ID	5589778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1452192
End bp	1453550
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	53%
IMG OID	640925154
Product	bifunctional indole-3-glycerol phosphate synthase/phosphoribosylanthranilate isomerase
Protein accession	YP_001462559
Protein GI	157157701
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0134] Indole-3-glycerol phosphate synthase [COG0135] Phosphoribosylanthranilate isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00841012
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACCG TTTTAGCGAA AATCGTCGCA GACAAGGCGA TTTGGGTAGA AACCCGCAAA 
CAGCAGCAAC CGCTGGCCAG TTTTCAGAAT GAGGTTCAGC CGAGCACGCG ACATTTTTAT 
GATGCGCTAC AGGGTGCGCG CACGGCGTTT ATTCTGGAGT GCAAGAAAGC GTCGCCGTCA 
AAAGGCGTGA TCCGTGATGA TTTCGATCCA GCACGCATTG CCGCCATTTA TAAACATTAC 
GCTTCGGCAA TTTCGGTGCT GACTGATGAG AAATATTTTC AGGGGAGCTT TGATTTCCTC 
CCCATCGTCA GCCAAATCGC CCCGCAGCCG ATTTTATGTA AAGACTTCAT TATCGATCCT 
TACCAGATCT ATCTGGCGCG CTATTACCAG GCTGATGCCT GCTTATTAAT GCTTTCAGTA 
CTGGATGACG AACAATATCG CCAGCTTGCC GCCGTCGCCC ACAGTCTGGA GATGGGTGTG 
CTGACCGAAG TCAGTAATGA AGAGGAACTG GAGCGTGCCA TTGCATTGGG GGCAAAGGTC 
GTTGGCATCA ACAACCGCGA TCTGCGTGAT TTGTCGATTG ATCTCAACCG TACCCGCGAG 
CTTGCGCCGA AACTGGGGCA CAACGTAACG GTAATCAGCG AATCCGGCAT CAATACTTAC 
GCTCAGGTGC GCGAGTTAAG CCACTTCGCT AACGGTTTTC TGATTGGTTC GGCGTTGATG 
GCCCATGACG ATTTGCACGC CGCCGTGCGC CGGGTGTTGC TGGGTGAGAA TAAAGTATGT 
GGCCTGACGC GTGGGCAAGA TGCTAAAGCA GCTTATGACG CGGGCGCGAT TTACGGTGGG 
TTGATTTTTG TTGCGACATC ACCGCGTTGC GTCAACGTTG AACAGGCGCA GGAAGTGATG 
GCTGCGGCAC CGTTGCAGTA TGTTGGCGTG TTCCGCAATC ACGATATTGC CGATGTGGTG 
GACAAAGCTA AGGTGTTATC GCTGGCGGCA GTGCAACTGC ATGGTAATGA AGATCAGCTG 
TATATCGATA CGCTGCGTGA AGCTCTGCCA GCACACGTTG CCATCTGGAA AGCATTAAGC 
GTCGGTGAAA CCCTGCCCGC CCGCGAGCTT CAGCACGTTG ATAAATATGT TTTAGACAAC 
GGCCAGGGTG GAAGCGGGCA ACGTTTCGAC TGGTCACTAT TAAATGGTCA ATCGCTTGGC 
AACGTTCTGC TGGCGGGGGG CTTAGGCGCA GATAACTGCG TGGAAGCGGC ACAAACCGGC 
TGCGCCGGAC TTGATTTTAA TTCTGCTGTA GAGTCGCAAC CGGGCATCAA AGACGCACGT 
CTTTTGGCCT CGGTTTTCCA GACGCTGCGC GCATATTAA

Protein sequence

MQTVLAKIVA DKAIWVETRK QQQPLASFQN EVQPSTRHFY DALQGARTAF ILECKKASPS 
KGVIRDDFDP ARIAAIYKHY ASAISVLTDE KYFQGSFDFL PIVSQIAPQP ILCKDFIIDP 
YQIYLARYYQ ADACLLMLSV LDDEQYRQLA AVAHSLEMGV LTEVSNEEEL ERAIALGAKV 
VGINNRDLRD LSIDLNRTRE LAPKLGHNVT VISESGINTY AQVRELSHFA NGFLIGSALM 
AHDDLHAAVR RVLLGENKVC GLTRGQDAKA AYDAGAIYGG LIFVATSPRC VNVEQAQEVM 
AAAPLQYVGV FRNHDIADVV DKAKVLSLAA VQLHGNEDQL YIDTLREALP AHVAIWKALS 
VGETLPAREL QHVDKYVLDN GQGGSGQRFD WSLLNGQSLG NVLLAGGLGA DNCVEAAQTG 
CAGLDFNSAV ESQPGIKDAR LLASVFQTLR AY