Gene SbBS512_E1487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1487
Symbol	trpC
ID	6270562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	1355296
End bp	1356657
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	53%
IMG OID	641725587
Product	bifunctional indole-3-glycerol phosphate synthase/phosphoribosylanthranilate isomerase
Protein accession	YP_001880093
Protein GI	187731266
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0134] Indole-3-glycerol phosphate synthase [COG0135] Phosphoribosylanthranilate isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCAAA CCGTTTTAGC GAAAATCGTC GCAGACAAGG CGATTTGGGT AGAAACCCGC 
AAACAGCAGC AACCGCTGGC CAGTTTTCAG AATGAGGTTC AGCCGAGCAC GCGACATTTT 
TATGATGCGC TACAGGGTGC ACGCACGGCG TTTATTCTGG AGTGCAAGAA AGCGTCGCCG 
TCAAAAGGCG TGATCCGTGA TGATTTCGAT CCGGCACGCA TTGCCGCCAT TTATAAACAT 
TACGCTTCGG CAATTTCGGT GCTGACTGAT GAGAAATATT TTCAGGGGAG CTTTGATTTC 
CTCCCCATCG TCAGCCAAAT CGCCCCGCAG CCGATTTTAT GTAAAGACTT CATTATCGAC 
CCTTACCAGA TCTATCTGGC GCGCTATTAC CAGGCCGATG CCTGCTTATT AATGCTTTCA 
GTACTGGATG ACGACCAATA TCGCCAGCTT GCAGCCGTCG CTCACAGTCT GGAGATGGGG 
GGGCTGACCG AAGTCAGTAA TGAAGAGGAA CTGGAGCGCG CCATTGCATT AGGGGCAAAG 
GTCGTTGGCA TCAACAACCG CGATCTGCGT GATTTGTCGA TTGATCTCAA CCGTACCCGC 
GAGCTTGCGC CGAAACTGGG GCACAACGTA ACGGTAATCA GCGAATCCGG CATCAATACT 
TACGCTCAGG TGCGCGAGTT AAGCCACTTC GCTAACGGTT TTCTGATTGG TTCGGCGTTG 
ATGGCCCATG ACGATTTGCA CGCCGCCGTG CGCCGGGTGT TGCTGGGTGA GAATAAAGTA 
TGTGGCCTGA CGCGTGGGCA AGATGCTAAA GCAGCTTATG ACGCGGGCGC GATTTACGGT 
GGGTTGATTT TTGTCGCGAC ATCACCGCGT TGCGTCAACG TTGAACAGGC GCAGGAAGTG 
ATGGCTGCGG CACCGTTGCA GTATGTTGGC GTGTTCCGCA ATCACGATAT TGCCGATGTG 
GTGGACAAAG CTAAGGTGTT ATCGCTGGCG GCAGTGCAAC TGCATGGTAA TGAAGATCAG 
CTGTATATCG ATACGCTGCG TGAAGCTCTG CCAGCACATG TTGCCATCTG GAAAGCATTA 
AGCGTCGGTG AAACCCTGCC CGCCCGCGAG TTTCAGCACG TTGATAAATA TGTTTTAGAC 
AACGGCCAGG GTGGAAGCGG GCAACGTTTT GACTGGTCAC TATTAAATGG TCAATCGCTT 
GGCAACGTTC TGCTGGCGGG GGGCTTAGGC GCAGATAACT GCGTGGAAGC GGCACAAACC 
GGCTGCGCCG GACTTGATTT TAATTCTGCT GTAGAGTCGC AACCGGGCAT CAAAGACGCA 
CGTCTTTTGG CCTCGGTTTT CCAGACGCTG CGCGCATATT AA

Protein sequence

MMQTVLAKIV ADKAIWVETR KQQQPLASFQ NEVQPSTRHF YDALQGARTA FILECKKASP 
SKGVIRDDFD PARIAAIYKH YASAISVLTD EKYFQGSFDF LPIVSQIAPQ PILCKDFIID 
PYQIYLARYY QADACLLMLS VLDDDQYRQL AAVAHSLEMG GLTEVSNEEE LERAIALGAK 
VVGINNRDLR DLSIDLNRTR ELAPKLGHNV TVISESGINT YAQVRELSHF ANGFLIGSAL 
MAHDDLHAAV RRVLLGENKV CGLTRGQDAK AAYDAGAIYG GLIFVATSPR CVNVEQAQEV 
MAAAPLQYVG VFRNHDIADV VDKAKVLSLA AVQLHGNEDQ LYIDTLREAL PAHVAIWKAL 
SVGETLPARE FQHVDKYVLD NGQGGSGQRF DWSLLNGQSL GNVLLAGGLG ADNCVEAAQT 
GCAGLDFNSA VESQPGIKDA RLLASVFQTL RAY