Gene ECD_01237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_01237
Symbol	trpD
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	1305381
End bp	1306976
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	56%
IMG OID
Product	bifunctional indole-3-glycerol-phosphate synthase/anthranilate phosphoribosyltransferase
Protein accession	ACT43127
Protein GI	253977457
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGACA TTCTGCTGCT CGATAATATC GACTCTTTTA CGTACAACCT GGCAGATCAG 
TTGCGCAGCA ATGGTCATAA CGTGGTGATT TACCGCAACC ATATTCCGGC GCAGACCTTA 
ATTGAACGCC TGGCGACGAT GAGCAATCCG GTACTGATGC TTTCTCCTGG CCCCGGTGTG 
CCGAGCGAAG CCGGTTGTAT GCCGGAACTC CTCACCCGCT TGCGTGGCAA GCTGCCCATT 
ATTGGCATTT GCCTCGGACA TCAGGCAATT GTCGAAGCTT ACGGGGGCTA TGTCGGTCAG 
GCGGGCGAAA TTCTTCACGG TAAAGCGTCG AGCATTGAAC ATGACGGTCA GGCGATGTTT 
GCCGGATTAA CAAACCCGCT GCCGGTGGCG CGTTATCACT CGCTGGTTGG CAGTAACATT 
CCGGCCGGTT TAACCATCAA CGCCCATTTT AATGGCATGG TGATGGCAGT ACGTCACGAT 
GCGGATCGCG TTTGTGGATT CCAGTTCCAT CCGGAATCCA TTCTCACCAC CCAGGGCGCT 
CGCCTGCTGG AACAAACGCT GGCCTGGGCG CAGCAGAAAC TAGAGCCAGC CAACACGCTG 
CAACCGATTC TGGAAAAACT GTATCAGGCG CAGACGCTTA GCCAACAAGA AAGCCACCAG 
CTGTTTTCAG CGGTGGTGCG TGGCGAGCTG AAGCCGGAAC AACTGGCGGC GGCGCTGGTG 
AGCATGAAAA TTCGCGGTGA GCACCCGAAC GAGATCGCCG GAGCAGCAAC CGCGCTACTG 
GAAAACGCCG CGCCGTTCCC GCGCCCGGAT TATCTGTTTG CTGATATCGT CGGTACTGGC 
GGTGACGGCA GCAACAGTAT CAATATTTCT ACCGCCAGTG CGTTTGTCGC CGCGGCCTGT 
GGGCTGAAAG TGGCGAAACA CGGCAACCGT AGCGTCTCCA GTAAATCTGG TTCGTCCGAT 
CTGCTGGCGG CGTTCGGTAT TAATCTTGAT ATGAACGCCG ATAAATCGCG CCAGGCGCTG 
GATGAGTTAG GTGTATGTTT CCTCTTTGCG CCGAAGTATC ACACCGGATT CCGCCACGCG 
ATGCCGGTTC GCCAGCAACT GAAAACCCGC ACCCTGTTCA ATGTGCTGGG GCCATTGATT 
AACCCGGCGC ATCCGCCGCT GGCGTTAATT GGTGTTTATA GTCCGGAACT GGTGCTGCCG 
ATTGCCGAAA CCTTGCGCGT GCTGGGGTAT CAACGCGCGG CGGTGGTGCA CAGCGGCGGG 
ATGGATGAAG TTTCATTACA CGCGCCGACA ATCGTTGCCG AGCTGCATGA CGGCGAAATT 
AAGAGCTATC AATTGACCGC TGAAGATTTT GGCCTGACTC CCTACCACCA GGAGCAACTG 
GCAGGCGGAA CACCGGAAGA AAACCGTGAC ATTTTAACAC GCTTGTTACA AGGTAAAGGC 
GACGCCGCCC ATGAAGCAGC CGTCGCTGCG AACGTCGCCA TGTTAATGCG CCTGCATGGC 
CATGAAGATC TGCAAGCCAA TGCGCAAACC GTTCTTGAGG TACTGCGCAG TGGTTCCGCT 
TACGACAGAG TTACCGCACT GGCGGCACGA GGGTAA

Protein sequence

MADILLLDNI DSFTYNLADQ LRSNGHNVVI YRNHIPAQTL IERLATMSNP VLMLSPGPGV 
PSEAGCMPEL LTRLRGKLPI IGICLGHQAI VEAYGGYVGQ AGEILHGKAS SIEHDGQAMF 
AGLTNPLPVA RYHSLVGSNI PAGLTINAHF NGMVMAVRHD ADRVCGFQFH PESILTTQGA 
RLLEQTLAWA QQKLEPANTL QPILEKLYQA QTLSQQESHQ LFSAVVRGEL KPEQLAAALV 
SMKIRGEHPN EIAGAATALL ENAAPFPRPD YLFADIVGTG GDGSNSINIS TASAFVAAAC 
GLKVAKHGNR SVSSKSGSSD LLAAFGINLD MNADKSRQAL DELGVCFLFA PKYHTGFRHA 
MPVRQQLKTR TLFNVLGPLI NPAHPPLALI GVYSPELVLP IAETLRVLGY QRAAVVHSGG 
MDEVSLHAPT IVAELHDGEI KSYQLTAEDF GLTPYHQEQL AGGTPEENRD ILTRLLQGKG 
DAAHEAAVAA NVAMLMRLHG HEDLQANAQT VLEVLRSGSA YDRVTALAAR G