Gene EcDH1_2386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2386
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2559892
End bp	2561250
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	53%
IMG OID
Product	Indole-3-glycerol-phosphate synthase., Phosphoribosylanthranilate isomerase
Protein accession	ACX40029
Protein GI	260449607
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.427642
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACCG TTTTAGCGAA AATCGTCGCA GACAAGGCGA TTTGGGTAGA AGCCCGCAAA 
CAGCAGCAAC CGCTGGCCAG TTTTCAGAAT GAGGTTCAGC CGAGCACGCG ACATTTTTAT 
GATGCGCTAC AGGGTGCGCG CACGGCGTTT ATTCTGGAGT GCAAGAAAGC GTCGCCGTCA 
AAAGGCGTGA TCCGTGATGA TTTCGATCCA GCACGCATTG CCGCCATTTA TAAACATTAC 
GCTTCGGCAA TTTCGGTGCT GACTGATGAG AAATATTTTC AGGGGAGCTT TAATTTCCTC 
CCCATCGTCA GCCAAATCGC CCCGCAGCCG ATTTTATGTA AAGACTTCAT TATCGACCCT 
TACCAGATCT ATCTGGCGCG CTATTACCAG GCCGATGCCT GCTTATTAAT GCTTTCAGTA 
CTGGATGACG ACCAATATCG CCAGCTTGCC GCCGTCGCTC ACAGTCTGGA GATGGGGGTG 
CTGACCGAAG TCAGTAATGA AGAGGAACAG GAGCGCGCCA TTGCATTGGG AGCAAAGGTC 
GTTGGCATCA ACAACCGCGA TCTGCGTGAT TTGTCGATTG ATCTCAACCG TACCCGCGAG 
CTTGCGCCGA AACTGGGGCA CAACGTGACG GTAATCAGCG AATCCGGCAT CAATACTTAC 
GCTCAGGTGC GCGAGTTAAG CCACTTCGCT AACGGTTTTC TGATTGGTTC GGCGTTGATG 
GCCCATGACG ATTTGCACGC CGCCGTGCGC CGGGTGTTGC TGGGTGAGAA TAAAGTATGT 
GGCCTGACGC GTGGGCAAGA TGCTAAAGCA GCTTATGACG CGGGCGCGAT TTACGGTGGG 
TTGATTTTTG TTGCGACATC ACCGCGTTGC GTCAACGTTG AACAGGCGCA GGAAGTGATG 
GCTGCGGCAC CGTTGCAGTA TGTTGGCGTG TTCCGCAATC ACGATATTGC CGATGTGGTG 
GACAAAGCTA AGGTGTTATC GCTGGCGGCA GTGCAACTGC ATGGTAATGA AGAACAGCTG 
TATATCGATA CGCTGCGTGA AGCTCTGCCA GCACATGTTG CCATCTGGAA AGCATTAAGC 
GTCGGTGAAA CCCTGCCCGC CCGCGAGTTT CAGCACGTTG ATAAATATGT TTTAGACAAC 
GGCCAGGGTG GAAGCGGGCA ACGTTTTGAC TGGTCACTAT TAAATGGTCA ATCGCTTGGC 
AACGTTCTGC TGGCGGGGGG CTTAGGCGCA GATAACTGCG TGGAAGCGGC ACAAACCGGC 
TGCGCCGGAC TTGATTTTAA TTCTGCTGTA GAGTCGCAAC CGGGCATCAA AGACGCACGT 
CTTTTGGCCT CGGTTTTCCA GACGCTGCGC GCATATTAA

Protein sequence

MQTVLAKIVA DKAIWVEARK QQQPLASFQN EVQPSTRHFY DALQGARTAF ILECKKASPS 
KGVIRDDFDP ARIAAIYKHY ASAISVLTDE KYFQGSFNFL PIVSQIAPQP ILCKDFIIDP 
YQIYLARYYQ ADACLLMLSV LDDDQYRQLA AVAHSLEMGV LTEVSNEEEQ ERAIALGAKV 
VGINNRDLRD LSIDLNRTRE LAPKLGHNVT VISESGINTY AQVRELSHFA NGFLIGSALM 
AHDDLHAAVR RVLLGENKVC GLTRGQDAKA AYDAGAIYGG LIFVATSPRC VNVEQAQEVM 
AAAPLQYVGV FRNHDIADVV DKAKVLSLAA VQLHGNEEQL YIDTLREALP AHVAIWKALS 
VGETLPAREF QHVDKYVLDN GQGGSGQRFD WSLLNGQSLG NVLLAGGLGA DNCVEAAQTG 
CAGLDFNSAV ESQPGIKDAR LLASVFQTLR AY