Gene EcDH1_3091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3091
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3318361
End bp	3319428
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	56%
IMG OID
Product	phosphoribosylaminoimidazole carboxylase, ATPase subunit
Protein accession	ACX40717
Protein GI	260450295
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0000683075
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAGG TTTGCGTCCT CGGTAACGGG CAGTTAGGCC GTATGCTGCG TCAGGCAGGC 
GAACCGTTAG GCATTGCTGT CTGGCCAGTC GGGCTGGACG CTGAACCGGC GGCGGTGCCT 
TTTCAACAAA GCGTGATTAC CGCTGAGATA GAACGCTGGC CGGAAACCGC ATTAACCCGC 
GAGCTGGCGC GCCATCCGGC CTTTGTGAAC CGCGATGTGT TCCCGATTAT TGCTGACCGT 
CTGACTCAGA AGCAGCTTTT CGATAAGCTC CACCTGCCGA CTGCACCGTG GCAGTTACTT 
GCCGAACGCA GCGAGTGGCC TGCGGTGTTT GATCGTTTAG GTGAGCTGGC GATTGTTAAG 
CGTCGCACTG GTGGTTATGA CGGTCGCGGT CAATGGCGTT TACGCGCAAA TGAAACCGAA 
CAGTTACCGG CAGAGTGTTA CGGCGAATGT ATTGTCGAGC AGGGCATTAA CTTCTCTGGT 
GAAGTGTCGC TGGTTGGCGC GCGCGGCTTT GATGGCAGCA CCGTGTTTTA TCCGCTGACG 
CATAACCTGC ATCAGGACGG TATTTTGCGC ACCAGCGTCG CTTTTCCGCA GGCCAACGCA 
CAGCAGCAGG CGCAAGCCGA AGAGATGCTG TCGGCGATTA TGCAGGAGCT GGGCTATGTG 
GGCGTGATGG CGATGGAGTG TTTTGTCACC CCGCAAGGTC TGTTGATCAA CGAACTGGCA 
CCGCGTGTGC ATAACAGCGG TCACTGGACA CAAAACGGTG CCAGCATCAG CCAGTTTGAG 
CTGCATCTGC GGGCGATTAC CGATCTGCCG TTACCGCAAC CAGTGGTGAA TAATCCGTCG 
GTGATGATCA ATCTGATTGG TAGCGATGTG AATTATGACT GGCTGAAACT GCCGCTGGTG 
CATCTGCACT GGTACGACAA AGAAGTCCGT CCGGGGCGTA AAGTGGGGCA TCTGAATTTG 
ACCGACAGCG ACACATCGCG TCTGACTGCG ACGCTGGAAG CCTTAATCCC GCTGCTGCCG 
CCGGAATATG CCAGCGGCGT GATTTGGGCG CAGAGTAAGT TCGGTTAA

Protein sequence

MKQVCVLGNG QLGRMLRQAG EPLGIAVWPV GLDAEPAAVP FQQSVITAEI ERWPETALTR 
ELARHPAFVN RDVFPIIADR LTQKQLFDKL HLPTAPWQLL AERSEWPAVF DRLGELAIVK 
RRTGGYDGRG QWRLRANETE QLPAECYGEC IVEQGINFSG EVSLVGARGF DGSTVFYPLT 
HNLHQDGILR TSVAFPQANA QQQAQAEEML SAIMQELGYV GVMAMECFVT PQGLLINELA 
PRVHNSGHWT QNGASISQFE LHLRAITDLP LPQPVVNNPS VMINLIGSDV NYDWLKLPLV 
HLHWYDKEVR PGRKVGHLNL TDSDTSRLTA TLEALIPLLP PEYASGVIWA QSKFG