Gene EcHS_A1127 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1127
Symbol
ID	5594518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1135161
End bp	1136342
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	55%
IMG OID	640920290
Product	putative monooxygenase rutA
Protein accession	YP_001457854
Protein GI	157160536
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03612] pyrimidine utilization protein A

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCAAACAA GCCATTACGC GGCTGAAAAG GATATGCAGG ACGCAGTGCC CCGTCTGACT 
TTCACTTTAC GAGACGAAGA GAGGTTGATG ATGAAAATTG GCGTATTCGT ACCTATTGGC 
AACAACGGCT GGCTCATTTC GACCCACGCG CCGCAGTACA TGCCGACCTT TGAACTGAAT 
AAAGCCATCG TGCAAAAAGC GGAGCACTAC CATTTCGATT TCGCCCTGTC GATGATCAAA 
CTGCGTGGCT TTGGCGGCAA AACTGAGTTC TGGGATCACA ACCTTGAGTC GTTCACCTTG 
ATGGCGGGGC TGGCGGCCGT GACCTCGCGC ATTCAGATTT ACGCCACCGC CGCCACCTTA 
ACGTTACCTC CAGCAATCGT CGCCCGTATG GCCGCAACCA TCGACTCAAT CTCTGGCGGG 
CGTTTTGGCG TCAACCTCGT GACTGGCTGG CAAAAGCCCG AGTATGAGCA GATGGGTATC 
TGGCCTGGCG ATGACTATTT CTCCCGTCGT TACGACTATC TCACCGAGTA TGTTCAGGTG 
CTGCGCGACC TGTGGGGCAC GGGAAAAAGC GATTTTAAAG GCGATTTTTT CACCATGAAT 
GATTGTCGCG TCAGTCCGCA ACCGAGTGTC CCTATGAAAG TGATCTGCGC CGGGCAAAGC 
GACGCTGGCA TGGCGTTCTC CGCCCAGTAT GCCGATTTCA ACTTCTGTTT CGGCAAAGGC 
GTAAATACAC CCACGGCTTT CGCCCCGACC GCTGCGCGGA TGAAACAGGC CGCAGAGCAA 
ACCGGGCGCG ACGTTGGCTC TTATGTATTG TTTATGGTGA TTGCCGATGA AACCGACGAT 
GCCGCTCGCG CCAAATGGGA ACACTACAAA GCGGGCGCGG ATGAAGAGGC GTTAAGCTGG 
CTAACCGAAC AAAGTCAGAA AGATACCCGC TCAGGTACTG ACACCAACGT CCGTCAGATG 
GCCGATCCCA CTTCGGCGGT AAACATCAAT ATGGGGACGT TAGTCGGTTC TTACGCCAGT 
GTCGCGCGCA TGTTAGATGA AGTCGCAAGC GTGCCTGGTG CCGAAGGCGT GCTGTTAACC 
TTCGACGATT TTCTGTCGGG AATCGAAACC TTCGGCGAGC GCATTCAACC ACTGATGCAG 
TGCCGCGCCC ATCTCCCTGT GCTGACTCAG GAGGTGGCAT GA

Protein sequence

MQTSHYAAEK DMQDAVPRLT FTLRDEERLM MKIGVFVPIG NNGWLISTHA PQYMPTFELN 
KAIVQKAEHY HFDFALSMIK LRGFGGKTEF WDHNLESFTL MAGLAAVTSR IQIYATAATL 
TLPPAIVARM AATIDSISGG RFGVNLVTGW QKPEYEQMGI WPGDDYFSRR YDYLTEYVQV 
LRDLWGTGKS DFKGDFFTMN DCRVSPQPSV PMKVICAGQS DAGMAFSAQY ADFNFCFGKG 
VNTPTAFAPT AARMKQAAEQ TGRDVGSYVL FMVIADETDD AARAKWEHYK AGADEEALSW 
LTEQSQKDTR SGTDTNVRQM ADPTSAVNIN MGTLVGSYAS VARMLDEVAS VPGAEGVLLT 
FDDFLSGIET FGERIQPLMQ CRAHLPVLTQ EVA