Gene ECD_02442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02442
Symbol	yphH
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	2548668
End bp	2549861
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	51%
IMG OID
Product	predicted DNA-binding transcriptional regulator
Protein accession	ACT44262
Protein GI	253978592
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGCCT GCATTAACAA TCAACAGATT CGCCACAATA ACAAATGCGT GATTCTGGAA 
CTGCTGTACC GGCAAAAGCG CGCCAATAAA TCAACGCTGG CCCGGCTGGC GCAAATTTCG 
ATTCCGGCGG TCAGTAATAT TTTGCAGGAA CTGGAAAGCG AAAAACGGGT GGTGAATATC 
GACGATGAAA GTCAGACGCG CGGGCATAGT AGCGGTACAT GGCTGATTGC GCCGGAAGGT 
GACTGGACGC TGTGCCTGAA CGTGACGCCC ACCAGTATTG AGTGTCAGGT TGCTAATGCT 
TGTTTAAGTC CGAAAGGCGA GTTTGAGTAT TTACAGATTG ATGCACCGAC GCCGCAGGCG 
CTGCTGTCCG AAATCGAAAA ATGCTGGCAT CGCCACCGTA AATTGTGGCC GGACCGTACC 
ATCAACCTGG CGCTGGCAAT CCACGGTCAG GTTGATCCGG TGACCGGCGT GTCGCAAACC 
ATGCCGCAAG CGCCGTGGAC AACGCCGGTT GAGGTAAAGT ATCTGCTGGA AGAGAAGCTC 
GGCATTCGGG TGATGGTCGA TAATGACTGC GTGATGCTGG CGCTCGCGGA GAAATGGCAA 
AATAATTCGC AGGAACGGGA TTTCTGCGTG ATCAACGTTG ATTACGGCAT TGGCTCGTCG 
TTCGTGATTA ACGAGCAAAT TTATCGCGGC AGTTTGTATG GTAGCGGACA GATTGGTCAC 
ACCATCGTTA ATCCGGATGG CGTCGTCTGC GACTGTGGAC GTTACGGCTG CCTGGAAACC 
GTCGCCTCGT TAAGCGCATT AAAAAAACAG GCGCGGGTAT GGCTAAAATC ACAACCGGTT 
AGTACTCAAC TTGATCCTGA AAAACTGACT ACAGCGCAGT TAATCGCTGC CTGGCAAAGT 
GGAGAACCGT GGATCACCAG CTGGGTTGAC CGCAGTGCCA ATGCCATTGG TTTGAGTCTG 
TATAACTTCC TCAACATCCT CAATATTAAT CAGATTTGGT TGTACGGTCG CAGTTGTGCC 
TTTGGTGAGA ACTGGCTTAA TACTATTATT CGCCAGACAG GATTTAACCC GTTCGACCGC 
GACGAAGGAC CGAGCGTGAA AGCGACGCAA ATTGGCTTCG GGCAATTAAG CCGCGCACAA 
CAGGTGCTGG GAATTGGCTA TTTGTATGTT GAGGCGCAGT TACGACAGAT TTGA

Protein sequence

MRACINNQQI RHNNKCVILE LLYRQKRANK STLARLAQIS IPAVSNILQE LESEKRVVNI 
DDESQTRGHS SGTWLIAPEG DWTLCLNVTP TSIECQVANA CLSPKGEFEY LQIDAPTPQA 
LLSEIEKCWH RHRKLWPDRT INLALAIHGQ VDPVTGVSQT MPQAPWTTPV EVKYLLEEKL 
GIRVMVDNDC VMLALAEKWQ NNSQERDFCV INVDYGIGSS FVINEQIYRG SLYGSGQIGH 
TIVNPDGVVC DCGRYGCLET VASLSALKKQ ARVWLKSQPV STQLDPEKLT TAQLIAAWQS 
GEPWITSWVD RSANAIGLSL YNFLNILNIN QIWLYGRSCA FGENWLNTII RQTGFNPFDR 
DEGPSVKATQ IGFGQLSRAQ QVLGIGYLYV EAQLRQI