Gene ECD_00271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00271
Symbol	yahA
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	301999
End bp	303087
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	46%
IMG OID
Product	predicted DNA-binding transcriptional regulator
Protein accession	ACT42170
Protein GI	253976500
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.809643
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTCAT GTGATTTTCG TGTTTTTCTG CAAGAGTTCG GTACAACGGT TCATTTGTCA 
TTGCCTGGTA GCGTATCCGA GAAAGAACGA CTGCTACTCA AGCTGCTGAT GCAGGGAATG 
TCTGTAACAG AAATATCACA GTACAGAAAT CGCAGTGCAA AGACAATTTC ACATCAAAAG 
AAACAGCTCT TTGAGAAACT GGGGATTCAG AGCGATATTA CTTTCTGGCG CGATATTTTC 
TTTCAGTACA ATCCGGAGAT CATATCCGCC ACGGGGAGTA ATAGTCACAG ATATATTAAT 
GATAATCACT ATCACCATAT CGTCACGCCT GAAGCCATCA GTCTGGCGTT GGAAAACCAC 
GAATTCAAAC CGTGGATCCA ACCGGTTTTC TGCGCGCAGA CTGGGGTACT GACGGGCTGT 
GAGGTGCTTG TCCGCTGGGA ACATCCACAA ACGGGAATTA TCCCACCGGA TCAGTTTATT 
CCTCTGGCGG AGTCATCCGG TCTTATTGTC ATAATGACCC GCCAACTGAT GAAACAGACT 
GCGGATATTC TGATGCCGGT AAAACATTTG CTGCCGGACA ATTTCCATAT TGGCATCAAC 
GTCTCGGCGG GTTGTTTTTT GGCAGCGGGA TTTGAAAAAG AGTGTCTGAA CCTGGTTAAT 
AAATTAGGTA ACGATAAAAT CAAGCTGGTT CTCGAGCTAA CGGAACGTAA CCCTATTCCG 
GTAACGCCAG AAGCCAGAGC GATATTTGAC AGCCTTCATC AGCACAACAT TACCTTTGCG 
CTGGATGACT TTGGTACGGG TTATGCGACC TATCGTTACT TGCAGGCGTT CCCGGTCGAT 
TTTATTAAGA TCGATAAGTC ATTTGTGCAA ATGGCGAGTG TCGACGAAAT CTCCGGTCAT 
ATTGTGGACA ATATTGTCGA ACTAGCGCGT AAGCCTGGTC TGAGTATCGT GGCGGAAGGG 
GTAGAAACCC AGGAGCAGGC GGATTTAATG ATCGGTAAAG GCGTTCACTT TTTGCAGGGC 
TATTTGTACT CTCCGCCAGT ACCGGGTAAT AAATTTATCT CTGAATGGGT AATGAAAGCA 
GGTGGTTGA

Protein sequence

MNSCDFRVFL QEFGTTVHLS LPGSVSEKER LLLKLLMQGM SVTEISQYRN RSAKTISHQK 
KQLFEKLGIQ SDITFWRDIF FQYNPEIISA TGSNSHRYIN DNHYHHIVTP EAISLALENH 
EFKPWIQPVF CAQTGVLTGC EVLVRWEHPQ TGIIPPDQFI PLAESSGLIV IMTRQLMKQT 
ADILMPVKHL LPDNFHIGIN VSAGCFLAAG FEKECLNLVN KLGNDKIKLV LELTERNPIP 
VTPEARAIFD SLHQHNITFA LDDFGTGYAT YRYLQAFPVD FIKIDKSFVQ MASVDEISGH 
IVDNIVELAR KPGLSIVAEG VETQEQADLM IGKGVHFLQG YLYSPPVPGN KFISEWVMKA 
GG