Gene ECD_02898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02898
Symbol	ygiY
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	3037921
End bp	3039270
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	53%
IMG OID
Product	sensory histidine kinase in two-component regulatory system with QseB
Protein accession	ACT44702
Protein GI	253979032
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.760394
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTTA CCCAACGTCT TAGTCTGCGC GTCAGGCTGA CGCTAATCTT TTTAATTCTG 
GCCTCGGTGA CCTGGCTGCT TTCCAGCTTT GTCGCCTGGA AACAAACAAC GGATAACGTC 
GATGAATTGT TCGACACCCA ACTGATGCTG TTTGCCAAGC GGTTAAGTAC GCTCGATCTC 
AACGAAATCA ACGCGGCGGA TCGCATGGCA CAGACGCCAA ATAGATTAAA ACACGGTCAT 
GTTGATGACG ATGCGCTGAC CTTTGCCATC TTTACCCACG ACGGCAGAAT GGTCCTTAAT 
GATGGCGATA ACGGAGAAGA TATTCCCTAT AGCTATCAAC GGGAAGGTTT TGCTGACGGG 
CAACTGGTCG GTGAAGACGA TCCTTGGCGT TTTGTCTGGA TGACCTCACC TGATGGCAAA 
TATCGCATCG TTGTTGGCCA GGAATGGGAA TACCGTGAAG ACATGGCGCT GGCGATTGTT 
GCCGGGCAAT TGATCCCGTG GCTGGTCGCA CTGCCGATTA TGTTAATCAT CATGATGGTA 
CTACTGGGTC GTGAACTCGC GCCGCTGAAC AAACTGGCGC TGGCACTACG TATGCGTGAC 
CCTGACTCGG AAAAACCACT AAACGCGACT GGCGTACCCA GCGAAGTGCG GCCACTGGTT 
GAGTCGCTAA ATCAACTGTT CGCCCGCACA CATGCGATGA TGGTTCGTGA ACGACGCTTT 
ACCTCCGACG CAGCTCACGA ACTTCGTAGC CCGTTAACGG CGCTGAAAGT GCAAACCGAA 
GTTGCGCAGC TCTCTGACGA TGATCCGCAG GCGCGGAAAA AAGCACTGCT CCAATTACAT 
TCCGGGATCG ATCGCGCTAC TCGTCTGGTT GATCAACTGC TCACGCTATC GCGGCTGGAC 
TCACTGGATA ACCTTCAGGA CGTCGCGGAG ATCCCGCTTG AAGATCTCCT GCAATCGTCG 
GTGATGGATA TTTACCACAC GGCGCAGCAG GCGAAAATTG ACGTGCGACT GACACTCAAT 
GCCCACAGCA TCAAACGCAC CGGGCAACCG CTATTGCTAA GTTTGTTGGT GCGAAATTTG 
CTGGATAACG CCGTGCGCTA CAGTCCACAG GGCAGCGTGG TAGACGTCAC GCTGAATGCT 
GATAATTTCA TCGTGAGGGA TAACGGCCCC GGTGTGACAC CAGAGGCACT GGCGCGAATT 
GGCGAACGCT TCTATCGCCC ACCCGGACAA ACCGCTACCG GCAGCGGGCT TGGGCTATCG 
ATTGTCCAGC GAATCGCCAA ATTGCATGGC ATGAATGTTG AATTTGGGAA TGCGGAACAA 
GGTGGATTTG AGGCGAAGGT AAGCTGGTAA

Protein sequence

MKFTQRLSLR VRLTLIFLIL ASVTWLLSSF VAWKQTTDNV DELFDTQLML FAKRLSTLDL 
NEINAADRMA QTPNRLKHGH VDDDALTFAI FTHDGRMVLN DGDNGEDIPY SYQREGFADG 
QLVGEDDPWR FVWMTSPDGK YRIVVGQEWE YREDMALAIV AGQLIPWLVA LPIMLIIMMV 
LLGRELAPLN KLALALRMRD PDSEKPLNAT GVPSEVRPLV ESLNQLFART HAMMVRERRF 
TSDAAHELRS PLTALKVQTE VAQLSDDDPQ ARKKALLQLH SGIDRATRLV DQLLTLSRLD 
SLDNLQDVAE IPLEDLLQSS VMDIYHTAQQ AKIDVRLTLN AHSIKRTGQP LLLSLLVRNL 
LDNAVRYSPQ GSVVDVTLNA DNFIVRDNGP GVTPEALARI GERFYRPPGQ TATGSGLGLS 
IVQRIAKLHG MNVEFGNAEQ GGFEAKVSW