Gene EcolC_1849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1849
Symbol
ID	6065589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2047846
End bp	2049780
Gene Length	1935 bp
Protein Length	644 aa
Translation table	11
GC content	50%
IMG OID	641601263
Product	putative serine protein kinase, PrkA
Protein accession	YP_001724825
Protein GI	170019871
COG category	[T] Signal transduction mechanisms
COG ID	[COG2766] Putative Ser protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.159984
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0123748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATAT TCGATCACTA TCGCCAGCGA TATGAAGCTG CCAAGGACGA AGAGTTCACA 
CTGCAGGAGT TTCTTACCAC TTGTCGGCAA GATCGCAGTG CTTATGCCAA CGCGGCTGAG 
CGGCTATTGA TGGCTATCGG TGAGCCTGTC ATGGTCGATA CAGCCCAGGA ACCCAGACTT 
TCTCGACTCT TTTCTAACCG GGTCATTGCA CGTTATCCGG CGTTTGAAGA GTTTTACGGC 
ATGGAAGACG CGATTGAACA GATTGTCTCT TATCTGAAAC ACGCGGCTCA GGGGCTGGAA 
GAGAAGAAAC AAATCCTGTA TCTGCTGGGG CCTGTGGGTG GGGGTAAATC ATCGCTTGCT 
GAGCGACTGA AATCATTAAT GCAGCTCGTA CCGATTTATG TATTGAGCGC GAACGGTGAG 
CGTAGCCCGG TCAACGATCA TCCGTTCTGT CTTTTCAATC CGCAGGAAGA TGCGCAGATT 
CTGGAAAAAG AGTATGGCAT TCCTCGCCGT TATCTCGGCA CCATCATGTC GCCGTGGGCG 
GCAAAACGCC TGCATGAATT TGGTGGCGAT ATCACTAAGT TCCGGGTAGT GAAGGTCTGG 
CCGTCAATTC TGCAACAAAT TGCTATCGCC AAAACGGAAC CCGGCGATGA GAATAACCAG 
GACATCTCCG CGCTGGTTGG GAAAGTCGAT ATTCGTAAAC TCGAACACTA CGCGCAGAAT 
GACCCGGACG CCTACGGCTA TTCCGGTGCG CTGTGCCGCG CCAATCAGGG GATCATGGAA 
TTCGTTGAGA TGTTTAAAGC ACCGATTAAA GTGCTGCATC CCTTGTTAAC CGCCACTCAG 
GAAGGTAACT ACAACGGGAC GGAAGGTATC TCCGCCCTGC CGTTCAACGG GATTATTCTC 
GCACACTCGA ACGAGTCCGA ATGGGTCACT TTCCGTAATA ACAAAAACAA CGAAGCCTTC 
CTCGATCGTG TTTACATCGT GAAGGTGCCG TATTGCTTGC GCATTTCCGA AGAGATCAAA 
ATCTACGAGA AATTGCTTAA TCACAGTGAA TTGACTCACG CCCCATGCGC CCCTGGCACG 
CTCGAAACAC TGTCACGTTT TTCCATTCTT TCGCGCCTGA AAGAGCCAGA AAACTCCAGC 
ATTTATTCAA AGATGCGGGT TTATGATGGC GAAAGTCTGA AAGACACCGA TCCCAAAGCC 
AAGTCGTATC AGGAATATCG TGACTACGCC GGTGTCGATG AAGGGATGAA CGGTCTGTCG 
ACGCGTTTTG CGTTTAAGAT CCTCTCCCGC GTGTTCAACT TCGATCATGT AGAAGTGGCA 
GCAAACCCGG TCCATCTGTT CTACGTCCTG GAACAGCAGA TTGAGCGCGA GCAGTTCCCA 
CAAGAGCAGG CAGAACGCTA TCTGGAGTTC CTGAAAGGTT ATCTGATCCC GAAATATGCC 
GAGTTTATCG GCAAAGAGAT CCAGACGGCC TACCTTGAAT CCTATTCCGA ATATGGGCAA 
AACATTTTCG ACCGTTATGT TACCTACGCG GATTTCTGGA TTCAGGATCA GGAGTATCGC 
GATCCGGATA CCGGGCAGCT GTTTGACCGC GAGTCTCTTA ACGCCGAGCT GGAGAAAATC 
GAGAAACCGG CGGGGATCAG TAATCCAAAA GATTTCCGCA ACGAGATTGT TAACTTCGTA 
CTGCGCGCCA GAGCGAATAA CAGCGGACGC AATCCGAACT GGACCAGCTA TGAAAAACTG 
CGCACGGTCA TCGAGAAGAA AATGTTCTCC AATACCGAGG AGCTGTTGCC GGTTATCTCG 
TTTAACGCCA AAACGTCAAC CGACGAGCAG AAGAAACACG ACGACTTTGT CGACCGTATG 
ATGGAAAAAG GCTACACCCG TAAACAGGTG CGTTTACTGT GCGAATGGTA TTTGCGCGTA 
CGTAAATCGT CTTAA

Protein sequence

MNIFDHYRQR YEAAKDEEFT LQEFLTTCRQ DRSAYANAAE RLLMAIGEPV MVDTAQEPRL 
SRLFSNRVIA RYPAFEEFYG MEDAIEQIVS YLKHAAQGLE EKKQILYLLG PVGGGKSSLA 
ERLKSLMQLV PIYVLSANGE RSPVNDHPFC LFNPQEDAQI LEKEYGIPRR YLGTIMSPWA 
AKRLHEFGGD ITKFRVVKVW PSILQQIAIA KTEPGDENNQ DISALVGKVD IRKLEHYAQN 
DPDAYGYSGA LCRANQGIME FVEMFKAPIK VLHPLLTATQ EGNYNGTEGI SALPFNGIIL 
AHSNESEWVT FRNNKNNEAF LDRVYIVKVP YCLRISEEIK IYEKLLNHSE LTHAPCAPGT 
LETLSRFSIL SRLKEPENSS IYSKMRVYDG ESLKDTDPKA KSYQEYRDYA GVDEGMNGLS 
TRFAFKILSR VFNFDHVEVA ANPVHLFYVL EQQIEREQFP QEQAERYLEF LKGYLIPKYA 
EFIGKEIQTA YLESYSEYGQ NIFDRYVTYA DFWIQDQEYR DPDTGQLFDR ESLNAELEKI 
EKPAGISNPK DFRNEIVNFV LRARANNSGR NPNWTSYEKL RTVIEKKMFS NTEELLPVIS 
FNAKTSTDEQ KKHDDFVDRM MEKGYTRKQV RLLCEWYLRV RKSS