Gene EcolC_1596 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1596
Symbol
ID	6064689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1775025
End bp	1776305
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	54%
IMG OID	641601012
Product	putative pyruvyl transferase
Protein accession	YP_001724582
Protein GI	170019628
COG category	[S] Function unknown
COG ID	[COG2327] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.077358
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTAC TTATTCTGGG CAACCACACT TGCGGCAACC GCGGCGACAG CGCCATCCTG 
CGCGGCTTAC TTGATGCCAT CAACATCCTC AATCCACACG CCGAAGTGGA TGTGATGAGC 
CGCTATCCGG TCAGTTCTTC CTGGCTGCTC AACCGCCCGG TAATGGGCGA TCCGCTGTTC 
CTGCAAATGA AACAACACAA CAGCGCGGTG GGCGTTGTCG GGCGCGTTAA AAAAGTCCTC 
CGTCGCCGCT ATCAACACCA GGTACTGCTC TCACGCGTCA CCGACACTGG CAAGCTGCGT 
AATATCGCCA TCGCCCAGGG ATTCACCGAC TTCGTGCGCC TGCTGTCAGG TTACGACGCC 
ATTATTCAGG TCGGCGGATC GTTTTTTGTC GATCTCTACG GCGTGCCGCA GTTTGAACAT 
GCGCTTTGCA CGTTTATGGC GAAAAAGCCG CTGTTTATGA TTGGTCACAG CGTCGGTCCC 
TTCCAGGATG AGCAATTTAA CCAACTGGCG AACTACGTTT TCGGTCACTG CGACGCGCTG 
ATCCTGCGCG AATCGGTCAG CCTTGATTTG ATGAAACGCA GCAATATCAC TACCGCAAAA 
GTGGAACATG GCGTCGATAC CGCGTGGCTG GTCGATCACC ACACAGAAGA CTTCACCGCC 
AGCTATGCCG TCCAACACTG GCTGGACGTT GCCGCACAAC AGAAAACGGT AGCAATTACC 
CTGCGCGAAC TGGCACCGTT CGACAAACGT CTCGGCACCA CTCAACAAGC GTATGAAAAA 
GCCTTTGCCG GGGTGGTCAA TCGCATTCTC GACGAAGGGT ATCAGGTGAT TGCGCTTTCC 
ACCTGTACGG GCATCGACAG CTATAACAAA GACGATCGCA TGGTGGCGCT CAATCTACGC 
CAGCACATCA GCGATCCTGC CCGTTACCAC GTAGTGATGG ATGAACTTAA CGATCTGGAA 
ATGGGCAAAA TTCTCGGTGC CTGTGAACTC ACCGTCGGTA CGCGCCTGCA CTCCGCCATT 
ATCTCAATGA ACTTTGCCAC CCCGGCGATT GCCATCAACT ATGAACATAA ATCCGCCGGG 
ATCATGCAGC AGCTGGGACT ACCGGAGATG GCAATTGATA TCCGTCATTT ATTAGACGGT 
AGCCTGCAAG CGATGGTTGC GGATACCTTA GGCCAGCTTC CGGCGCTGAA CACGCGACTT 
AACGAAGCCG TTAGTCGCGA ACGTCAGACG GGAATGCAGA TGGTGCAATC TGTGCTTGAA 
CGCATCGGGG AGGTGAAATG A

Protein sequence

MKLLILGNHT CGNRGDSAIL RGLLDAINIL NPHAEVDVMS RYPVSSSWLL NRPVMGDPLF 
LQMKQHNSAV GVVGRVKKVL RRRYQHQVLL SRVTDTGKLR NIAIAQGFTD FVRLLSGYDA 
IIQVGGSFFV DLYGVPQFEH ALCTFMAKKP LFMIGHSVGP FQDEQFNQLA NYVFGHCDAL 
ILRESVSLDL MKRSNITTAK VEHGVDTAWL VDHHTEDFTA SYAVQHWLDV AAQQKTVAIT 
LRELAPFDKR LGTTQQAYEK AFAGVVNRIL DEGYQVIALS TCTGIDSYNK DDRMVALNLR 
QHISDPARYH VVMDELNDLE MGKILGACEL TVGTRLHSAI ISMNFATPAI AINYEHKSAG 
IMQQLGLPEM AIDIRHLLDG SLQAMVADTL GQLPALNTRL NEAVSRERQT GMQMVQSVLE 
RIGEVK