Gene EcolC_1129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1129
Symbol
ID	6068007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1233556
End bp	1234539
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	46%
IMG OID	641600545
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001724123
Protein GI	170019169
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTAAAA AAATGAGAAC AACCCGTAAT CTATTATTAA TGGCTACGCT ATTAGGTAGC 
GCACTATTTG CCAGGGCTGC GGATAAAGAA ATGACCATTG GTGCAATATA CCTTGATACC 
CAGGGATATT ACGCTGGAGT GCGTCAGGGC GTTCAGGATG CGGCAAAAGA TTCTTCAGTA 
CAGGTACAGT TAATTGAAAC TAACGCCCAG GGTGATATTT CGAAAGAAAG TACCTTTGTT 
GATACCCTCG TGGCGCGTAA TGTCGATGCC ATTATTTTAT CGGCAGTGTC TGAAAATGGC 
AGTAGCCGTA CCGTTCGTCG CGCCAGTGAA GCGGGTATTC CGGTGATTTG CTACAACACC 
TGTATTAATC AAAAGGGTGT CGATAAATAT GTCTCGGCGT ATCTGGTCGG CGATCCACTG 
GAATTTGGTA AAAAACTGGG TAACGCTGCC GCCGATTATT TTATTGCCAA TAAAATTGAC 
CAGCCGAAAA TTGCCGTCAT CAATTGCGAA GCCTTTGAAG TTTGTGTGCA GCGACGTAAA 
GGATTTGAAG AAGTATTAAA ATCCCGCGTT CCCGGCGCGC AAATTGTCGC TAATCAGGAA 
GGGACTGTTT TAGATAAAGC GATTTCCGTT GGTGAAAAAC TGATTATCTC CACGCCGGAT 
CTCAACGCCA TTATGGGGGA GTCGGGCGGT GCGACACTCG GCGCGGTAAA AGCGGTACGT 
AATCAAAATC AGGCCGGAAA AATTGCTGTT TTCGGTTCGG ATATGACAAC CGAAATTGCT 
CAGGAGCTGG AAAACAATCA GGTGCTGAAA GCGGTAGTGG ATATTTCCGG TAAGAAAATG 
GGCAATGCTG TTTTCGCGCA AACATTGAAG GTTATCAATA AACAAGCCGA CGGTGAAAAA 
GTGATTCAGG TGCCAATCGA TCTCTATACC AAAACGGAAG ATGGTAAACA GTGGCTGGCA 
ACGCACGTTG ATGGTCTGCC CTAA

Protein sequence

MPKKMRTTRN LLLMATLLGS ALFARAADKE MTIGAIYLDT QGYYAGVRQG VQDAAKDSSV 
QVQLIETNAQ GDISKESTFV DTLVARNVDA IILSAVSENG SSRTVRRASE AGIPVICYNT 
CINQKGVDKY VSAYLVGDPL EFGKKLGNAA ADYFIANKID QPKIAVINCE AFEVCVQRRK 
GFEEVLKSRV PGAQIVANQE GTVLDKAISV GEKLIISTPD LNAIMGESGG ATLGAVKAVR 
NQNQAGKIAV FGSDMTTEIA QELENNQVLK AVVDISGKKM GNAVFAQTLK VINKQADGEK 
VIQVPIDLYT KTEDGKQWLA THVDGLP