Gene EcolC_3783 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3783
Symbol
ID	6066398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4139549
End bp	4140505
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	50%
IMG OID	641603196
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001726715
Protein GI	170021761
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGAAAC GCTTACTTGT AGTCTCTGCA GTCTCGGCAG CCATGTCGTC TATGGCGTTG 
GCCGCTCCAT TAACCGTAGG ATTTTCGCAG GTCGGATCGG AATCTGGCTG GCGCGCCGCA 
GAAACCAATG TGGCGAAAAG TGAGGCCGAA AAACGCGGAA TTACGCTGAA AATTGCCGAT 
GGTCAGCAAA AGCAGGAAAA CCAGATTAAA GCGGTACGTT CCTTCGTCGC GCAAGGGGTG 
GATGCGATCT TTATCGCTCC GGTGGTTGCG ACTGGTTGGG AACCGGTATT AAAAGAGGCG 
AAAGATGCCG AAATCCCGGT CTTCTTGCTC GATCGTTCTA TTGATGTGAA AGACAAATCT 
CTCTATATGA CCACCGTCAC TGCCGACAAC ATTCTCGAAG GCAAGTTGAT TGGTGACTGG 
CTGGTAAAAG AAGTGAATGG CAAACCATGC AACGTGGTGG AGCTGCAGGG CACTGTTGGG 
GCCAGCGTCG CCATTGACCG TAAGAAAGGC TTTGCCGAAG CCATTAAGAA TGCGCCAAAT 
ATCAAAATTA TCCGCTCGCA GTCAGGTGAC TTCACCCGCA GTAAAGGCAA AGAAGTCATG 
GAGAGCTTTA TCAAAGCGGA AAACAACGGC AAAAACATCT GCATGGTTTA CGCCCATAAC 
GACGACATGG TGATTGGTGC AATTCAGGCA ATTAAAGAAG CGGGCCTGAA ACCAGGCAAA 
GATATTCTGA CAGGTTCTAT CGACGGCGTA CCGGATATCT ACAAAGCGAT GATTGATGGC 
GAAGCGAACG CCAGTGTTGA ACTGACGCCG AATATGGCAG GTCCCGCCTT CGACGCGCTG 
GAGAAATACA AAAAAGACGG CACCATGCCT GAAAAGCTGA CGCTGACCAA ATCCACCCTT 
TATCTGCCTG ATACCGCAAA AGAAGAGTTA GAGAAGAAGA AAAATATGGG GTATTGA

Protein sequence

MWKRLLVVSA VSAAMSSMAL AAPLTVGFSQ VGSESGWRAA ETNVAKSEAE KRGITLKIAD 
GQQKQENQIK AVRSFVAQGV DAIFIAPVVA TGWEPVLKEA KDAEIPVFLL DRSIDVKDKS 
LYMTTVTADN ILEGKLIGDW LVKEVNGKPC NVVELQGTVG ASVAIDRKKG FAEAIKNAPN 
IKIIRSQSGD FTRSKGKEVM ESFIKAENNG KNICMVYAHN DDMVIGAIQA IKEAGLKPGK 
DILTGSIDGV PDIYKAMIDG EANASVELTP NMAGPAFDAL EKYKKDGTMP EKLTLTKSTL 
YLPDTAKEEL EKKKNMGY