Gene EcSMS35_3740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3740
Symbol	livK
ID	6145055
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3807699
End bp	3808808
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	53%
IMG OID	641618566
Product	high-affinity branched-chain amino acid ABC transporter, periplasmic leucine-specific-binding protein LivK
Protein accession	YP_001745706
Protein GI	170683091
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGGA ATGCGAAAAC TATCATCGCA GGGATGATTG CACTGACAAT TTCACACACC 
GCTATGGCTG ACGATATTAA AGTCGCCGTT GTCGGCGCGA TGTCCGGCCC GATTGCCCAG 
TGGGGCGATA TGGAATTTAA CGGCGCGCGT CAGGCAATTA AAGACATTAA TGCCAAAGGG 
GGAATTAAGG GCGATAAACT GGTTGGCGTG GAATATGACG ACGCCTGCGA CCCGAAACAA 
GCCGTTGCGG TCGCCAACAA AATCGTTAAC GACGGCATTA AATACGTTAT TGGTCATCTG 
TGTTCTTCTT CTACCCAACC TGCATCAGAT ATCTACGAAG ACGAAGGTAT TTTGATGATC 
TCGCCGGGGG CGACCAACCC GGAGCTGACC CAACGCGGTT ATCAATACAT CATGCGTACT 
GCCGGGCTGG ATTCTTCCCA GGGGCCAACG GCGGCAAAAT ACATTGTTGA GACGGTGAAG 
CCCCAGCGCA TCGCCATCAT TCACGACAAA CAACAGTATG GCGAAGGGCT GGCACGTTCG 
GTGCAGGACG GGCTGAAAGC GGCTAACGCC AACGTTGTCT TCTTCGACGG TATTACCGCG 
GGTGAGAAAG ATTTCTCCGC GCTGATCGCC CGCCTGAAAA AAGAAAACAT CGACTTCGTT 
TACTACGGCG GTTACTACCC GGAAATGGGG CAGATGCTGC GCCAGGCCCG TTCCGTTGGC 
CTGAAAACCC AGTTTATGGG GCCGGAAGGT GTGGGTAATG CGTCGTTGTC GAATATTGCT 
GGCGATGCTG CCGAAGGCAT GTTGGTCACT ATGCCAAAAC GCTATGACCA GGATCCGGCA 
AATCAGGGCA TCGTTGATGC GCTGAAAGCA GACAAGAAAG ATCCGTCCGG GCCATATGTC 
TGGATCACTT ACGCGGCGGT GCAATCTCTG GCGACTGCAC TTGAGCGTAC CGGCAGCGAT 
GAGCCGCTGG CGCTGGTGAA AGATTTAAAA GCTAACGGTG CAAACACCGT AATTGGGCCG 
CTGAACTGGG ATGAAAAAGG CGATCTTAAG GGATTTGATT TTGGTGTCTT CCAGTGGCAC 
GCCGACGGTT CATCCACGGC AGCCAAGTGA

Protein sequence

MKRNAKTIIA GMIALTISHT AMADDIKVAV VGAMSGPIAQ WGDMEFNGAR QAIKDINAKG 
GIKGDKLVGV EYDDACDPKQ AVAVANKIVN DGIKYVIGHL CSSSTQPASD IYEDEGILMI 
SPGATNPELT QRGYQYIMRT AGLDSSQGPT AAKYIVETVK PQRIAIIHDK QQYGEGLARS 
VQDGLKAANA NVVFFDGITA GEKDFSALIA RLKKENIDFV YYGGYYPEMG QMLRQARSVG 
LKTQFMGPEG VGNASLSNIA GDAAEGMLVT MPKRYDQDPA NQGIVDALKA DKKDPSGPYV 
WITYAAVQSL ATALERTGSD EPLALVKDLK ANGANTVIGP LNWDEKGDLK GFDFGVFQWH 
ADGSSTAAK