Gene EcHS_A3656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3656
Symbol	livK
ID	5594557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3642707
End bp	3643816
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	54%
IMG OID	640922772
Product	high-affinity branched-chain amino acid ABC transporter, periplasmic leucine-specific-binding protein LivK
Protein accession	YP_001460252
Protein GI	157162934
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGGA ATGCGAAAAC TATCATCGCA GGGATGATTG CACTGGCAAT TTCACACACC 
GCTATGGCTG ACGATATTAA AGTCGCCGTT GTCGGCGCGA TGTCCGGCCC GATTGCCCAG 
TGGGGCGATA TGGAATTTAA CGGCGCGCGT CAGGCGATTA AAGACATTAA TGCCAAAGGG 
GGAATTAAGG GCGACAAGCT GGTTGGCGTG GAATATGACG ACGCCTGCGA CCCGAAACAA 
GCCGTTGCGG TCGCCAACAA AATCGTTAAT GACGGCATTA AATACGTTAT TGGTCATCTG 
TGTTCTTCTT CTACCCAACC TGCATCAGAT ATCTACGAAG ACGAAGGTAT TCTGATGATC 
TCGCCGGGAG CGACCAACCC GGAGCTGACC CAACGCGGTT ATCAACACAT TATGCGTACT 
GCCGGGCTGG ACTCTTCCCA GGGGCCAACG GCGGCAAAAT ACATTCTTGA GACGGTGAAG 
CCCCAGCGCA TCGCCATCAT TCACGACAAA CAACAGTATG GCGAAGGGCT GGCGCGTTCG 
GTGCAGGACG GGCTGAAAGC GGCTAACGCC AACGTCGTCT TCTTCGACGG TATTACCGCC 
GGGGAGAAAG ATTTCTCCGC GCTGATCGCC CGCCTGAAAA AAGAAAACAT CGACTTCGTT 
TACTACGGCG GTTACTACCC GGAAATGGGG CAGATGCTGC GCCAGGCCCG TTCCGTTGGC 
CTGAAAACTC AGTTTATGGG GCCGGAAGGT GTGGGTAACG CATCATTGTC GAATATTGCC 
GGTGATGCTG CCGAAGGCAT GTTGGTCACT ATGCCAAAAC GCTATGACCA GGATCCGGCA 
AACCAGGGCA TCGTTGATGC GCTGAAAGCA GACAAGAAAG ATCCGTCCGG GCCTTATGTC 
TGGATCACCT ACGCGGCGGT GCAATCTCTG GCGACTGCCC TTGAGCGTAC TGGCAGCGAT 
GAGCCGCTGG CGCTGGTGAA AGATTTAAAA GCTAACGGTG CAAACACCGT GATTGGGCCG 
CTGAACTGGG ATGAAAAAGG CGATCTTAAG GGATTTGATT TTGGTGTCTT CCAGTGGCAC 
GCCGACGGTT CATCCACGGC AGCCAAGTGA

Protein sequence

MKRNAKTIIA GMIALAISHT AMADDIKVAV VGAMSGPIAQ WGDMEFNGAR QAIKDINAKG 
GIKGDKLVGV EYDDACDPKQ AVAVANKIVN DGIKYVIGHL CSSSTQPASD IYEDEGILMI 
SPGATNPELT QRGYQHIMRT AGLDSSQGPT AAKYILETVK PQRIAIIHDK QQYGEGLARS 
VQDGLKAANA NVVFFDGITA GEKDFSALIA RLKKENIDFV YYGGYYPEMG QMLRQARSVG 
LKTQFMGPEG VGNASLSNIA GDAAEGMLVT MPKRYDQDPA NQGIVDALKA DKKDPSGPYV 
WITYAAVQSL ATALERTGSD EPLALVKDLK ANGANTVIGP LNWDEKGDLK GFDFGVFQWH 
ADGSSTAAK