Gene EcSMS35_0914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0914
Symbol
ID	6147226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	922164
End bp	923321
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	57%
IMG OID	641615802
Product	quaternary amine ABC transporter permease
Protein accession	YP_001742994
Protein GI	170682890
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1174] ABC-type proline/glycine betaine transport systems, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.664933
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTTATT TACGTATTAA TCCTGTTCTG GCGCTGCTGC TGTTGCTGAC GGCAATCGCA 
GCGGCGCTGC CGTTTATCAG TTACGCGCCT AATCGTTTAG TCTCTGGTGA GGGGCGTCAT 
CTCTGGCAGT TGTGGCCGCA AACGATCTGG ATGCTGGTGG GCGTATGTTG CGCCTGGCTG 
ACAGCCTGTT TTATTCCCGG TAGAAAAGGC AGCATTTTTG CACTCATTCT GGCGCAATTC 
GTCTTCGTAT TGCTGGTGTG GGGAGCTGGA AAGGCGGCGA CACAACTGGC GCAAAATGGC 
AGTGCGCTGG CGCGTACCAG CCTCGGCAGT GGTTTCTGGC TGGCTGCGGC GCTGGCATTG 
CTTGCCTGTA GCGATGCCAT CCGACGAATC TCCACGCATC CGCTGTGGCG CTGGTTGTTG 
CATATGCAGA TTGCCATCAT TCCGCTGTGG TTGCTGTATT CCGGCGCGCT TAACGATCTC 
TCGCTAATGA AAGAATACGC CAACCGTCAG GATGTGTTTG ATGACGCGCT GGCGCAACAT 
CTGACGTTGC TGTTTGGTGC GGTGCTGCCT GCGTTAGTGA TTGGTGTGCC GTTGGGCATC 
TGGTGCTACT TTTCCACCGC GCGGCAGGGG GCGATTTTTT CGCTACTCAA TGTCATTCAG 
ACCGTGCCTT CGGTGGCGCT CTTTGGCCTG TTGATTGCGC CGCTTGCCGC GCTGGTTACG 
GCCTTTCCGT GGCTGGGTAA GCTGGGCATA GCAGGAACCG GAATGACACC CGCACTGATT 
GCGCTGGTGC TCTATGCCTT GCTGCCGCTG GTGCGCGGCG TGGTAGTCGG CTTGAACCAG 
ATCCCGCGCG ATGTGCTGGA GAGCGCCAGA GCGATGGGGA TGAGCGGGGC GCAGCGATTC 
CTGCATGTTC AGTTACCGCT GGCGTTACCG GTATTTTTGC GCAGCCTGCG GGTGGTGATG 
GTGCAAACTG TAGGCATGGC GGTGATTGCG GCGTTAATCG GCGCAGGCGG TTTTGGTGCG 
CTGGTTTTCC AGGGGCTGCT AAGCAGCGCC ATTGATTTAG TGTTGCTGGG GGTGATCCCG 
GTAATTGTTC TGGCGGTGCT TACCGACGCG CTGTTCGATT TGCTTATCGC ACTGCTGAAG 
GTGAAACGTA ATGATTGA

Protein sequence

MTYLRINPVL ALLLLLTAIA AALPFISYAP NRLVSGEGRH LWQLWPQTIW MLVGVCCAWL 
TACFIPGRKG SIFALILAQF VFVLLVWGAG KAATQLAQNG SALARTSLGS GFWLAAALAL 
LACSDAIRRI STHPLWRWLL HMQIAIIPLW LLYSGALNDL SLMKEYANRQ DVFDDALAQH 
LTLLFGAVLP ALVIGVPLGI WCYFSTARQG AIFSLLNVIQ TVPSVALFGL LIAPLAALVT 
AFPWLGKLGI AGTGMTPALI ALVLYALLPL VRGVVVGLNQ IPRDVLESAR AMGMSGAQRF 
LHVQLPLALP VFLRSLRVVM VQTVGMAVIA ALIGAGGFGA LVFQGLLSSA IDLVLLGVIP 
VIVLAVLTDA LFDLLIALLK VKRND