Gene EcSMS35_3565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3565
Symbol
ID	6146434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3648719
End bp	3649822
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	52%
IMG OID	641618393
Product	His/Glu/Gln/Arg/opine ABC transporter permease
Protein accession	YP_001745540
Protein GI	170684312
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0765] ABC-type amino acid transport system, permease component
TIGRFAM ID	[TIGR01726] amine acid ABC transporter, permease protein, 3-TM region, His/Glu/Gln/Arg/opine family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.931761
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAAAG TATTGCTGTC TCATCCCCCG CGCCCGGCGA GCCATAACTC AAGCCGCGCG 
ATGGTGTGGG TGCGAAAAAA TCTGTTCTCC AGCTTGAGCA ATAGCCTGCT GACTATTGGC 
TGCATATGGT TGATGTGGGA ACTGATCCCA CCGTTGCTGA ACTGGGCATT TTTGCAAGCT 
AACTGGGTTG GCTCAACGCG TGCCGACTGC ACAAAAGCCG GTGCCTGTTG GGTCTTCATC 
CACGAACGAT TTGGTCAGTT TATGTATGGG CTTTACCCAC ACGACCAACG CTGGCGAATT 
AACCTGGCAT TACTGATTGG GCTTGTATCG ATCGCACCAA TGTTCTGGAA AATACTCCCG 
TATCGCGGTC GCTATATTGC GGTATGGGCG GTGATTTACC CACTGATTGT CTGGTGGCTG 
ATGTATGGCG GGTTTCTTGG TCTTGAGCGG GTTGAAACCC GGCAATGGGG CGGGCTGACG 
CTAACTTTAA TTATTGCATC AGTTGGGATT GCGGGGGCGC TGCCGTGGGG GATCTTACTG 
GCGTTAGGTC GTCGCTCCCA TATGCCGATT GTGCGTATCT TATCGGTCAT TTTTATCGAG 
TTCTGGCGCG GTGTACCGCT GATTACCGTT CTGTTTATGT CTTCGGTCAT GCTGCCGTTG 
TTTATGGCAG AAGGCACCAG TATCGACAAA TTGATCCGCG CGCTGGTTGG CGTGATCCTG 
TTTCAGTCAG CATATGTTGC GGAAGTCGTG CGAGGCGGAT TACAGGCGCT GCCTAAAGGG 
CAATATGAAG CGGCAGAGTC GCTGGCGTTG GGTTACTGGA AAACCCAGGG GCTGGTTATT 
CTGCCACAGG CGTTGAAGCT GGTGATTCCT GGGCTGGTAA ATACCATCAT CGCACTCTTC 
AAAGATACCA GCCTGGTGAT CATCATCGGG TTGTTCGATC TTTTCAGTAG CGTTCAGCAG 
GCAACCGTTG ATCCCGCCTG GTTGGGTATG TCGACGGAAG GGTATGTTTT CGCCGCACTG 
ATCTACTGGA TCTTCTGTTT CAGCATGTCG CGCTATAGCC AGCATCTGGA AAAACGTTTT 
AACACCGGGC GTACACCGCA TTGA

Protein sequence

MTKVLLSHPP RPASHNSSRA MVWVRKNLFS SLSNSLLTIG CIWLMWELIP PLLNWAFLQA 
NWVGSTRADC TKAGACWVFI HERFGQFMYG LYPHDQRWRI NLALLIGLVS IAPMFWKILP 
YRGRYIAVWA VIYPLIVWWL MYGGFLGLER VETRQWGGLT LTLIIASVGI AGALPWGILL 
ALGRRSHMPI VRILSVIFIE FWRGVPLITV LFMSSVMLPL FMAEGTSIDK LIRALVGVIL 
FQSAYVAEVV RGGLQALPKG QYEAAESLAL GYWKTQGLVI LPQALKLVIP GLVNTIIALF 
KDTSLVIIIG LFDLFSSVQQ ATVDPAWLGM STEGYVFAAL IYWIFCFSMS RYSQHLEKRF 
NTGRTPH