Gene EcSMS35_3564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3564
Symbol
ID	6147128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3647528
End bp	3648709
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	50%
IMG OID	641618392
Product	His/Glu/Gln/Arg/opine ABC transporter permease
Protein accession	YP_001745539
Protein GI	170682235
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4597] ABC-type amino acid transport system, permease component
TIGRFAM ID	[TIGR01726] amine acid ABC transporter, permease protein, 3-TM region, His/Glu/Gln/Arg/opine family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.982473
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCATC GCCGCTCAAC CGTTAAAGGC TCACTCTCCT TTGCCAACCC TACGGTTCGC 
GCCTGGTTAT TCCAGATCCT TGCCGTTGTT GCTGTTGTTG GCATTGTTGG TTGGCTATTT 
CACAACACTG TGACGAATCT CAGTAATCGT GGCATTACTT CAGGTTTTGC CTTTCTGGAT 
CGCGGCGCTG GCTTCGGTAT TGTCCAGCAT TTGATCGATT ACCAGCAGGG TGATACCTAC 
GGACGCGTTT TCATTGTTGG CTTACTCAAT ACGCTACTGG TTTCTGCATT GTGTATTGTA 
TTCGCTTCTG TTCTGGGCTT CTTTATCGGT CTGGCGCGAC TTTCGGATAA CTGGCTGCTA 
CGAAAGCTTT CCACAATTTA TATTGAGATC TTCCGTAATA TTCCGCCGCT GCTGCAAATC 
TTCTTCTGGT ACTTTGCCGT GCTGCGCAAT TTGCCCGGAC CACGCCAGGC AGTGAGTGCG 
TTTGATCTGG CCTTTTTGAG CAATCGTGGG CTTTATATTC CGTCGCCGCA GCTGGGAGAC 
GGATTTATTG CGTTTATCCT GGCTGTTGTT ATGGCTATAG TCCTTTCTGT TGGGCTATTC 
CGCTTTAATA AAACATACCA GATAAAAACC GGACAACTGC GCCGCACCTG GCCGATCGCC 
GCAGTGTTGA TCATTGGTTT GCCTTTACTG GCGCAATGGC TTTTTGGCGC AGCACTACAC 
TGGGATGTCC CAGCCCTTCG AGGCTTTAAT TTCCGCGGCG GGATGGTTTT AATTCCTGAA 
CTGGCAGCCT TAACGCTGGC GCTTTCGGTT TATACTTCTG CATTTATCGC CGAAATTATC 
CGCGCAGGGA TCCAGGCAGT GCCTTATGGT CAACATGAAG CAGCTCGGTC ACTGGGATTA 
CCCAATCCGG TCACGCTACG CCAGGTCATT ATTCCCCAGG CATTGCGGGT GATTATTCCA 
CCGTTAACCA GCCAGTATCT CAACATCGTC AAGAACTCCT CTCTTGCCGC CGCTATTGGC 
TATCCCGATA TGGTTTCGCT GTTTGCTGGC ACCGTGCTGA ACCAAACGGG GCAAGCCATC 
GAGACGATAG CCATGACCAT GTCGGTCTAT CTGATTATCA GCCTGACTAT CTCGCTGCTG 
ATGAATATCT ATAACCGCCG CATCGCGATC GTTGAACGCT AA

Protein sequence

MSHRRSTVKG SLSFANPTVR AWLFQILAVV AVVGIVGWLF HNTVTNLSNR GITSGFAFLD 
RGAGFGIVQH LIDYQQGDTY GRVFIVGLLN TLLVSALCIV FASVLGFFIG LARLSDNWLL 
RKLSTIYIEI FRNIPPLLQI FFWYFAVLRN LPGPRQAVSA FDLAFLSNRG LYIPSPQLGD 
GFIAFILAVV MAIVLSVGLF RFNKTYQIKT GQLRRTWPIA AVLIIGLPLL AQWLFGAALH 
WDVPALRGFN FRGGMVLIPE LAALTLALSV YTSAFIAEII RAGIQAVPYG QHEAARSLGL 
PNPVTLRQVI IPQALRVIIP PLTSQYLNIV KNSSLAAAIG YPDMVSLFAG TVLNQTGQAI 
ETIAMTMSVY LIISLTISLL MNIYNRRIAI VER