Gene EcSMS35_3372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3372
Symbol
ID	6143075
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3452225
End bp	3453658
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	50%
IMG OID	641618201
Product	amino acid permease family protein
Protein accession	YP_001745350
Protein GI	170679908
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGATA CCAAACGTAA TACAATCGGC AAATTCGGCT TGCTCTCGCT GACTTTTGCC 
GCCGTTTACA GCTTTAACAA CGTTATCAAT AATAATATTG AGCTTGGACT GGCCTCGGCA 
CCGATGTTTT TCCTCGCGAC GATTTTTTAT TTTATTCCCT TCTGTCTGAT CATTGCAGAA 
TTTGTTTCGT TAAATAAAAA CTCAGAAGCC GGTGTCTACG CGTGGGTAAA AAGTTCGCTG 
GGCGGACGTT GGGCATTTAT TACTGCCTAT ACCTACTGGT TCGTAAACCT GTTCTTTTTC 
ACCTCGCTGT TACCGCGCGT TATTGCTTAT GCTTCGTATG CCTTCCTCGG CTACGAATAT 
ATTATGACGC CGGTTGCCAC CACCATTATC AGTATGGTGC TGTTCGCCTT CTCCACATGG 
GTTTCCACCA ACGGGGCGAA AATGCTGGGG CCAATCACCT CCGTCACTTC AACGCTGATG 
CTGCTGTTAA CGCTCTCCTA CATTTTACTG GCAGGTACGG CACTGGTTGG CGGCGTACAG 
CCTGCCGATC CGATCACCGT TGACGCGATG ATCCCGAACT TCAACTGGGC GTTCCTCGGC 
GTGACCACCT GGATCTTTAT GGCCGCAGGT GGCGCGGAGT CCGTCGCGGT GTACGTTAAC 
GACGTCAAAG GCGGTTCGAA ATCGTTCGTT AAAGTGATCA TCCTCGCCGG GATTTTTATC 
GGCGTACTGT ATTCCGTCTC CTCGGTGCTG ATTAACGTCT TCGTCAGCAG CAAAGAGTTG 
AAATTTACTG GCGGATCGGT ACAGGTATTC CACGGCATGG CGGCGTATTT TGGTCTACCG 
GAAGCACTGA TGAATCGCTT TGTCGGTCTG GTGTCCTTTA CCGCGATGTT CGGTTCCCTG 
CTGATGTGGA CGGCAACGCC GGTGAAAATT TTCTTCTCCG AAATTCCGGA AGGCATCTTT 
GGTAAGAAAA CCGTCGAACT GAACGAAAAC GGCGTTCCGG CGCGCGCAGC GTGGATCCAG 
TTCCTGATCG TCATCCCGCT GATGATTATC CCGATGCTCG GTTCCAATAC CGTGCAGGAT 
CTGATGAATA CCATTATTAA TATGACCGCC GCAGCGTCCA TGCTTCCGCC GTTATTCATC 
ATGCTGGCTT ACCTGAATTT ACGCGCCAAA TTAGATCACC TGCCACGCGA TTTCCGTATG 
GGTTCCCGAC GCACCGGTAT TATCGTTGTT TCAATGCTGA TTGCGATATT TGCTGTAGGG 
TTTGTCGCTT CGACATTCCC GACTGGCGCG AATATTCTGA CCATCATTTT TTATAACGTC 
GGCGGTATTG TTATCTTCCT CCGCTTTGCG TGGTGGAAAT ACAGTAAATA TATAAAGGGA 
TTAACGGCTG AAGAGCGCCA TATTGAAGCG ACGCCAGCCA GCAATGTTGA TTAA

Protein sequence

MSDTKRNTIG KFGLLSLTFA AVYSFNNVIN NNIELGLASA PMFFLATIFY FIPFCLIIAE 
FVSLNKNSEA GVYAWVKSSL GGRWAFITAY TYWFVNLFFF TSLLPRVIAY ASYAFLGYEY 
IMTPVATTII SMVLFAFSTW VSTNGAKMLG PITSVTSTLM LLLTLSYILL AGTALVGGVQ 
PADPITVDAM IPNFNWAFLG VTTWIFMAAG GAESVAVYVN DVKGGSKSFV KVIILAGIFI 
GVLYSVSSVL INVFVSSKEL KFTGGSVQVF HGMAAYFGLP EALMNRFVGL VSFTAMFGSL 
LMWTATPVKI FFSEIPEGIF GKKTVELNEN GVPARAAWIQ FLIVIPLMII PMLGSNTVQD 
LMNTIINMTA AASMLPPLFI MLAYLNLRAK LDHLPRDFRM GSRRTGIIVV SMLIAIFAVG 
FVASTFPTGA NILTIIFYNV GGIVIFLRFA WWKYSKYIKG LTAEERHIEA TPASNVD