Gene EcSMS35_A0147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_A0147
Symbol
ID	6106625
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010488
Strand	-
Start bp	115806
End bp	116885
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	41%
IMG OID	641614886
Product	putative permease
Protein accession	YP_001740027
Protein GI	170650831
COG category	[R] General function prediction only
COG ID	[COG0701] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAGTT GGATTCCTAT GTTGCAAGAT GCCGCAGAGA TGTTTGTTTT TCTGGCTGTT 
GAGCTTTCAT TGCTGTTTAT TGTCATTAGT GCCGGTGTGA GCCTGATAAG GCAAAAAGTC 
CCGGATCATA AAATTCAGCA GATGATGGGG GCGAGAAAAG GTAAGGGGTA TCTGTTGGCC 
TCGTTGCTGG GAGCCGTTAC CCCTTTCTGT AGTTGCTCAA CAATTCCAAT GTTGCGAGGA 
TTGTTGTCTG CGAAAGCGGG GTTTGGTCCG ACACTCACTT TTTTGTTTGT TTCACCGTTG 
CTTAATCCCA TTATCGTGGG ACTAATGTGG GTTACCTTTG GCTGGAAAGT AACTTTGCTG 
TATGCGATCA TCGCTGCCGG TGTTTCAGTT CTTTCCAGTA TTATACTGGA TTATTTAGGG 
TTTGAACGTC ATATTGTTGA ATACAAAAAT TCAGTATCAG GTAGTTGCGC CACCAAGTGC 
GGTGATTCTG AAGCTTCGGT AAAAACGAAT TGCTGTACTT CATCAGCAAA AACCATAATT 
AACTTAAAGA CAGTAAAGAA AGAGCAAAAT ATATCGGCGT GTTGTCCCTC AATTCTATCA 
GAAAAATCTT CTGAAAGTTG TTGCAGCAGC GAGAGTCAGG GCAACAGAAA TCTCACAATG 
AATGCCACCT CTGGTCTAAT AAAATTAGCA ATGAAAGATG CCTTACAACA GTTTAAGGAT 
GTTCTGCCTT ATCTTTTGTT AGCTATATTA ATAGGTTCAT TTATTTATGG TTTTATCCCT 
TCAGAGTGGA TTGCAGCTCA TGCCGGTGCA GATAATCCAT TAGCCATACC GCTCAGTGCT 
GTTGTTGGTA TTCCGCTGTA TATTCGTGCT GAGGCCGTAA TACCACTTGC ATCAGTTCTG 
ATGACTAAAG GTATGGGCCT CGGAGCTTTA ATGGCCTTGA TAATCGGTAG TGCTGGAGCG 
AGTCTGACAG AAGTAATATT GCTTAAATCA ATGTTCAGAA TGCCCATGAT AATCGCATTT 
CTGACGGTTA TCTTAGGTAT GGCAATCCTT ATGGGATATT TAACGCAATT TTTGTTTTAA

Protein sequence

MNSWIPMLQD AAEMFVFLAV ELSLLFIVIS AGVSLIRQKV PDHKIQQMMG ARKGKGYLLA 
SLLGAVTPFC SCSTIPMLRG LLSAKAGFGP TLTFLFVSPL LNPIIVGLMW VTFGWKVTLL 
YAIIAAGVSV LSSIILDYLG FERHIVEYKN SVSGSCATKC GDSEASVKTN CCTSSAKTII 
NLKTVKKEQN ISACCPSILS EKSSESCCSS ESQGNRNLTM NATSGLIKLA MKDALQQFKD 
VLPYLLLAIL IGSFIYGFIP SEWIAAHAGA DNPLAIPLSA VVGIPLYIRA EAVIPLASVL 
MTKGMGLGAL MALIIGSAGA SLTEVILLKS MFRMPMIIAF LTVILGMAIL MGYLTQFLF