Gene EcSMS35_3797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3797
Symbol
ID	6143192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3862537
End bp	3863538
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	46%
IMG OID	641618623
Product	putative permease
Protein accession	YP_001745763
Protein GI	170679968
COG category	[R] General function prediction only
COG ID	[COG0701] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.236031
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAGTT GGCTTGCGAT GCTGCAAGAT GCCGCAGAGA TGTTTGTGTT TCTCGCCGTC 
GAGCTTTCTT TGCTGTTTAT AGTGATTAGT GCCGGTGTCA GCCTGATAAG ACAAAAGGTG 
CCAGACCATA AAATCCAGCA GATGATGGGG GCCAGAAAAG GGAGAGGTTA TCTCCTGGCT 
GCTCTGTTGG GAGCCGTTAC CCCGTTCTGT AGTTGCTCGA CAATCCCCAT GTTACGTGGA 
TTGTTATCAG CGAAAGCCGG GTTTGGTCCG ACCCTCACTT TTTTATTTGT TTCCCCATTA 
CTTAATCCCA TTATCGTCGG GTTAATGTGG GTGACCTTTG GCTGGAAAGT TACCTTGTTG 
TACGCGATTA TCGCCGCCGG CGTCTCCGTA CTTGCCAGTA TTATCCTGGA TTCCCTGGGA 
TTTGAACGTC ATATCATTGC CAGTAAAAGC TCATCAGCAA ATTGTTGTGC TCCAGCCAAA 
ACTTCGCCGG GGACGACATA TACGCCAATA GAAGTGAGTT GCTGTAGTCC AACGGCTAAA 
GCCATTGAGA AACCCGTAGT TAACTGTTGC AATACCAAAG CTGTGGTAAG TATTAATCCC 
ATAAAACTAG CCACCAAAGA TGCGTTGCAA CAGTTTAAAG ATGTACTGCC ATATCTTTTG 
TTAGGGGTAT TAATAGGCTC TTTTATTTAT GGCTTTATTC CCTCAGAGTG GATTGCCGCT 
CATGCAGGGG CAGATAATCC CTTCGCCATC CCATTGAGCG CCGTTGTTGG TATTCCGCTA 
TATATCCGGG CAGAGGCAGT TATCCCTCTG GCATCTGTTT TGATGACAAA AGGAATGGGT 
CTGGGAGCAT TAATGGCATT AATCATCGGC AGTGCCGGCG CAAGCCTGAC GGAAGTGATA 
TTACTTAAAT CAATGTTCAG AATACCGATG ATAGTTGCAT TCCTGACGGT TATATTAGGT 
ATGGCTATCT TGATGGGCTA TTTGACTCAA ATGCTATTTT AA

Protein sequence

MSSWLAMLQD AAEMFVFLAV ELSLLFIVIS AGVSLIRQKV PDHKIQQMMG ARKGRGYLLA 
ALLGAVTPFC SCSTIPMLRG LLSAKAGFGP TLTFLFVSPL LNPIIVGLMW VTFGWKVTLL 
YAIIAAGVSV LASIILDSLG FERHIIASKS SSANCCAPAK TSPGTTYTPI EVSCCSPTAK 
AIEKPVVNCC NTKAVVSINP IKLATKDALQ QFKDVLPYLL LGVLIGSFIY GFIPSEWIAA 
HAGADNPFAI PLSAVVGIPL YIRAEAVIPL ASVLMTKGMG LGALMALIIG SAGASLTEVI 
LLKSMFRIPM IVAFLTVILG MAILMGYLTQ MLF