Gene EcSMS35_1702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1702
Symbol
ID	6144352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1705762
End bp	1706862
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	44%
IMG OID	641616578
Product	porin family protein
Protein accession	YP_001743756
Protein GI	170679684
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0189246
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTAA AAATAGTTGC GGTGGTTGTA ACTGGTTTGT TAGCTGCGAA CGTAGCACAC 
GCTGCCGAAG TCTATAACAA GGATGGTAAT AAACTCGACC TTTATGGCAA GGTTACCGCT 
CTACGTTATT TTACTGATGA TAAGCGTGAC GATGGTGATA AAACTTATGC CCGTCTCGGC 
TTTAAAGGAG AAACGCAAAT CAATGATCAA ATGATTGGTT TTGGTCACTG GGAATATGAT 
TTTAAAGGCT ATAACGATGA AGCCAACGGC TCGCGCGGTA ACAAGACCCG TCTGGCCTAT 
GCAGGTTTAA AAATTAGTGA ATTTGGCTCT CTGGACTATG GTCGTAACTA CGGTGTCGGC 
TATGACATTG GTTCATGGAC CGATATGTTG CCAGAATTTG GTGGCGATAC CTGGAGTCAG 
AAAGATGTCT TCATGACATA CCGTACTACC GGTGTGGCAA CCTATCGCAA CTACGATTTC 
TTCGGCTTAA TTGAAGGTCT GAACTTTGCC GCGCAATATC AAGGCAAAAA TGAACGCACT 
GACAATGGTC ATCTTTATGG TGCTGACTAC ACGCGTGCCA ATGGTGACGG TTTCGGTATC 
TCCTCAACTT ATGTTTATGA TGGCTTTGGT ATCGGTGCGG TGTATACCAA ATCCGATCGG 
ACAAATGCGC AGGAAAGAGC CGCTGCTAAT CCTCTCAATG CCTCCGGTAA GAATGCAGAA 
CTGTGGGCTA CAGGTATAAA ATATGATGCC AACAACATCT ACTTTGCAGC TAATTACGCT 
GAAACATTAA ACATGACCAC CTATGGCGAT GGTTATATCT CTAACAAAGC ACAAAGTTTT 
GAAGTAGTGG CACAATATCA ATTCGACTTC GGCTTGCGCC CATCACTCGC TTACCTGAAA 
TCGAAAGGCA GAGATCTGGG CCGCTACGGC GACCAGGACA TGATTGAGTA TATCGACGTT 
GGTGCGACGT ATTTCTTCAA CAAAAATATG TCGACCTATG TTGATTATAA AATCAACCTG 
ATTGATGAAA GCGACTTTAC CCGTGCCGTA GATATTCGCA CCGATAACAT CGTCGCAACG 
GGAATTACCT ATCAGTTCTA A

Protein sequence

MKLKIVAVVV TGLLAANVAH AAEVYNKDGN KLDLYGKVTA LRYFTDDKRD DGDKTYARLG 
FKGETQINDQ MIGFGHWEYD FKGYNDEANG SRGNKTRLAY AGLKISEFGS LDYGRNYGVG 
YDIGSWTDML PEFGGDTWSQ KDVFMTYRTT GVATYRNYDF FGLIEGLNFA AQYQGKNERT 
DNGHLYGADY TRANGDGFGI SSTYVYDGFG IGAVYTKSDR TNAQERAAAN PLNASGKNAE 
LWATGIKYDA NNIYFAANYA ETLNMTTYGD GYISNKAQSF EVVAQYQFDF GLRPSLAYLK 
SKGRDLGRYG DQDMIEYIDV GATYFFNKNM STYVDYKINL IDESDFTRAV DIRTDNIVAT 
GITYQF