Gene EcSMS35_2163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2163
Symbol	ompA
ID	6146246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2167505
End bp	2168581
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	53%
IMG OID	641617039
Product	outer membrane protein A
Protein accession	YP_001744213
Protein GI	170681860
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2885] Outer membrane protein and related peptidoglycan-associated (lipo)proteins [COG3637] Opacity protein and related surface antigens
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000195857
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.269234
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGATGATA ACGAGGCGCA AAAAATGAAA AAGACAGCTA TCGCGATTGC AGTGGCACTG 
GCTGGTTTCG CTACCGTAGC GCAGGCCGCT CCGAAAGATA ACACCTGGTA CACTGGTGCT 
AAACTGGGCT GGTCCCAGTA CCATGACACT GGTTTTATTC CTAACAATGG TCCGACCCAC 
GAAAACCAAC TGGGTGCAGG TGCTTTTGGT GGTTACCAGG TTAACCCGTA TGTTGGCTTT 
GAAATGGGTT ACGACTGGTT AGGTCGTATG CCGTACAAAG GCGACAACAT CAACGGCGCA 
TACAAAGCTC AGGGCGTTCA GCTGACCGCT AAACTGGGTT ACCCAATCAC TGACGATCTG 
GACGTTTACA CTCGTCTGGG TGGTATGGTA TGGCGTGCAG ACACCAAGTC TAACGTACCT 
GGTGGCGCAT CCACTAAAGA CCACGACACC GGCGTTTCTC CGGTCTTCGC TGGCGGTGTT 
GAGTACGCGA TCACTCCTGA AATCGCTACC CGTCTGGAAT ACCAGTGGAC CAACAACATC 
GGTGACGCAC ACACCATCGG TACTCGTCCG GACAACGGCA TGCTGAGCCT GGGTGTTTCC 
TACCGTTTCG GTCAGGGCGA AGCAGCTCCA GTAGTTGCTC CGGCTCCAGC TCCGGCACCG 
GAAGTACAGA CCAAGCACTT CACTCTGAAG TCTGACGTTC TGTTCAACTT CAACAAAGCA 
ACCCTGAAAC CGGAAGGTCA GGCTGCTCTG GATCAGCTGT ACAGCCAGCT GAGCAACCTG 
GATCCGAAAG ACGGTTCCGT AGTTGTTCTG GGTTACACCG ACCGCATCGG TTCTGACGCT 
TACAACCAGG CTCTGTCCGA GCGTCGTGCT CAGTCTGTTG TTGATTACCT GATCTCTAAA 
GGTATCCCGG CAGACAAAAT CTCCGCACGT GGTATGGGCG AATCCAACCC GGTTACTGGC 
AACACCTGTG ACAACGTGAA ACAGCGTGCT GCACTGATCG ACTGCCTGGC TCCGGATCGT 
CGCGTAGAGA TCGAAGTTAA AGGTATCAAA GACGTTGTAA CTCAGCCGCA GGCTTAA

Protein sequence

MDDNEAQKMK KTAIAIAVAL AGFATVAQAA PKDNTWYTGA KLGWSQYHDT GFIPNNGPTH 
ENQLGAGAFG GYQVNPYVGF EMGYDWLGRM PYKGDNINGA YKAQGVQLTA KLGYPITDDL 
DVYTRLGGMV WRADTKSNVP GGASTKDHDT GVSPVFAGGV EYAITPEIAT RLEYQWTNNI 
GDAHTIGTRP DNGMLSLGVS YRFGQGEAAP VVAPAPAPAP EVQTKHFTLK SDVLFNFNKA 
TLKPEGQAAL DQLYSQLSNL DPKDGSVVVL GYTDRIGSDA YNQALSERRA QSVVDYLISK 
GIPADKISAR GMGESNPVTG NTCDNVKQRA ALIDCLAPDR RVEIEVKGIK DVVTQPQA