Gene EcHS_A2354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2354
Symbol	ompC
ID	5593770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2352627
End bp	2353733
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	51%
IMG OID	640921480
Product	outer membrane porin protein C
Protein accession	YP_001459015
Protein GI	157161697
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.00268594
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTTA AAGTACTGTC CCTCCTGGTC CCAGCTCTGC TGGTAGCAGG CGCAGCAAAC 
GCTGCTGAAG TTTACAACAA AGACGGCAAC AAATTAGATC TGTACGGTAA AGTAGACGGC 
CTGCACTATT TCTCTGACAA CAAGTCAGAA GACGGCGACC AGACCTATGT ACGTCTTGGT 
TTCAAAGGCG AAACTCAGGT TACTGACCAG CTGACCGGTT ACGGCCAGTG GGAATATCAG 
ATCCAGGGCA ATACCTCTGA AGACAACAAA GAAAACTCCT GGACCCGTGT GGCATTCGCA 
GGTCTGAAAT TCCAGGATGT AGGTTCTTTC GACTACGGTC GTAACTACGG CGTTGTTTAC 
GACGTAACTT CCTGGACCGA CGTACTGCCA GAATTCGGTG GCGACACCTA CGGTTCTGAC 
AACTTCATGC AGCAGCGTGG TAACGGCTTC GCGACCTACC GTAACACCGA CTTCTTCGGT 
CTGGTTGACG GTCTGAACTT TGCTGTTCAG TACCAGGGCA AAAACGGCAG CGTAAGCGGC 
GAAGGCATGA CCAACAACGG TCGTGGCGCT CTGCGTCAGA ACGGCGACGG TGTCGGCGGT 
TCTATCACTT ATGATTACGA AGGCTTCGGT ATCGGTGCTG CAGTTTCCAG CTCCAAACGT 
ACTGATGCTC AGAACACCGC TGCTTACATC GGTAACGGCG ACCGTGCTGA AACCTACACT 
GGTGGTCTGA AATACGACGC TAACAACATC TACCTGGCTG CTCAGTACAC CCAGACCTAC 
AACGCAACTC GCGTAGGTTC CCTGGGTTGG GCGAACAAAG CACAGAACTT CGAAGCTGTT 
GCTCAGTACC AGTTCGACTT CGGTCTGCGT CCGTCTGTAG CATACCTGCA GTCTAAAGGT 
AAAAACCTGG GTGTCGTTGC TGGTCGTAAC TACGACGACG AAGATATCCT GAAATATGTT 
GATGTTGGTG CGACCTACTA CTTCAACAAA AACATGTCCA CCTACGTTGA CTACAAAATC 
AACCTGCTGG ACGACAACCA GTTCACTCGT GACGCTGGCA TCAACACTGA TAACATCGTA 
GCTCTGGGTC TGGTTTACCA GTTCTAA

Protein sequence

MKVKVLSLLV PALLVAGAAN AAEVYNKDGN KLDLYGKVDG LHYFSDNKSE DGDQTYVRLG 
FKGETQVTDQ LTGYGQWEYQ IQGNTSEDNK ENSWTRVAFA GLKFQDVGSF DYGRNYGVVY 
DVTSWTDVLP EFGGDTYGSD NFMQQRGNGF ATYRNTDFFG LVDGLNFAVQ YQGKNGSVSG 
EGMTNNGRGA LRQNGDGVGG SITYDYEGFG IGAAVSSSKR TDAQNTAAYI GNGDRAETYT 
GGLKYDANNI YLAAQYTQTY NATRVGSLGW ANKAQNFEAV AQYQFDFGLR PSVAYLQSKG 
KNLGVVAGRN YDDEDILKYV DVGATYYFNK NMSTYVDYKI NLLDDNQFTR DAGINTDNIV 
ALGLVYQF