Gene EcolC_2667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2667
Symbol
ID	6067636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2923376
End bp	2924464
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	47%
IMG OID	641602073
Product	outer membrane protein F
Protein accession	YP_001725623
Protein GI	170020669
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000513703
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.141925
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAGC GCAATATTCT GGCAGTGATC GTCCCTGCTC TGTTAGTAGC AGGTACTGCA 
AACGCTGCAG AAATCTATAA CAAAGATGGC AACAAAGTAG ATCTGTACGG TAAAGCTGTC 
GGTCTGCATT ATTTTTCTAA AGACAATGGT GTAAACAGTT ACGGCGGAAA CGGCGACAAA 
ACTTATGCCC GTCTTGGTTT TAAAGGGGAA ACACAAATCA ATTCCGATCT GACCGGTTAT 
GGTCAGTGGG AATATAACTT CCAGGGTAAC AACTCTGAAG GCGCTGACGC TCAAACTGGT 
AACAAAACGC GTCTGGCATT CGCGGGTCTT AAATACGCTG ACATTGGTTC TTTCGATTAC 
GGCCGTAACT ACGGTGTGGT TTATGATGCA CTGGGTTACA CCGATATGCT GCCAGAATTT 
GGTGGTGATA CTGCATACAG CGATGACTTC TTCGTTGGTC GTGTTGGCGG CGTTGCTACC 
TATCGTAACT CCAACTTCTT TGGTCTGGTT GATGGCCTGA ACTTCGCTGT TCAGTACCTG 
GGTAAAAACG AGCGTGACAC TGCACGCCGC TCTAACGGCG ACGGTGTTGG CGGTTCTATC 
AGCTACGAAT ACGAAGGCTT TGGTATCGTT GGTGCTTATG GTGCAGCTGA CCGTACCAAC 
CTGCAAGAAG CTCAACCTCT TGGCAACGGT AAAAAAGCTG AACAGTGGGC TACTGGTCTG 
AAGTACGACG CGAACAACAT CTACCTGGCA GCGAACTACG GTGAAACCCG TAACGCTACG 
CCGATCACTA ATAAATTTAC AAACACCAGC GGCTTCGCCA ACAAAACGCA AGACGTTCTG 
TTAGTTGCGC AATACCAGTT CGATTTCGGT CTGCGTCCGT CCATCGCTTA CACCAAATCT 
AAAGCGAAAG ACGTAGAAGG TATCGGTGAT GTTGATCTGG TGAACTACTT TGAAGTGGGC 
GCAACCTACT ACTTCAACAA AAACATGTCC ACCTATGTTG ACTACATCAT CAACCAGATC 
GATTCTGACA ACAAACTGGG CGTAGGTTCA GACGACACCG TTGCTGTGGG TATCGTTTAC 
CAGTTCTAA

Protein sequence

MMKRNILAVI VPALLVAGTA NAAEIYNKDG NKVDLYGKAV GLHYFSKDNG VNSYGGNGDK 
TYARLGFKGE TQINSDLTGY GQWEYNFQGN NSEGADAQTG NKTRLAFAGL KYADIGSFDY 
GRNYGVVYDA LGYTDMLPEF GGDTAYSDDF FVGRVGGVAT YRNSNFFGLV DGLNFAVQYL 
GKNERDTARR SNGDGVGGSI SYEYEGFGIV GAYGAADRTN LQEAQPLGNG KKAEQWATGL 
KYDANNIYLA ANYGETRNAT PITNKFTNTS GFANKTQDVL LVAQYQFDFG LRPSIAYTKS 
KAKDVEGIGD VDLVNYFEVG ATYYFNKNMS TYVDYIINQI DSDNKLGVGS DDTVAVGIVY 
QF