Gene EcolC_2778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2778
Symbol
ID	6064866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3045615
End bp	3046640
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	51%
IMG OID	641602184
Product	PBSX family phage portal protein
Protein accession	YP_001725733
Protein GI	170020779
COG category	[R] General function prediction only
COG ID	[COG5518] Bacteriophage capsid portal protein
TIGRFAM ID	[TIGR01540] phage portal protein, PBSX family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000105217
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGAAAGA GTAAGAAGAA CCGCACTGCG GCGACGAAAC AGATCCAGCT TAAAAGTCAA 
ACTACAGCCG AAGCATTCAG CTTCGGCGAT CCCGTTCCTG TTCTGGACCG CCGAGAACTG 
CTGGATTATG TGGAATGCGT ACAGATGGAC CGCTGGTATG AGCCGCCCGT CAGCTTTGAC 
GGACTGGCGC GCACCTTCCG CGCTGCCGTG CATCATAGTT CCCCGATTGC AGTAAAGTGC 
AACATTCTGA CCAGCACCTA CATCCCTCAC CCGCTGCTCA GCCAGCAGGC TTTTTCGCGT 
TTTGTGCAGG ACTATCTGGT ATTTGGTAAC GCCTACCTGG AGAAACGCAC GAACCGCTTC 
GGTGAAGTTA TCGCCCTTGA ACCTGCCCTG GCAAAATACA CCCGACGCGG GTTAGACCTG 
GATACCTACT GGTTTGTGCA ATACGGTATG ACCACGCAGC CATATCAGTT CACGAAAGGC 
AGCATCTTTC ATCTGATGGA ACCGGACATC AACCAGGAGA TCTACGGCCT GCCCGGTTAT 
CTTTCTGCCA TTCCGTCAGC CCTGCTCAAC GAGTCCGCCA CGCTGTTCCG CCGAAAGTAT 
TACATTAACG GCAGTCATGC TGGCTTCATC ATGTACATGA CCGATGCTGC GCAGAACCAG 
GAGGATGTGA ACAACCTCCG CAACGCAATG AAAAGCGCCA AAGGTCCAGG CAACTTCCGC 
AACCTGTTTA TGTACTCACC TAACGGCAAA AAGGATGGTC TTCAGATTAT CCCGTTGTCA 
GAAGTCGCGG CAAAGGATGA ATTTCTGAAC ATCAAGAACG TGAGCCGGGA TGACATGATG 
GCGGCACACC GCGTGCCTCC GCAAATGATG GGTATCATGC CGAATAATGT TGGCGGGTTT 
GGGGATGTGG AGAAGGCATC CACGGTTTTT GTACGTAATG AATTAAAGCC TCTTCAACAA 
CGAATTAGAG AGGTGAACAA TTGGCTACAT GATGACGTAA TAAAATTCCA AGATTACTCC 
TTGTAA

Protein sequence

MGKSKKNRTA ATKQIQLKSQ TTAEAFSFGD PVPVLDRREL LDYVECVQMD RWYEPPVSFD 
GLARTFRAAV HHSSPIAVKC NILTSTYIPH PLLSQQAFSR FVQDYLVFGN AYLEKRTNRF 
GEVIALEPAL AKYTRRGLDL DTYWFVQYGM TTQPYQFTKG SIFHLMEPDI NQEIYGLPGY 
LSAIPSALLN ESATLFRRKY YINGSHAGFI MYMTDAAQNQ EDVNNLRNAM KSAKGPGNFR 
NLFMYSPNGK KDGLQIIPLS EVAAKDEFLN IKNVSRDDMM AAHRVPPQMM GIMPNNVGGF 
GDVEKASTVF VRNELKPLQQ RIREVNNWLH DDVIKFQDYS L