Gene EcSMS35_4291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4291
Symbol	rafY2
ID	6146426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4394485
End bp	4395879
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	45%
IMG OID	641619112
Product	glycoporin RafY
Protein accession	YP_001746236
Protein GI	170681010
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.216775
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAT CGACATTATC TTTAGCCATC GGTTTATTAT TGGCATGTAG TACCGGAATG 
GCAAAAACAC AGCATTTAAC GCTGGAACAA CGCATGGCAT TGCTGGAAGA ACGCCTGGAA 
GCGGCAGAAA TGCGGGCAGC AAAAGCAGAG AGCCAGGTTA AACAGCTGCA GACACAACAA 
GCCGCTGAGA TCCGCGAAAT TAAGGCTGCC CAGGGCAATA CGCCGGTAAA TGGACAGGCA 
ACGGCGGAAT CTGCAAAGAA AAACTCCACC TCACCTAATC TTTTGCTCTC AGGTTATGGC 
GATTTAAAAA TCTACGGCGA CGTAGAATTT AATATGGATG CAGAAAGTAA TCATGGCCTG 
CTGGCAATGA CCAACGCTGA TGTGAATAGC GATCCCACTA ATGAACAGTG GAATCTCAAT 
GGTCGTATTT TGTTAGGTTT TGATGGTATG CGAAAACTGG ATAATGGCTA TTTCGCCGGG 
TTCTCCGCAC AACCGCTGGG GGACATGCAC GGTTCAGTAA ATATCGATGA TGCGGTATTC 
TTCTTTGGGA AAGAGAATGA CTGGAAGGTC AAAGTCGGCC GTTTTGAAGC CTACGATATG 
TTCCCGCTGA ATCAGGATAC CTTTGTTGAA CATTCCGGTA ATACTGCGAA CGATCTTTAT 
GACGATGGCA GCGGTTATAT CTATATGATG AAAGAGGGCC GCGGGCGCTC TAACGCTGGC 
GGTAATTTCC TCGTCAGCAA ACAACTTGAT AACTGGTATT TTGAGTTAAA CACGTTACTT 
GAAGACGGAA CATCTTTATA TAATGACGGT AATTATCATG GACGCGATAT GGAGCAGCAG 
AAAAATGTTG CTTATCTGCG TCCGGTAATT GCCTGGTCGC CGACGGAAGA ATTCACCGTT 
TCCGCAGCGA TGGAAGCGAA CGTAGTAAAT AATGCTTATG GTTATACCGA TAGCAAGGGT 
AATTTTGTCG ATCAGTCCGA TCGTACCGGC TATGGTATGA GCATGACCTG GAATGGCCTG 
AAAACGGATC CGGAAAATGG CGTCGTGGTT AATCTTAATA CCGCCTATTT AGATGCTAAT 
AATGAGAAAG ATTTCACTGC CGGGATTAAC GCGCTGTGGA AACGTTTCGA GCTGGGTTAT 
ATCTACGCGC ACAATAAGAT TGATGAATTC AGCGGTGTAG TTTGTGATAA CGACTGCTGG 
ATTGATGATG AAGGGACGTA CACCATTCAC ACCATTCATG CGTCTTATCA GTTCGCTAAT 
GTGATGGATA TGGAGAACTT TAATATTTAC CTCGGGACGT ATTACTCCAT TCTGGATAGC 
GACGGTGATA AAAAACACGG TGATGATACT GATGACCGTT ACGGCGCACG CGTTCGCTTT 
AAATACTTCT TCTGA

Protein sequence

MKKSTLSLAI GLLLACSTGM AKTQHLTLEQ RMALLEERLE AAEMRAAKAE SQVKQLQTQQ 
AAEIREIKAA QGNTPVNGQA TAESAKKNST SPNLLLSGYG DLKIYGDVEF NMDAESNHGL 
LAMTNADVNS DPTNEQWNLN GRILLGFDGM RKLDNGYFAG FSAQPLGDMH GSVNIDDAVF 
FFGKENDWKV KVGRFEAYDM FPLNQDTFVE HSGNTANDLY DDGSGYIYMM KEGRGRSNAG 
GNFLVSKQLD NWYFELNTLL EDGTSLYNDG NYHGRDMEQQ KNVAYLRPVI AWSPTEEFTV 
SAAMEANVVN NAYGYTDSKG NFVDQSDRTG YGMSMTWNGL KTDPENGVVV NLNTAYLDAN 
NEKDFTAGIN ALWKRFELGY IYAHNKIDEF SGVVCDNDCW IDDEGTYTIH TIHASYQFAN 
VMDMENFNIY LGTYYSILDS DGDKKHGDDT DDRYGARVRF KYFF