Gene EcSMS35_2454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2454
Symbol
ID	6145162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2503935
End bp	2505476
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	52%
IMG OID	641617326
Product	hypothetical protein
Protein accession	YP_001744498
Protein GI	170681615
COG category	[S] Function unknown
COG ID	[COG1288] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000219916
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAAGGGA ATATTTGCGC TATGTCCGCA ATCACTGAAT CTAAACCAAC AAGAAGATGG 
GCAATGCCCG ATACGTTGGT GATTATCTTT TTTGTTGCCA TTTTAACCAG CCTTGCCACC 
TGGGTAGTTC CGGTGGGCAT GTTTGACAGT CAGGAAGTGC AGTATCAGGT TGATGGTCAA 
ACAAAAACAC GCAAAGTCGT AGATCCACAC TCATTCCGCA TTCTGACTAA CGAAGCAGGC 
GAACCTGAGT ATCACCGCGT ACAACTGTTC ACGACGGGCG ATGAACGCCC GGGTCTGATG 
AACTTCCCGT TTGAAGGGTT AACCTCAGGA TCGAAATACG GGACAGCCGT TGGCATCATC 
ATGTTTATGC TGGTGATTGG CGGCGCGTTT GGCATTGTGA TGCGTACAGG AACCATTGAT 
AACGGTATCC TGGCGCTTAT TCGCCATACT CGCGGGAATG AAATTCTCTT TATTCCTGCG 
CTGTTTATTC TGTTTTCACT TGGCGGTGCG GTATTTGGTA TGGGGGAAGA GGCCGTCGCC 
TTTGCCATTA TCATCGCACC GCTAATGGTC CGGCTGGGCT ATGACAGTAT TACCACCGTC 
CTGGTGACTT ATATTGCCAC GCAAATCGGT TTTGCCAGTT CGTGGATGAA CCCGTTTTGT 
GTGGTCGTTG CTCAGGGGAT TGCCGGCGTT CCGGTGCTTT CTGGCTCCGG GTTGCGCATC 
GTGGTATGGG TTATCGCCAC TCTGATTGGC CTGATCTTTA CCATGGTGTA CGCCTCACGA 
GTGAAAAAGA ATCCTCTTCT GTCACGCGTG CATGAGTCCG ACCGCTTCTT TCGTGAAAAG 
CAGGCGGATG TTGAACAACG TCCGTTTACC TTTGGTGACT GGCTGGTATT GATTGTCCTG 
ACCGCCGTAA TGGTCTGGGT GATTTGGGGC GTGATCGTTA ATGCCTGGTT TATTCCAGAA 
ATTGCCAGCC AGTTCTTCAC CATGGGTCTG GTGATTGGCA TCATCGGCGT CGTTTTCCGC 
CTTAACGGCA TGACGGTTAA TACCATGGCT TCATCCTTTA CCGAAGGGGC GCGAATGATG 
ATCGCCCCTG CCCTGCTGGT GGGTTTCGCC AAAGGGATTT TGCTGCTGGT CGGTAATGGT 
GAAGCGGGTG ATGCCAGCGT GTTAAATACC ATCCTCAACA GCATTGCCAA TGCCATTAGC 
GGTCTGGATA ACGCGGTCGC GGCCTGGTTT ATGTTGCTCT TCCAGGCAGT ATTTAATTTC 
TTCGTGACGT CCGGTTCTGG TCAGGCGGCG TTAACCATGC CGTTACTGGC ACCGCTTGGC 
GATCTGGTCG GTGTTAACCG TCAGGTTACC GTGCTGGCGT TCCAGTTTGG TGATGGCTTC 
AGCCACATCA TTTACCCGAC CTCAGCTTCG TTAATGGCAA CGCTCGGTGT TTGCCGGGTG 
GACTTCCGTA ACTGGCTGAA GGTGGGCGCG ACACTGCTTG GACTGCTGTT TATTATGTCC 
AGCGTCGTGG TGATCGGCGC TCAGTTGATG GGCTACCACT AA

Protein sequence

MQGNICAMSA ITESKPTRRW AMPDTLVIIF FVAILTSLAT WVVPVGMFDS QEVQYQVDGQ 
TKTRKVVDPH SFRILTNEAG EPEYHRVQLF TTGDERPGLM NFPFEGLTSG SKYGTAVGII 
MFMLVIGGAF GIVMRTGTID NGILALIRHT RGNEILFIPA LFILFSLGGA VFGMGEEAVA 
FAIIIAPLMV RLGYDSITTV LVTYIATQIG FASSWMNPFC VVVAQGIAGV PVLSGSGLRI 
VVWVIATLIG LIFTMVYASR VKKNPLLSRV HESDRFFREK QADVEQRPFT FGDWLVLIVL 
TAVMVWVIWG VIVNAWFIPE IASQFFTMGL VIGIIGVVFR LNGMTVNTMA SSFTEGARMM 
IAPALLVGFA KGILLLVGNG EAGDASVLNT ILNSIANAIS GLDNAVAAWF MLLFQAVFNF 
FVTSGSGQAA LTMPLLAPLG DLVGVNRQVT VLAFQFGDGF SHIIYPTSAS LMATLGVCRV 
DFRNWLKVGA TLLGLLFIMS SVVVIGAQLM GYH