Gene EcSMS35_2504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2504
Symbol
ID	6147284
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2551711
End bp	2552958
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	34%
IMG OID	641617376
Product	hypothetical protein
Protein accession	YP_001744548
Protein GI	170682511
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTACCAT CTATTTCAAT CAACAATACC AGCGCAGCTT ACACAGAATC CATCAATGAA 
AATAACAATG ATGAAGTTAA TATATTAGTA CAAGAGCTCA AAAACCTTTT TAATGGTAAG 
CAAGGAATAA GCACCTGTGT TAAACATCTA CTTGCGCTTA TAAAAAACGC CATACGAGGA 
AACGACAATC CTGATAGATT TAATATTAAT AATTCCTCAG TTACTTATAT TGATATTGGC 
TCCAATGATA CAGACTATAT TACTATTGGT ATCGATAACC AAGAAACAAT AAAATTACTT 
GCGAGCTATA AAGACAAAGA ACTCGTCCGT GCTATCATTA ATGACAACAT AGTTGAGAAG 
ACTCATGATG ATATAAATAA TGCTGACTTT ACTGATGGTA GTATCGTTGT TAGTGGTAAT 
GAGGGTGCTA TTGACTCCAA TGATACAGCC GATATTACTA GTGGTATCTA TAATCAAGAA 
CCAATAAAAT CACCTACGAA CGATGAAAAC AAAAAAGTCG GCCAAACCAT CATCCATGAA 
AATGTAGTAG AGAATACTCA TGATATCAAT AAGAAGGAAA TGATCTTCAG CGCATTAAAA 
GAAATATATG ATGGAGATCC TGGTTTTATC TTCGATAAGA TATCACAAAA ACTCAGACAT 
ACGATAACGG AATTTGATGA GAATGGGAAA AGCGAACCAA CGGACTTATT TACCTGGTAC 
GGTAAAGATA AAAAAGGCGA TTCTCTCGCT ATTGTAATTA AAAATAAAAA CGGAAATGAT 
TACTTATCTC TCGGTTACTA TGATCAGGAC GACTACCACA TTCAAAGAGG AATTCGTATT 
AATGGTGATA GTCTCACCCA ATATTGTAGT GAAAAAGCCA GGAATGCTTC AGCGTGGTTT 
GAAAGCAGTA AAGCTATCAT GGCAGAATCA TTTGCAACAG GTTCCGATCA TCAGGTTGTA 
AACGAGCTCA ACGGGGAAAG ACTGAGAGAG CCAAACGAAG TTTTTAAACG TTTAGGTCGA 
GCAATAAGAT ATAATTTTCA AGTGGACGAT GCAAAATTTA GACGCGATAA TGTAAAAGAA 
ATAATTTCTA CTTTAGTCGA TAACGAAGTT GACCGTTCTC AAAATAAATA TGACCACTTT 
AAGGAAATCG AAGATAAAGT TGAAAAAAGG CTTCAAAATC GCCAGGCTAA ATATCAAAAT 
GAAATTAATC AACTATCTGC ATTGGATGTT AATTTTGATG ATAATTAA

Protein sequence

MLPSISINNT SAAYTESINE NNNDEVNILV QELKNLFNGK QGISTCVKHL LALIKNAIRG 
NDNPDRFNIN NSSVTYIDIG SNDTDYITIG IDNQETIKLL ASYKDKELVR AIINDNIVEK 
THDDINNADF TDGSIVVSGN EGAIDSNDTA DITSGIYNQE PIKSPTNDEN KKVGQTIIHE 
NVVENTHDIN KKEMIFSALK EIYDGDPGFI FDKISQKLRH TITEFDENGK SEPTDLFTWY 
GKDKKGDSLA IVIKNKNGND YLSLGYYDQD DYHIQRGIRI NGDSLTQYCS EKARNASAWF 
ESSKAIMAES FATGSDHQVV NELNGERLRE PNEVFKRLGR AIRYNFQVDD AKFRRDNVKE 
IISTLVDNEV DRSQNKYDHF KEIEDKVEKR LQNRQAKYQN EINQLSALDV NFDDN