Gene EcSMS35_2764 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2764
Symbol
ID	6145375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2843656
End bp	2844918
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	51%
IMG OID	641617634
Product	hypothetical protein
Protein accession	YP_001744795
Protein GI	170681983
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4536] Putative Mg2+ and Co2+ transporter CorB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000294524
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.119885
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATCATTA TTCTGATCAT CATGGTGGTC ATTTCAGCCT ATTTTTCCGG GTCCGAAACC 
GGAATGATGA CCCTCAACCG CTATCGTCTG CGACATATGG CGAAACAGGG TAATCGCTCG 
GCCAAACGCG TCGAAAAATT GCTGCGTAAG CCAGACCGCC TGATTAGCCT GGTGTTAATC 
GGCAATAACC TGGTCAATAT TCTTGCCTCC GCGCTAGGCA CTATTGTTGG GATGCGTTTG 
TACGGCGATG CGGGCGTGGC AATTGCGACT GGTGTGCTGA CTTTTGTCGT GCTGGTTTTT 
GCTGAGGTAT TGCCGAAAAC CATTGCCGCG CTGTACCCGG AAAAAGTCGC TTATCCGAGT 
AGTTTTCTGC TGGCTCCGCT GCAAATTTTG ATGATGCCGC TGGTCTGGTT GCTGAATGCT 
ATCACCCGTA TGCTGATGCG CATGATGGGT ATCAAAACCG ATATCGTGGT TAGCGGCTCT 
TTGAGCAAAG AAGAGTTGCG CACTATCGTG CACGAATCGC GCTCACAAAT TTCCCGTCGC 
AATCAGGATA TGCTGCTGTC GGTGCTCGAT CTGGAAAAAA TGACCGTTGA TGACATCATG 
GTGCCGCGCA GTGAAATTAT CGGTATTGAT ATCAACGATG ACTGGAAATC GATTCTGCGC 
CAACTCTCCC ACTCACCTCA CGGGCGCATC GTGCTCTACC GTGATTCGCT GGACGACGCC 
ATCAGTATGC TGCGTGTGCG TGAAGCCTGG CGACTCATGT CGGAGAAAAA AGAGTTCACC 
AAAGAAACCA TGCTACGCGC CGCGGACGAG ATCTATTTTG TCCCGGAAGG TACGCCGCTC 
AGCACGCAGT TGGTGAAGTT TCAGCGCAAC AAAAAGAAAG TCGGCCTGGT CGTCAACGAG 
TATGGAGACA TTCAGGGGCT GGTGACGGTT GAAGATATTC TGGAAGAGAT TGTCGGCGAT 
TTCACCACGT CGATGTCGCC AACACTTGCC GAAGAAGTTA CGCCACAAAA CGACGGTTCG 
GTGATTATTG ATGGCACTGC CAACGTGCGA GAAATTAACA AAGCCTTTAA CTGGCATCTA 
CCGGAAGATG ATGCTCGTAC TGTTAACGGC GTCATTCTGG AAGCGCTGGA GGAGATCCCG 
GTAGCAGGCA CCCGCGTGCG TATTGGCGAG TACGATATTG ATATTCTCGA CGTTCAGGAC 
AATATGATTA AGCAGGTAAA AGTTTTTCCT GTGAAACCGC TACGCGAGAG CGTGGCGGAG 
TAA

Protein sequence

MIIILIIMVV ISAYFSGSET GMMTLNRYRL RHMAKQGNRS AKRVEKLLRK PDRLISLVLI 
GNNLVNILAS ALGTIVGMRL YGDAGVAIAT GVLTFVVLVF AEVLPKTIAA LYPEKVAYPS 
SFLLAPLQIL MMPLVWLLNA ITRMLMRMMG IKTDIVVSGS LSKEELRTIV HESRSQISRR 
NQDMLLSVLD LEKMTVDDIM VPRSEIIGID INDDWKSILR QLSHSPHGRI VLYRDSLDDA 
ISMLRVREAW RLMSEKKEFT KETMLRAADE IYFVPEGTPL STQLVKFQRN KKKVGLVVNE 
YGDIQGLVTV EDILEEIVGD FTTSMSPTLA EEVTPQNDGS VIIDGTANVR EINKAFNWHL 
PEDDARTVNG VILEALEEIP VAGTRVRIGE YDIDILDVQD NMIKQVKVFP VKPLRESVAE