Gene EcSMS35_0339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0339
Symbol
ID	6144079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	348158
End bp	349585
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	51%
IMG OID	641615235
Product	iron-sulfur cluster binding protein
Protein accession	YP_001742443
Protein GI	170681838
COG category	[C] Energy production and conversion
COG ID	[COG1139] Uncharacterized conserved protein containing a ferredoxin-like domain
TIGRFAM ID	[TIGR00273] iron-sulfur cluster-binding protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGATCA AAACCAGTAA TACAGATTTT AAGACACGCA TCCGTCAGCA AATTGAAGAT 
CCGATCATGC GCAAAGCGGT GGCAAACGCG CAGCAGCGTA TCGGGGCAAA TCGGCAAAAA 
ATGGTCGATG AATTGGGGCA CTGGGAGGAG TGGCGCGATC GGGCCGCCCA GATACGTGAT 
CATGTTCTGA GTAATCTCGA CGCTTATCTG TACCAGCTCT CAGAAAAAGT GACGCAAAAC 
GGCGGTCACG TCTATTTTGC AAAAACCAAA GAAGACGCTA CCCGCTACAT TTTACAGGTT 
GCCCAACGCA AAAATGCCCG GAAGGTGGTG AAATCTAAAT CGATGGTGAC CGAAGAGATT 
GGTGTCAATC ATGTGTTGCA GGATGCTGGC ATTCAGGTGA TTGAAACCGA TCTGGGTGAA 
TACATTCTCC AGCTGGATCA AGATCCGCCC TCTCATGTTG TGGTCCCGGC AATTCATAAA 
GATCGCCATC AGATCCGTCG GGTGCTACAC GAACGTCTGG GCTATGAGGG GTCGGAAACG 
CCTGAAGCAA TGACCTTATT CATCCGGCAA AAAATCCGCG AAGATTTCCT CAGTGCTGAA 
ATAGGTATTA CCGGCTGTAA TTTCGCGGTG GCAGAGACCG GTTCGGTATG CCTGGTGACC 
AATGAAGGTA ATGCGCGAAT GTGTACCACG CTGCCTAAAA CGCATATTGC AGTGATGGGA 
ATGGAGCGTA TTGCCCCCAC GTTTGCCGAG GTAGATGTAT TGATCACCAT GCTGGCGCGC 
AGTGCCGTTG GTGCACGTTT GACGGGATAC AACACCTGGC TGACAGGACC GCGCGAAGCG 
GGGCACGTTG ATGGTCCTGA AGAGTTTCAT CTGGTTATTG TCGATAACGG GCGTTCTGAG 
GTGCTGGCCT CTGAATTTCG GGATGTGCTG CGCTGTATTC GCTGCGGGGC TTGTATGAAT 
ACTTGTCCGG CATATCGCCA TATTGGCGGT CATGGATATG GCTCTATTTA TCCAGGGCCA 
ATTGGTGCGG TGATTTCTCC GCTACTTGGC GGCTATAAAG ATTTTAAAGA TTTACCCTAC 
GCCTGCTCTT TATGCACCGC TTGTGACAGC GTGTGTCCGG TGCGTATTCC GCTGTCAAAA 
CTGATTTTGC GTCATCGTCG GGTGATGGCT GAAAAAGGGA TCACCGCAAA AGCAGAGCAA 
CGGGCGATAA AAATGTTCGC TTATGCCAAT AGTCATCCAG GATTGTGGAA AGTCGGGATG 
ATGGCCGGCG CTCATGCGGC AAGCTGGTTT ATCAATGGCG GCAAAACACC ACTCAAATTT 
GGCGCGATTA GCGACTGGAT GGAAGCACGC GATCTTCCTG AAGCTGACGG AGAGAGTTTC 
CGTAGTTGGT TTAAGAAACA TCAGGCGCAG GAGAAAAAGA ATGGATAA

Protein sequence

MSIKTSNTDF KTRIRQQIED PIMRKAVANA QQRIGANRQK MVDELGHWEE WRDRAAQIRD 
HVLSNLDAYL YQLSEKVTQN GGHVYFAKTK EDATRYILQV AQRKNARKVV KSKSMVTEEI 
GVNHVLQDAG IQVIETDLGE YILQLDQDPP SHVVVPAIHK DRHQIRRVLH ERLGYEGSET 
PEAMTLFIRQ KIREDFLSAE IGITGCNFAV AETGSVCLVT NEGNARMCTT LPKTHIAVMG 
MERIAPTFAE VDVLITMLAR SAVGARLTGY NTWLTGPREA GHVDGPEEFH LVIVDNGRSE 
VLASEFRDVL RCIRCGACMN TCPAYRHIGG HGYGSIYPGP IGAVISPLLG GYKDFKDLPY 
ACSLCTACDS VCPVRIPLSK LILRHRRVMA EKGITAKAEQ RAIKMFAYAN SHPGLWKVGM 
MAGAHAASWF INGGKTPLKF GAISDWMEAR DLPEADGESF RSWFKKHQAQ EKKNG