Gene EcSMS35_4215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4215
Symbol	rmuC
ID	6147404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4312569
End bp	4313996
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	53%
IMG OID	641619038
Product	DNA recombination protein RmuC
Protein accession	YP_001746166
Protein GI	170682711
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.00178154
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGATTTCT CAATCATGGT TTACGCAGTT ATTGCATTGG TGGGTGTGGC AATTGGCTGG 
CTGTTTGCCA GTTATCAACA TGCGCAGCAA AAAGCCGAGC AATTAGCTGA ACGTGAAGAG 
ATGGTCGCGG AGTTAAGCGC GGCAAAACAA CAAATTACTC AAAGCGAGCA CTGGCGCGCT 
GAGTGCGAGT TACTCAATAA CGAAGTGCGC AGCCTGCAAA GTATTAACAC CTCTCTGGAG 
GCCGATCTGC GTGAAGTAAC CACGCGGATG GAAGCTGCAC AGCAACATGC TGACGATAAA 
ATTCGCCAGA TGATTAACAG CGAGCAGCGC CTCAGTGAGC AGTTTGAAAA CCTCGCCAAC 
CGTATTTTTG AGCACAGCAA TCGCCGGGTT GATGAGCAAA ACCGTCAGAG CCTGAACAGC 
CTGTTGTCGC CGCTACGTGA ACAACTGGAC GGTTTCCGCC GTCAGGTCCA GGACAGCTTT 
GGTAAAGAAG CCCAAGAACG TCATACCCTG ACTCACGAAA TCCGCAACCT CCAGCAACTC 
AACGCCCAGA TGGCCCAGGA AGCGATCAAC CTGACGCGTG CGCTGAAAGG CGACAATAAA 
ACCCAGGGCA ACTGGGGCGA GGTAGTATTG ACGCGGGTGC TGGAGGCTTC CGGTCTGCGT 
GAAGGGTATG AATATGAAAC CCAGGTCAGC ATCGAAAATG ACGCCCGCTC GCGGATGCAG 
CCGGATGTCA TCGTGCGGTT GCCGCAGGGA AAAGATGTGG TGATCGACGC CAAAATGACG 
CTGGTCGCCT ATGAACGCTA TTTCAACGCC GAAGATGACT ACACCCGCGA AAGCGCGCTA 
CAGGAACATA TCGCGTCGGT GCGTAACCAT ATCCGTTTGC TGGGACGCAA AGATTATCAA 
CAGCTGCCGG GGCTGCGAAC CCTGGATTAC GTTCTGATGT TTATTCCCGT TGAACCCGCT 
TTTTTACTGG CGCTTGACCG CCAGCCGGAG CTGATCACCG AAGCGTTGAA AAACAATATC 
ATGCTGGTTA GCCCGACTAC GCTGCTGGTG GCGCTGCGCA CTATCGCCAA CCTGTGGCGT 
TATGAGCATC AAAGCCGCAA CGCCCAGCAA ATCGCCGATC GTGCCAGCAA GCTGTACGAC 
AAGATGCGTT TGTTCGTCGA TGACATGTCA GCGATTGGTC AAAGTCTCGA CAAAGCGCAG 
GATAACTACC GCCAGGCAAT GAAAAAACTC TCTTCAGGTC GCGGAAATGT GCTGGCGCAG 
GCAGAAGCGT TTCGCGGTTT AGGGGTAGAA ATTAAACGCG AGATTAATCC GGATTTGGCT 
GAACAAGCGG TGAGCCAGGA TGAAGAGTAT CGACTGCGGT CGGTTCCGGA GCAGCCGAAT 
GATGAAGCTT ATCAACGCGA TGATGAATAT AATCAGCAGT CGCGCTAG

Protein sequence

MDFSIMVYAV IALVGVAIGW LFASYQHAQQ KAEQLAEREE MVAELSAAKQ QITQSEHWRA 
ECELLNNEVR SLQSINTSLE ADLREVTTRM EAAQQHADDK IRQMINSEQR LSEQFENLAN 
RIFEHSNRRV DEQNRQSLNS LLSPLREQLD GFRRQVQDSF GKEAQERHTL THEIRNLQQL 
NAQMAQEAIN LTRALKGDNK TQGNWGEVVL TRVLEASGLR EGYEYETQVS IENDARSRMQ 
PDVIVRLPQG KDVVIDAKMT LVAYERYFNA EDDYTRESAL QEHIASVRNH IRLLGRKDYQ 
QLPGLRTLDY VLMFIPVEPA FLLALDRQPE LITEALKNNI MLVSPTTLLV ALRTIANLWR 
YEHQSRNAQQ IADRASKLYD KMRLFVDDMS AIGQSLDKAQ DNYRQAMKKL SSGRGNVLAQ 
AEAFRGLGVE IKREINPDLA EQAVSQDEEY RLRSVPEQPN DEAYQRDDEY NQQSR