Gene SbBS512_E4304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4304
Symbol	rmuC
ID	6271150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	4022112
End bp	4023539
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	53%
IMG OID	641728114
Product	DNA recombination protein RmuC
Protein accession	YP_001882534
Protein GI	187733503
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATTTCT CAATCATGGT TTACGCAGTT ATTGCGTTGG TGGGTGTGGC AATTGGCTGG 
CTGTTTGCCA GTTATCAACA TGCGCAGCAA AAAGCCGAGC AATTAGCTGA ACGTGAAGAG 
ATGGTCGCGG AGTTAAGCGC GGCAAAACAA CAAATTACCC AAAGCGAGCA CTGGCGTGCA 
GAGTGCGAGT TACTCAATAA CGAAGTGCGC AGCCTGCAAA GTATTAACAC CTCTCTGGAG 
GCCGATCTGC GTGAAGTAAC CACGCGGATG GAAGCCGCAC AGCAACATGC TGACGATAAA 
ATTCGCCAGA TGATTAACAG CGAGCAGCGC CTCAGTGAGC AGTTTGAAAA CCTCGCCAAC 
CGTATTTTTG AGCACAGCAA TTGCCGGGTT GATGAGCAAA ACCGTCAGAG TCTGAACAGC 
CTGTTGTCGC CGCTACGTGA ACAACTGGAC GGTTTCCGCC GTCAGGTTCA GGACAGCTTC 
GGTAAAGAAG CACAAGAACG CCATACCCTG ACCCACGAAA TTCGCAATCT CCAGCAACTC 
AACGCGCAAA TGGCCCAGGA AGCGATCAAC CTGACGCGCG CGCTGAAAGG CGACAATAAA 
ACCCAGGGCA ACTGGGGCGA GGTAGTATTG ACGCGGGTGC TGGAGGCTTC CGGTCTGCGT 
GAAGGGTATG AATATGAAAC CCAGGTCAGC ATCGAAAATG ACGCCCGCTC GCGGATGCAG 
CCGGATGTCA TCGTGCGGCT GCCGCAGGGA AAAGATGTGG TGATCGACGC CAAAATGACG 
CTGGTCGCCT ATGAACGCTA TTTTAACGCC GAAGACGACT ACACCCGCGA AAGCGCGCTA 
CAGGAACATA TCGCGTCGGT GCGTAACCAT ATCCGTTTGC TGGGACGCAA AGATTATCAA 
CAGCTGCCGG GGCTGCGAAC TCTGGATTAC GTGCTGATGT TTATTCCCGT TGAACCCGCT 
TTTTTACTGG CGCTTGACCG CCAGCCGGAG CTGATCACCG AAGCGTTGAA AAACAATATC 
ATGCTGGTTA GCCCGACTAC GCTGCTGGTG GCGTTGCGTA CTATTGCCAA CCTGTGGCGT 
TATGAGCATC AAAGCCGCAA CGCCCAGCAA ATCGCCGATC GTGCCAGCAA GCTGTACGAC 
AAGATGCGTT TGTTCATCGA TGACATGTCC GCGATTGGTC AAAGTCTCGA CAAAGCGCAG 
GATAACTACC GCCAGGCAAT GAAAAAACTC TCTTCAGGTC GCGGAAATGT GCTGGCGCAG 
GCAGAAGCGT TTCGCGGTTT AGGAGTAGAA ATTAAACGCG AGATTAATCC GGATTTGGCT 
GAACAGGCGG TGAGCCAGGA TGAAGAGTAT CGACTTCGGT CGGTTCCGGA GCAGCCGAAT 
GATGAAGCTT ATCAACGCGA TGATGAATAT AATCAGCAGT CGCGCTAG

Protein sequence

MDFSIMVYAV IALVGVAIGW LFASYQHAQQ KAEQLAEREE MVAELSAAKQ QITQSEHWRA 
ECELLNNEVR SLQSINTSLE ADLREVTTRM EAAQQHADDK IRQMINSEQR LSEQFENLAN 
RIFEHSNCRV DEQNRQSLNS LLSPLREQLD GFRRQVQDSF GKEAQERHTL THEIRNLQQL 
NAQMAQEAIN LTRALKGDNK TQGNWGEVVL TRVLEASGLR EGYEYETQVS IENDARSRMQ 
PDVIVRLPQG KDVVIDAKMT LVAYERYFNA EDDYTRESAL QEHIASVRNH IRLLGRKDYQ 
QLPGLRTLDY VLMFIPVEPA FLLALDRQPE LITEALKNNI MLVSPTTLLV ALRTIANLWR 
YEHQSRNAQQ IADRASKLYD KMRLFIDDMS AIGQSLDKAQ DNYRQAMKKL SSGRGNVLAQ 
AEAFRGLGVE IKREINPDLA EQAVSQDEEY RLRSVPEQPN DEAYQRDDEY NQQSR