Gene B21_04175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_04175
Symbol	mcrC
ID	8114995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	4481311
End bp	4482357
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	38%
IMG OID	644850317
Product	hypothetical protein
Protein accession	YP_003001890
Protein GI	251787586
COG category	[V] Defense mechanisms
COG ID	[COG4268] McrBC 5-methylcytosine restriction system component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAACAGC CCGTGATACC TGTCCGTAAT ATCTATTACA TGCTTACCTA TGCATGGGGT 
TATTTACAGG AAATTAAGCA GGCCGATCTT GAAGCCATTC CCGGTAACAA TCTTCTTGAT 
ATCCTGGGGT ATGTATTAAA TAAAGGGGTT TTACAGCTTT CACGCCGAGG GCTTGAGCTT 
GATTACAATC CTAATACCGA GATCATTCCT GGCATCAAAG GGCGAATAGA GTTTGCTAAA 
ACAATACGCG GCTTCCATCT TAATCATGGG AAAACCGTCA GTACTTTTGA TCTGCTTAAT 
GAAGATACGC TGGCTAACCG AATTATAAAA AGCACATTAG CCATGTTAAT TAAGCATGAA 
AAGTTAAACT CAACCATCAG AGATGAAGCT CGTTCACTTT ATAGAAAATT ACCGGGCATT 
AGCACTCTTC ATTTAACTCC GCAGCATTTC AGCTATCTGA ATGGCGGAAA GAACACGCGT 
TATTATAAAT TTGTTATCAG CGTCTGTAAG TTCATCGTCA ATAATTCTAT CCCAGGTCAA 
AACAAAGGAC ACTACCGTTT CTATGATTTT GAAAGAAACG AAAAAGAGAT GTCATTACTT 
TATCAAAAGT TTCTTTTTGA ATTTTGCCGC CGTGAATTAA CGTCTGCAAA TACAACCCGC 
TCTTATTTAA AATGGGATGC ATCGAGCATA TCGGATCAGT CACTTAATTT GTTACCTCGA 
ATGGAAACTG ACATCACCAT TCGCTCATCA GAAAAAATAC TTATCGTTGA CGCCAAATAC 
TATAAGAGCA TTTTTTCACG ACGAATGGGC TCAGAAAAAT TTCACTCTCA AAATCTTTAT 
CAACTGATGA ATTACTTATG GTCGTTAAAA CCTGAAAATG GCGAAAACAT AGGGGGTTTA 
TTAATATACC CCCACGTAGA CACCGCAGTG AAACATCGTT ATAAAATTAA TGGCTTCGAT 
ATTGGCCTGT GTACCGTCAA TTTAGGTCAG GAATGGCCGT GTATACATCA AGAATTACTC 
GCCATTTTCG ATGAATATCT CAAATAA

Protein sequence

MEQPVIPVRN IYYMLTYAWG YLQEIKQADL EAIPGNNLLD ILGYVLNKGV LQLSRRGLEL 
DYNPNTEIIP GIKGRIEFAK TIRGFHLNHG KTVSTFDLLN EDTLANRIIK STLAMLIKHE 
KLNSTIRDEA RSLYRKLPGI STLHLTPQHF SYLNGGKNTR YYKFVISVCK FIVNNSIPGQ 
NKGHYRFYDF ERNEKEMSLL YQKFLFEFCR RELTSANTTR SYLKWDASSI SDQSLNLLPR 
METDITIRSS EKILIVDAKY YKSIFSRRMG SEKFHSQNLY QLMNYLWSLK PENGENIGGL 
LIYPHVDTAV KHRYKINGFD IGLCTVNLGQ EWPCIHQELL AIFDEYLK