Gene B21_04176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_04176
Symbol	mcrB
ID	8114164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	4482357
End bp	4483736
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	40%
IMG OID	644850318
Product	hypothetical protein
Protein accession	YP_003001891
Protein GI	251787587
COG category	[V] Defense mechanisms
COG ID	[COG1401] GTPase subunit of restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATCAA TTCAAGCCTG GATTGAAAAA TTTATTGAGC AAGCACAGCA AAAAAGTTCA 
CAATCCACCA AAGATTATCC AACGTCTTAC CGTAACCTGC GAGTAAAAGT GAGTTTCGGT 
TATGGCAATT TTACATCTAT TCCCTGGTTT GCATTTCTGG GAGAAGGTCA GGAAGTTTCT 
AACGGTATAT ATCCCGTTAT TCTCTATTAT AAAGATTTTG ATGAGTTGGT TTTGGCTTAT 
GGTATAAGCG ACACGAATAA ACCACATGCC CAATGGCAGT TCTCTTCAGA CATACCTAAA 
ACAATCGCAG AGTATTTCCA GACAACTTCA GGTGTTTATC CTAAAAAATA CGGACAGTCC 
TATTACGCCT GTTCCCAAAA AGTCTCACAG GGTCTTGATT ATACCCGGTT TGCCTCCATG 
CTGGACAACA TAATCAACGA CTATAAATTA ATATTTAATT CTGGCAAGAG TGTTATTCCA 
CCTATGTCAA AAACTGAATC ATACTGTCTG GAAGATGCGT TAAATGATTT GTTTATCCCT 
GAAACCACGA TAGAGACGAT ACTCAAACGA TTAACCATCA AAAAAAATAT TATCCTCCAG 
GGGCCGCCCG GCGTTGGAAA AACCTTTGTT GCACGCCGTC TGGCTTACCT GCTGACAGGA 
GAAAAGGCTC CGCAACGCGT CAATATGGTT CAGTTCCATC AATCTTATAG CTATGAGGAT 
TTTATACAGG GCTATCGTCC GAATGGCGTC GGCTTCCGAC GTAAAGACGG CATATTTTAC 
AATTTTTGTC AGCAAGCTAA AGAGCAGCCA GAGAAAAAGT ATGTTTTTAT TATAGATGAA 
ATCAATCGTG CCAATCTCAG TAAAGTATTT GGCGAAGTGA TGATGTTAAT GGAACATGAT 
AAACGAGGTG AAAACTGGTC TGTTCCCTTA ACCTATTCCG AAAACGATGA AGAACGATTC 
TATGTCCCGG AGAATGTTTA TATTATCGGT TTAATGAATA CTGCCGATCG CTCTCTGGCC 
GTTGTTGATT ATGCCCTGCG CAGACGATTT TCTTTCATAG ATATTGAGCC TGGTTTTGAT 
ACACCACAGT TCCGTAATTT TTTACTGAAT AAAAAAGCAG AACCTTCATT TGTTGAGTCT 
TTATGCCAAA AAATGAATGA GTTAAACCAG GAAATCAGCA AAGAGGCCAC TATCCTTGGG 
AAAGGATTCC GCATTGGGCA TAGTTACTTC TGCTCCGGGT TGGAAGATGG CACCTCTCCT 
GATACGCAAT GGCTTAAGGA AATTGTGATG ACGGATATCG CCCCTTTACT CGAAGAATAT 
TTCTTTGATG ACCCCTATAA ACAACAGATA TGGGCCGACA AATTATTAGG TGACTCATAG

Protein sequence

MESIQAWIEK FIEQAQQKSS QSTKDYPTSY RNLRVKVSFG YGNFTSIPWF AFLGEGQEVS 
NGIYPVILYY KDFDELVLAY GISDTNKPHA QWQFSSDIPK TIAEYFQTTS GVYPKKYGQS 
YYACSQKVSQ GLDYTRFASM LDNIINDYKL IFNSGKSVIP PMSKTESYCL EDALNDLFIP 
ETTIETILKR LTIKKNIILQ GPPGVGKTFV ARRLAYLLTG EKAPQRVNMV QFHQSYSYED 
FIQGYRPNGV GFRRKDGIFY NFCQQAKEQP EKKYVFIIDE INRANLSKVF GEVMMLMEHD 
KRGENWSVPL TYSENDEERF YVPENVYIIG LMNTADRSLA VVDYALRRRF SFIDIEPGFD 
TPQFRNFLLN KKAEPSFVES LCQKMNELNQ EISKEATILG KGFRIGHSYF CSGLEDGTSP 
DTQWLKEIVM TDIAPLLEEY FFDDPYKQQI WADKLLGDS