Gene B21_03998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03998
Symbol	amiB
ID	8115771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	4300675
End bp	4302012
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	55%
IMG OID	644850150
Product	hypothetical protein
Protein accession	YP_003001723
Protein GI	251787419
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0860] N-acetylmuramoyl-L-alanine amidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00684197
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATATC GCATCAGAAA TTGGTTGGTA GCGACGTTGC TGCTGCTGTG CACGCCGGTG 
GGTGCCGCGA CGCTCTCTGA TATTCAGGTT TCTAACGGTA ATCAACAGGC GCGGATAACG 
TTGAGTTTTA TTGGCGATCC TGATTATGCG TTTAGCCATC AAAGCAAACG CACCGTGGCG 
CTCGATATCA AACAAACGGG CGTGATTCAG GGACTGCCGT TGTTGTTCAG CGGCAATAAT 
CTGGTGAAGG CGATTCGCTC TGGAACGCCT AAAGATGCAC AAACGCTACG GCTGGTGGTC 
GATCTTACCG AAAACGGTAA AACCGAAGCG GTGAAGCGGC AGAATGGCAG CAATTACAAT 
GTCGTCTTTA CGATTAACGC CGATGTGCCG CCACCGCCTC CTCCGCCGCC CGTGGTTGCG 
AAACGCGTTG AAACGCCTGC GGTTGTCGCA CCGCGCGTCA GCGAACCGGC GCGCAATCCG 
TTTAAAACGG AAAGTAACCG CACTACGGGT GTTATCAGCA GTAATACGGT AACGCGTCCG 
GCAGCGCGCG CGACGGCTAA CACTGGCGAT AAAATTATCA TCGCTATTGA TGCCGGACAC 
GGCGGTCAGG ACCCTGGCGC TATCGGCCCC GGTGGTACGC GGGAGAAAAA TGTCACCATC 
GCCATCGCGC GTAAATTGCG CACTTTGCTC AATGACGATC CGATGTTTAA AGGCGTTTTA 
ACCCGTGACG GGGATTACTT TATTTCGGTG ATGGGGCGCA GTGATGTGGC ACGTAAGCAA 
AACGCCAATT TCCTCGTGTC GATTCACGCT GATGCCGCAC CGAACCGCAG TGCGACTGGC 
GCTTCCGTAT GGGTGCTCTC TAACCGTCGT GCCAACAGTG AAATGGCCAG CTGGCTGGAG 
CAGCACGAGA AACAGTCGGA GCTGCTGGGT GGGGCGGGTG ATGTGCTGGC GAACAGTCAG 
TCTGACCCCT ATTTAAGCCA GGCGGTGCTG GATTTACAGT TCGGTCATTC CCAGCGGGTA 
GGGTATGATG TAGCGACCAG TATGATCAGT CAGTTGCAAC GCATTGGCGA AATACATAAA 
CGCCGACCAG AACACGCGAG TCTCGGCGTT CTGCGTTCGC CGGATATCCC GTCAGTACTG 
GTCGAAACCG GTTTTATCAG CAACAACAGC GAAGAACGTT TGCTGGCGAG CGACGATTAC 
CAACAACAGC TGGCAGAAGC CATTTACAAA GGCCTGCGCA ATTATTTCCT TGCGCATCCG 
ATGCAATCTG CGCCGCAGGG GGCAACGGCA CAAACTGCCA GTACGGTGAC GACGCCAGAT 
CGCACGCTGC CAAACTAA

Protein sequence

MIYRIRNWLV ATLLLLCTPV GAATLSDIQV SNGNQQARIT LSFIGDPDYA FSHQSKRTVA 
LDIKQTGVIQ GLPLLFSGNN LVKAIRSGTP KDAQTLRLVV DLTENGKTEA VKRQNGSNYN 
VVFTINADVP PPPPPPPVVA KRVETPAVVA PRVSEPARNP FKTESNRTTG VISSNTVTRP 
AARATANTGD KIIIAIDAGH GGQDPGAIGP GGTREKNVTI AIARKLRTLL NDDPMFKGVL 
TRDGDYFISV MGRSDVARKQ NANFLVSIHA DAAPNRSATG ASVWVLSNRR ANSEMASWLE 
QHEKQSELLG GAGDVLANSQ SDPYLSQAVL DLQFGHSQRV GYDVATSMIS QLQRIGEIHK 
RRPEHASLGV LRSPDIPSVL VETGFISNNS EERLLASDDY QQQLAEAIYK GLRNYFLAHP 
MQSAPQGATA QTASTVTTPD RTLPN