Gene EcolC_3844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3844
Symbol
ID	6066881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4199674
End bp	4201011
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	55%
IMG OID	641603256
Product	N-acetylmuramoyl-l-alanine amidase II
Protein accession	YP_001726775
Protein GI	170021821
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0860] N-acetylmuramoyl-L-alanine amidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000499267
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000287323
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATGTATC GCATCAGAAA TTGGTTGGTA GCGACGCTGC TGCTGCTGTG CACGCCGGTG 
GGTGCCGCGA CGCTCTCTGA TATTCAGGTT TCTAACGGTA ATCAACAGGC GCGGATAACG 
TTGAGTTTTA TTGGCGATCC TGATTATGCG TTTAGCCATC AAAGCAAACG CACCGTGGCG 
CTCGATATCA AACAAACGGG CGTGATTCAG GGACTGCCGT TGTTGTTCAG CGGCAATAAT 
CTGGTGAAGG CGATTCGCTC TGGAACGCCT AAAGATGCAC AAACGCTACG GCTGGTGGTC 
GATCTTACCG AAAACGGTAA AACCGAAGCG GTGAAGCGGC AGAATGGCAG CAATTACACT 
GTCGTCTTTA CGATTAACGC CGATGTGCCG CCACCGCCTC CTCCGCCGCC CGTGGTTGCG 
AAACGCGTTG AAACGCCTGC GGTTGTCGCA CCGCGCGTCA GCGAACCGGC GCGCAATCCG 
TTTAAAACGG AAAGTAACCG CACTACGGGT GTTATCAGCA GTAATACGGT AACGCGTCCG 
GCAGCGCGCG CGACGGCTAA CACTGGCGAT AAAATTATCA TCGCTATTGA TGCCGGACAC 
GGCGGTCAGG ACCCTGGCGC TATCGGCCCC GGTGGTACGC GGGAGAAAAA TGTCACCATC 
GCCATCGCGC GTAAATTGCG TACTTTGCTC AATGACGATC CGATGTTTAA AGGCGTTTTA 
ACCCGTGACG GGGATTACTT TATCTCGGTG ATGGGGCGCA GTGATGTGGC ACGTAAGCAA 
AACGCCAATT TCCTCGTGTC GATTCACGCT GATGCCGCAC CGAACCGCAG TGCGACTGGC 
GCTTCCGTAT GGGTGCTCTC TAACCGTCGC GCCAACAGTG AAATGGCCAG CTGGCTGGAG 
CAGCACGAGA AACAGTCGGA GCTGCTGGGT GGGGCGGGTG ATGTGCTGGC GAACAGTCAG 
TCTGACCCCT ATTTAAGCCA GGCGGTGCTG GATTTACAGT TCGGTCATTC CCAGCGGGTA 
GGGTATGATG TAGCGACCAG TATGATCAGT CAGTTGCAAC GCATTGGCGA AATACATAAA 
CGTCGACCAG AACACGCCAG CCTTGGCGTT CTGCGCTCGC CGGATATCCC ATCAGTACTG 
GTCGAAACCG GTTTTATCAG CAACAACAGC GAAGAACGTT TGCTGGCGAG CGACGATTAC 
CAACAACAGC TGGCAGAAGC CATTTACAAA GGCCTGCGCA ATTATTTCCT TGCGCATCCG 
ATGCAATCTG CGCCGCAGGG TGCAACGGCA CAAACTGCCA GTACGGTGAC GACGCCAGAT 
CGCACGCTGC CAAACTAA

Protein sequence

MMYRIRNWLV ATLLLLCTPV GAATLSDIQV SNGNQQARIT LSFIGDPDYA FSHQSKRTVA 
LDIKQTGVIQ GLPLLFSGNN LVKAIRSGTP KDAQTLRLVV DLTENGKTEA VKRQNGSNYT 
VVFTINADVP PPPPPPPVVA KRVETPAVVA PRVSEPARNP FKTESNRTTG VISSNTVTRP 
AARATANTGD KIIIAIDAGH GGQDPGAIGP GGTREKNVTI AIARKLRTLL NDDPMFKGVL 
TRDGDYFISV MGRSDVARKQ NANFLVSIHA DAAPNRSATG ASVWVLSNRR ANSEMASWLE 
QHEKQSELLG GAGDVLANSQ SDPYLSQAVL DLQFGHSQRV GYDVATSMIS QLQRIGEIHK 
RRPEHASLGV LRSPDIPSVL VETGFISNNS EERLLASDDY QQQLAEAIYK GLRNYFLAHP 
MQSAPQGATA QTASTVTTPD RTLPN