Gene Daro_3049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3049
Symbol
ID	3568253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3293633
End bp	3294982
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	59%
IMG OID	637681520
Product	cell wall hydrolase/autolysin
Protein accession	YP_286249
Protein GI	71908662
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0860] N-acetylmuramoyl-L-alanine amidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	0.429243
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0314787
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAAAC GCGCTCATCC CAACCTTGGG CGCCGACAGC TTCTCCGTTA TGCCGGCGCC 
TCACTGATCC TTTCCGTTTC GCCGATTGCC GGTGCCGCGG CCAAGTTGCC GTCTGTCCTC 
GCCGTGCGTA TATGGCCGGC TGCCGATTAC ACCCGTGTCA CCCTCGAACA CGACGCACCG 
CTTAAATTTA CCCATTTCAT TGTCGAGAAC CCGGATCGAC TGGTCGTTGA TATCGAAGGG 
GTCGAGTTCA ACAGTGTCCT TGATAGCCTT GCCCGCAAGG TGGCGACTGA CGATCCGAAC 
ATCAAGCTGT TACGCGCCGG TCGCTTCAAG CCAGGTGTCG TTCGCTTGGT CATGGAGCTG 
AAGGGCAAAG TTAATCCGCA GGTCTTCACG CTGGAGCCGG CAGGCGAGTA TGGCCGTCGT 
CTGGTGCTTG ACGTCTATCC AGTCAACCCG CCGGACCCGA TGATGGCGCT GCTCGAAGGG 
CGCAAGGACG CGGTTGAGCC GCTGAAGAAT GAGCATGATT TCCAGATCAC TGAAAAGCGG 
CCCGATGAAG TTGCCGCCAA GATTCCGGAA AAACCGATCG AGGCACCTGA GGTTCAGACC 
AGCAAGAAGT CCGGCAAGCC GATTGTCGAT CGCCTGGTCA CCATCATGCT CGACCCCGGC 
CACGGTGGCG AAGATCCCGG TGCCATCGGC AAGGCGGGAA CCTACGAAAA GAATGTCACG 
CTGGAAGTAG CTCGCCGCCT GAAGGCGCGA ATCGATGCCG AGCCAAACAT GCGCGCGGTG 
CTGACGCGTG ATTCCGATTT CTTCGTGCCG CTACAGATGC GCGTCCAGAA GGCCCGCCGA 
ATCCAGTCCG ATCTCTTCCT GTCGATTCAT GCCGATGCCT GGATCAAGCC GGATGCCAAG 
GGTTCATCGG TGTTCGTGCT GTCCGAAAAG GGGGCCTCCA GCACCCAGGC TCGCCTGCTC 
GCCCAGAAGG AGAATCAGGC CGACCTGATT GGCGGGGTAA ATATTGGTAG CAAGGATCTA 
TTTCTGGCCC GTACGCTGCT CGATCTGTCG CAGACCGGGA CGATCAACGA TAGCCTGAAG 
CTGGGCAAGT ACCTGCTGGG TGAACTCGGG GCGATCAATA CGCTGCACAA GGCGAACGTT 
GAACAGGCCG GTTTTGCCGT GCTCAAGGCG CCGGACATCC CGTCTGCGCT GATTGAAACG 
GCGTTCATTT CCAATCCGGA AGAAGAAAGC CGGCTGAACG ACGATGCGTA TCAGGAAAAA 
CTGGCCGGAG CGATCGTGCG CGGTATCAGG CAGTATTTCA TCAAGCATCC GCCAGGGCCA 
AAGTCCAAGC TGGCCGCGCT CGGCTGGTGA

Protein sequence

MSKRAHPNLG RRQLLRYAGA SLILSVSPIA GAAAKLPSVL AVRIWPAADY TRVTLEHDAP 
LKFTHFIVEN PDRLVVDIEG VEFNSVLDSL ARKVATDDPN IKLLRAGRFK PGVVRLVMEL 
KGKVNPQVFT LEPAGEYGRR LVLDVYPVNP PDPMMALLEG RKDAVEPLKN EHDFQITEKR 
PDEVAAKIPE KPIEAPEVQT SKKSGKPIVD RLVTIMLDPG HGGEDPGAIG KAGTYEKNVT 
LEVARRLKAR IDAEPNMRAV LTRDSDFFVP LQMRVQKARR IQSDLFLSIH ADAWIKPDAK 
GSSVFVLSEK GASSTQARLL AQKENQADLI GGVNIGSKDL FLARTLLDLS QTGTINDSLK 
LGKYLLGELG AINTLHKANV EQAGFAVLKA PDIPSALIET AFISNPEEES RLNDDAYQEK 
LAGAIVRGIR QYFIKHPPGP KSKLAALGW