Gene Daro_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0020
Symbol
ID	3570044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	25900
End bp	26931
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	57%
IMG OID	637678449
Product	peptidoglycan-binding LysM
Protein accession	YP_283249
Protein GI	71905662
COG category	[S] Function unknown
COG ID	[COG1652] Uncharacterized protein containing LysM domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	0.732804
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.419154
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCGCA TTATATCCGC GCTCATCCTG GCCGTGACGG CCGTCTGCGC ATCGGCCGCC 
GAGCCGCTAC AACTCGTCGA CAATCCGCCT GATCGTCATA TCGTCGTCAA GGGCGACACG 
TTGTGGGGCA TTTCCGGCAA ATTCCTCAAG CAGCCGTGGC GCTGGCCGGA AATCTGGCAG 
ATGAACAAGG AACAGATCAA GAACCCGCAC TGGATTTATC CGGGCGACGT CATCATGCTC 
GATATGTCGA GCGGTACCCC GCGCCTGAAG ATTGGCAAAC CCGTCACCGG GCAAAGCGGC 
AAGGTTCAGC CGACCGTCTA TAGCACCCCG GTGCAGCAGG TCATTCCGAG CATCCCCCCC 
AATGCCATTG AACCGTTCCT CTCCAAGCCA CTGATTATCG AGACAACGGA TCAGAACGCG 
ACAGTCAGCA TCGTCGCAAC CCAGGAAGAT CGCATGCTGG TCGGTACGGG TGATTCTTTC 
TACGCCCAAG GCATTCCCGA TTCAAGCATC GAAAAATGGA ATGTATTCCG CAAGGGCAAG 
CCGCTGAAAG ATCCGGATAC CGGCGAGACT ATTGCTTACG AAGCCGTTTT CCTCGGCAAT 
GCCCGCTTGG TCAAGCCAGG CGAACCGGCA ACGCTGCGCG TCACCCTGGC CAAAGAAGAA 
ATGAATCGCG GCGACAATCT TTTGCCCGCT CCTCCCCCGG AAATTCTGAC CTACGTACCG 
CACCGCCCTG AGCAGGAAGT CTCAGCCAAA GTGCTTGGTA TTTATGGCGG GGTGCAAGAG 
GGTGGCGCCA ATTCGGTCAT TTCCATCAGC CGTGGCAAGA ATAGCGGTCT CGAACTGGGA 
CATGTCGTTG CGCTCTACCG GAATCGTGTT TCGGTCAGCA TTGATGAAGA CGGCCGTCGC 
ACTTCAACTC CGGTACCTGA AGAACGTTAT GGCCTTGCCT TCGTTTTCCG CGTCTTTGAC 
CGCGTCGCCT ACGCCTTGGT CGTCGAGTCC TCCAAGGCAG TCATCATCGG GGACTCCGCA 
CTGAACCCGT GA

Protein sequence

MVRIISALIL AVTAVCASAA EPLQLVDNPP DRHIVVKGDT LWGISGKFLK QPWRWPEIWQ 
MNKEQIKNPH WIYPGDVIML DMSSGTPRLK IGKPVTGQSG KVQPTVYSTP VQQVIPSIPP 
NAIEPFLSKP LIIETTDQNA TVSIVATQED RMLVGTGDSF YAQGIPDSSI EKWNVFRKGK 
PLKDPDTGET IAYEAVFLGN ARLVKPGEPA TLRVTLAKEE MNRGDNLLPA PPPEILTYVP 
HRPEQEVSAK VLGIYGGVQE GGANSVISIS RGKNSGLELG HVVALYRNRV SVSIDEDGRR 
TSTPVPEERY GLAFVFRVFD RVAYALVVES SKAVIIGDSA LNP