Gene Daro_2549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2549
Symbol
ID	3567525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	2747259
End bp	2748728
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	57%
IMG OID	637681016
Product	peptidase C14, caspase catalytic subunit p20
Protein accession	YP_285752
Protein GI	71908165
COG category	[R] General function prediction only
COG ID	[COG4249] Uncharacterized protein containing caspase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	0.98894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.217885
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGGC GGCTAACCGC CCTCGTCATC GGCAACGGCG CCTACGAGGA TGCCAGCGAA 
CTCGAAAACC CCGTCAACGA CGCCGAGGAT GTTGCCGCAA AGCTCGAGGC TTGTGGCTTC 
TCGGTGATCA AAGAAATCGA CTGCACAGCC GCTGCAATGG ACCGAGCCCT CAAGCGATTC 
AAGGGAGAAC TGCCAGACAA CGATGTCGGC CTTTTCTTCT TTGCCGGGCA TGGCATGCAG 
ATCGAAGGCG AGAACTATCT GGCGGCGGTG GACACCGATA CCGCCGGGGA AGTTGAGGCC 
AAATACTCTT CGCTGCCCTT GAACCGGGTC ATCGAAACCA TGGAAAAGGC GGCAACGTCG 
ACCAGCATCA CCATCCTGGA TGCCTGTCGC GACAATCCGT TCGAACGGGC CTGGCATCGT 
TCGGCGGCAA CCCGCGGCCT GGCCCCCGTG TATGCCCCCA AAGGGACCTT GATCGCCTAT 
GCCACTTCGC CAGGCCAAAC CGCCAGCGAT GGGCACGGAC GCAATGGGGC GTATACCGCT 
GCATTACTTC AACATATTGC CACTCCCGAC TGTTCGATCG AGAACATGTT CAAGCGGGTC 
CGCAACACGC TCAGTGCCGC CACACATGGA AAACAGATTT CTTGGGAGCA TACCTCGCTA 
TCCGGCGAGT TCTACTTCAA CCTGAGCCTT GGGGCTCGCA TTGACGACTA CTCCGACAGC 
GCGCTCAGCG ACGGCCTGTT CGTGCCCGAC GAAGCCAAAG CATCTCATCG GATTATCAAG 
GCTCTGAAAA GCCTGACTTG GCCAGTGCAG AATCCGGCTA TTGACGGGTT CTTGTCCGAT 
ATCGCCAACA AGGCGTCGCT GGACTCTCTC TTCGTTCTCG GGCGGAACAT CTATCAGGCG 
GCATGCGGCG GATCGAACAG TGCCATTGCC TACCTGAGCG ACTTCGCCGC CCGGACCCAG 
GCGGCGAAAC CCGAGAAACG AAAAGCGCTA CTGGACGGCA TGCTGTTCGA GGTCTTCTTC 
GACCCCAAGG CAAAACTCCG AAAAGACTTC AAGACCCGCA GGTTCGAGGA TCTATTCGCC 
CTCCAGCAGC ATAAAAACCT CTCGTCCAGC TTTGACTTTA TCACCGAATG TCTGCTTCCC 
GAGGCCGGCC GTTTCTACTC GACCCCTGGC AGAAAACACC CTGTGGTGGT CGATGTCGCG 
ACGACTCCCG ATAGTGCTGC CAATACGTAT CGACTTAAGT CAATCCATTG CGGCGGTACT 
AGCATCATGT GGTTGGAGGA TGAGGACTAC GCAGTCGAAC CGGGGGAAAT CCCGAATGCC 
GAAAAGATGA CCATCGCCAA GTTTGAGGCG CGACTGGCCG AACAAATGGC GGTTCCTTCC 
CATTTACTGA CCATCAATTA CCTTTCGTTC GACAAACAGG CTCATGAACG CATCCTGTTC 
CCCTATGGCT GGACGGTTCG GAAACGATAA

Protein sequence

MSRRLTALVI GNGAYEDASE LENPVNDAED VAAKLEACGF SVIKEIDCTA AAMDRALKRF 
KGELPDNDVG LFFFAGHGMQ IEGENYLAAV DTDTAGEVEA KYSSLPLNRV IETMEKAATS 
TSITILDACR DNPFERAWHR SAATRGLAPV YAPKGTLIAY ATSPGQTASD GHGRNGAYTA 
ALLQHIATPD CSIENMFKRV RNTLSAATHG KQISWEHTSL SGEFYFNLSL GARIDDYSDS 
ALSDGLFVPD EAKASHRIIK ALKSLTWPVQ NPAIDGFLSD IANKASLDSL FVLGRNIYQA 
ACGGSNSAIA YLSDFAARTQ AAKPEKRKAL LDGMLFEVFF DPKAKLRKDF KTRRFEDLFA 
LQQHKNLSSS FDFITECLLP EAGRFYSTPG RKHPVVVDVA TTPDSAANTY RLKSIHCGGT 
SIMWLEDEDY AVEPGEIPNA EKMTIAKFEA RLAEQMAVPS HLLTINYLSF DKQAHERILF 
PYGWTVRKR