Gene A2cp1_2161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A2cp1_2161
Symbol
ID	7297170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter dehalogenans 2CP-1
Kingdom	Bacteria
Replicon accession	NC_011891
Strand	+
Start bp	2400909
End bp	2402483
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	73%
IMG OID	643594958
Product	protease Do
Protein accession	YP_002492567
Protein GI	220917263
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCTCA TCACCCGAAT CGTCACCGTC TCTCTCGCAG CCGCAGCGAT CTTCGCGTGC 
ACGCGGGACG GCAGCGCGGC GACCGCGTCC GCCGCGCCCG CGGCGGCGCC GGCCCAGCAG 
CTGTTCCGCG ACGCCGCGGC GGCCGCGCCC GGCCCCGAGG CCGCCATCCC GGTGCAGACC 
TCGCTCGCGC CGCTCATCGA CAAGCTCCGC CCGGCGGTGG TGAACATCTC CACCACCACC 
GTCACCAAGC ACCCGCGCGT CCAGCGCGGC CCGCGCGGCC AGAACCCGCA CGGCGGCGGC 
ACGCCGGACG AGGGCTTCGA GGACTTCTTC GAGCGCTACT TCGGCCGCCC CGCGCCGGAG 
ATGCCCGAGG AGTTCAAGGG CTCGTCGCTC GGCTCCGGGT TCCTGCTCAA CACCGAGGGC 
TACATCCTCA CCAACAACCA CGTGGTGAAG GACGCCACCG ACATCCGCGT GCGCCTCTCG 
GACGACCGCG AGTTCGGCGC CAGGATCGTC GGCCGTGACC CGCTCACCGA CGTGGCGCTC 
ATCCAGCTCG TGAACCCTCC GAAGAACCTG CCGACGGTGG TGCTGGGCGA CTCCGATGCG 
CTCCGCCAGG GCGACTTCGT GCTCGCGCTG GGCAGCCCGT TCGGCCTGCG CGACACCGCC 
ACGCTCGGCA TCGTGTCGGC GAAGCACCGC CCCGGTATCA ACCCCGGCGG CACCTACGAC 
GACTTCATCC AGACCGACGC CGCCATCAAC CCGGGCAACT CGGGCGGCCC CCTCTTCAAC 
CTCCGCGGCG AGGTGGTCGG CATCAACACC GCCATCGTGT CGCCGCAGAT CGGCCAGGGC 
ATCGGCTTCG CGGTGCCCAT CAACATGGCG AAGGCGCTGC TGCCGCAGCT CAAGGAGAAG 
GGCAAGGTCA CGCGCGGCTT CCTGGGGGTG TCGGTGTCCG ACCTCTCGCC GGATCTCATC 
CAGGGCTTCG GCCTGCAGTC CGGCACCAAG GGCGCGCTGG TCCAGAACGT GGTCCCGCGC 
TCGCCGGCCG ACAAGGCGGG GCTGCAGCCC GGCGACGTGG TGGTCGCGCT GAACGACAAG 
ACCGTCGAGA CCGCCGGCGC GCTCACCCGC GGCGTCGCCC TGGTCTCCCC TGGCCAGACC 
GCGAACCTGA CCGTGCTGCG CGGCGGCCAG AAGAAGCAGT TCGCGGTGAA GGTGGTGCAG 
CGGCCCGAGG ACGGCGAGGC CGTCGGCCGC AACGAGCAGG GCGGCGGCGA CGAGGGCGGC 
GGGCAGGGCG CCCGCGATCA GTCGCCGAAG CTCGGCGTCT CCATCGCGCC CATCACCCCG 
GACGTCGCGC GCCAGTTCGG CGTCGAGCCG GGCGAGGGCG TGGTGGTGGC GGACGTCACC 
GAGGGCGGCC CGGCCGATCG CGCCGGCATC CGCCGCGGCG ACGTCATCCT CGAGGCGAAC 
CGCCAGAAGG TGGCGCGGCC GGAGGACATG CGGTCGGCGG TGGCGAAGCT GAAGGAGGGC 
GACATGGCGC TGCTGCGCGT TCGCCGCGGC GACGCCGCCG TGTTCATCGC CGTGCCGGTG 
GGCGGCGGCA AGTAG

Protein sequence

MRLITRIVTV SLAAAAIFAC TRDGSAATAS AAPAAAPAQQ LFRDAAAAAP GPEAAIPVQT 
SLAPLIDKLR PAVVNISTTT VTKHPRVQRG PRGQNPHGGG TPDEGFEDFF ERYFGRPAPE 
MPEEFKGSSL GSGFLLNTEG YILTNNHVVK DATDIRVRLS DDREFGARIV GRDPLTDVAL 
IQLVNPPKNL PTVVLGDSDA LRQGDFVLAL GSPFGLRDTA TLGIVSAKHR PGINPGGTYD 
DFIQTDAAIN PGNSGGPLFN LRGEVVGINT AIVSPQIGQG IGFAVPINMA KALLPQLKEK 
GKVTRGFLGV SVSDLSPDLI QGFGLQSGTK GALVQNVVPR SPADKAGLQP GDVVVALNDK 
TVETAGALTR GVALVSPGQT ANLTVLRGGQ KKQFAVKVVQ RPEDGEAVGR NEQGGGDEGG 
GQGARDQSPK LGVSIAPITP DVARQFGVEP GEGVVVADVT EGGPADRAGI RRGDVILEAN 
RQKVARPEDM RSAVAKLKEG DMALLRVRRG DAAVFIAVPV GGGK