Gene Dshi_0091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_0091
Symbol	prc
ID	5711714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	89783
End bp	91120
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	65%
IMG OID	641265986
Product	carboxyl-terminal protease
Protein accession	YP_001531441
Protein GI	159042647
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0132582
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.640744
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAT TCGTGATGGC CGCACTGGGC GGCACAGTGG CAGGCGCCCT GCTGACAACC 
CAAGTCGCAG GGCCACTGCT GGCACAGGAC AACGCGCGCA ACACCTCGGT CTACGAGCAG 
CTTGACCTGT TCGGGGACAT CTTCGAGCGC ATCCGCGCGC AATATGTCGA ACAGGTGGAT 
GAAGGCGAGT TGATCGAGGC TGCGATCAAC GGGATGCTCA CCTCGCTCGA CCCCCATTCC 
AGCTATCTCG CGCCGAAGGA TTTCGGCGAC ATGCAGGTGC AGACCAGAGG CGAGTTCGGC 
GGACTGGGGA TCGAGGTCAC CCAGGAAGAC GGGTTCGTGA AGGTCGTCTC GCCCATCGAT 
GACACGCCGG CGGCCGAGGC AGGGATCGAG GCGGGCGATT TCATCACCCA TGTGGACGGC 
GAGAGCGTAC TTGGCCTGAC CCTGGACGCT GCGGTCACCA TGATGCGGGG CCCGGTGGGC 
TCCGAAATTG TGATCACCGT GGTGCGCGAG GGCTTCGACG AGCCCTTCGA CGTCACCATC 
ACCCGCGACA CCATCAAGCT CACCGCCGTG CGCAGCCGGG TCGTCCGCGA CACGGTGGTC 
ATGCGGATCA CCACCTTCAA CGACCAGACC TTCCCGAACC TCGAAGAGAA GATGGCCGAA 
GAGGTGGCCG AATTGGGCGG GATGGAAGCT GTCAGCGGTT TCGTGATCGA TCTGCGCAAC 
AACCCCGGTG GCTTGTTGAC CCAGGCGATC AAGGTCTCCG ACGCGTTTCT CGACAAGGGG 
GAAATCGTCT CCACCCGCGG CCGCGATCCT CAGGACGGGG AGCGGTTCAA TGCAACCCCG 
GGTGACCTCG CCGAAGGCAA GCCGATCGTC GTGCTGATCA ATGGCGGCTC GGCCTCGGCC 
TCGGAAATCG TGGCAGGCGC GCTGCAGGAT CATCGCCGCG CCATCGTCGT CGGCACCAAG 
AGCTTCGGCA AGGGGTCGGT GCAGTCGGTC GTGCCGCTGC GGGGGGATGG TGCCATGCGT 
CTGACGACGG CGCGCTACTA CACGCCCTCT GGCCGGTCGA TCCAGTCGCT CGGCGTGTCA 
CCGGATATTG TGGTCGCGCA ACCGCCCCGG CGCGTGGAGG CTGAGGAGGA CGAGGAGGCG 
AACAACCGCC CGCGCCGGTC CGAAGCGGAT CTGCGCGGCG CTCTGGACAA CGATTCGATC 
TCGGAGGCCG AGCGTGAGCA GCTTCTCAAG GAGCGGCAAA AGGCCGAAGA TGCCGCCGAG 
TTGCGCGAAG AGGATTACCA GCTTGCCTAC GCCATCGACA TCCTCAAGGG GCTGAACGCG 
CTGGGGCCGA CCGACTGA

Protein sequence

MKKFVMAALG GTVAGALLTT QVAGPLLAQD NARNTSVYEQ LDLFGDIFER IRAQYVEQVD 
EGELIEAAIN GMLTSLDPHS SYLAPKDFGD MQVQTRGEFG GLGIEVTQED GFVKVVSPID 
DTPAAEAGIE AGDFITHVDG ESVLGLTLDA AVTMMRGPVG SEIVITVVRE GFDEPFDVTI 
TRDTIKLTAV RSRVVRDTVV MRITTFNDQT FPNLEEKMAE EVAELGGMEA VSGFVIDLRN 
NPGGLLTQAI KVSDAFLDKG EIVSTRGRDP QDGERFNATP GDLAEGKPIV VLINGGSASA 
SEIVAGALQD HRRAIVVGTK SFGKGSVQSV VPLRGDGAMR LTTARYYTPS GRSIQSLGVS 
PDIVVAQPPR RVEAEEDEEA NNRPRRSEAD LRGALDNDSI SEAEREQLLK ERQKAEDAAE 
LREEDYQLAY AIDILKGLNA LGPTD