Gene Dshi_1147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1147
Symbol
ID	5711115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	1173801
End bp	1175081
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	68%
IMG OID	641267058
Product	processing peptidase
Protein accession	YP_001532490
Protein GI	159043696
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGA CCCCCGACAG CCAGACCCAG TTGACCGAGC TGGCCAACGG GTTCCGGATC 
GTGACCGAAC ACATGCCGGG CCTGAAATCG GCGGCCGTGG GCATCTGGGT GCTGGCCGGC 
GGCCGTCACG AGCGGCTGGA ACAGAACGGC ATCGCCCATT TCCTCGAACA CATGGCGTTC 
AAGGGGACCG AGAAACGCTC CACCCTGGGG ATCGCCGAGG CGATCGAGGA TGTGGGCGGC 
TATATCAACG CCTATACCTC GCGCGAAGTC ACCGCCTATT ACGCCCGCGT GCTGGAGGCC 
GATGTGGGCC TTGCGGTGGA TGTGCTGGCC GATATCCTGC GCAACCCTGT CTTCGCCCCC 
GAAGAGATCG AGGTAGAGCG CGGCGTGATC CTGCAGGAGA TCGGACAGGC GCTCGACACG 
CCCGACGACG TGGTCTTCGA CTGGCTGCAG GAACGCGCCT TTGCCGACCA GCCCATGGGC 
CGCACGATCC TCGGACCCGC CGAGCGGGTG CGCGGCTTTG CCCGCAACGA TTTCTTCGAT 
TTCGTGGGCG AGCATTACAC GCCCGAAACC ATGATCCTGT CCGCGGCGGG GGCGGTCGAT 
CACGACGCGC TCGTGGCCTT GGCCGAGAAG CTTTTTGGCG ACATGGCCCG CCGTGACCGG 
GCCGACGCTG CCCAGGCGCG CTTCACCTGC GGCGAGGCGC GGGTGATCAA GCCGCTGGAG 
CAGGTCCATT TCGCCATGGC CCTGCCCGGG CCGGGCTACC GCGATCCGGC GGTCTATACC 
GCGCAGGTCT ATGCCACGGC ACTCGGGGGC GGGATGTCGT CGCGCCTGTT CCAGGAGGTG 
CGCGAGAAGC GTGGCTTGTG CTATTCGATC TTCGCCCAGT CCGGCGCCTA TGCCGAGACC 
GGGATGATGA CGATCTATGC GGGCACCTCC GGCGACCAGA TCGCCGAGCT GTGCGAGATC 
ACCCTGCGGG AGATGCAGCG CGCCGGCAAT GACATGAGCA CCCAGGAAGT CGCCCGCGCC 
CGGGCCCAGA TGAAGGCGGG GCTGCTGATG GGGCTGGAAA GCCCGTCCTC GCGCGCCGAA 
CGCCTGGCCC GGCTCGTGGG CGTGTGGAAC CGGGTGCCGT CCCTGGACGA GACCATCGCC 
CGGATCGACG CGGTCACCAC CGGCGACGTG AAGGTCTACG GCGCCGAGCT GTGCCAGAGC 
GGGGATGTGG CCACCGCGCT TTATGGCCCC GCCGACGCGG CGCCGGATCT GGCCGCGATC 
CGGGAGCGCC TGGCGGCCTG A

Protein sequence

MTQTPDSQTQ LTELANGFRI VTEHMPGLKS AAVGIWVLAG GRHERLEQNG IAHFLEHMAF 
KGTEKRSTLG IAEAIEDVGG YINAYTSREV TAYYARVLEA DVGLAVDVLA DILRNPVFAP 
EEIEVERGVI LQEIGQALDT PDDVVFDWLQ ERAFADQPMG RTILGPAERV RGFARNDFFD 
FVGEHYTPET MILSAAGAVD HDALVALAEK LFGDMARRDR ADAAQARFTC GEARVIKPLE 
QVHFAMALPG PGYRDPAVYT AQVYATALGG GMSSRLFQEV REKRGLCYSI FAQSGAYAET 
GMMTIYAGTS GDQIAELCEI TLREMQRAGN DMSTQEVARA RAQMKAGLLM GLESPSSRAE 
RLARLVGVWN RVPSLDETIA RIDAVTTGDV KVYGAELCQS GDVATALYGP ADAAPDLAAI 
RERLAA