Gene Dshi_3470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3470
Symbol
ID	5712528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	3652890
End bp	3653921
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	66%
IMG OID	641269399
Product	peptidase M48 Ste24p
Protein accession	YP_001534804
Protein GI	159046010
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCATC CGGAACAGGT CATCCTCGGT ACCGCGGTCA GCGGTGGCAC CTCTCTCCAG 
GTCGCGGCGC GTCTTCTGGT GCGCGGGGAT ATGGCCAAGT TAATCGCGGT GGAGACCGGT 
GGAACCATGG CCGAGGCCCG GCTGGACGCG GTGAGGTTCG ATCCGCCGCT GGGGTCGCTG 
CCACGCAAGC TGCGCTTCCC GGACGGTGCC GAGTTCGAAA CGGGGGACCG CGAGGCGATT 
GCCGCGTTGG AGCCGCGCGG CTTCTGGACC CGGCTGCACG GATGGGAACG GCTGCATCCG 
CGCCTGATCC TGTTCGTGGT TGGCGGATTC GCGGGCGGCT GGCTGGTCTA TTCCGTGGCC 
CTCACCGCAC TGGTTGCCAT GGCTGTCGCC CTGACACCGG AGCCCCTCGT GCGGGCGATG 
GATCGCAGTA CCCTCTCCGC CCTCGACCGC GTCATTGCCT CCGAAACAGC GCTGAGTACA 
GCAGATCAAG CCGAGGCTCG CGCGATTTTC GAGGACCTGC GCGCGGTTCT GCCGGACCGC 
GACCTCGCGG AAGCCGTGAG CCTGGAGTTT CGGGCGCTCC GGGGTTTGGG ACCGAATGCG 
CTGGCCCTGC CCGGGGGCAC CGTGGTGTTG TCGGATGCCT TGGTTAAGCA GTTCGATGCT 
GATGTCGTCG CCTCGGTGCT CGGCCATGAG ATCGCCCATG TGATGGAGGA ACACTCCCTC 
AAGCGGCTCT ATCGGTCGCT GGGCATCTAC GTGATGGTCG CCCTGATCGC CGGGGAAACC 
GGGCCTTTGC TCGAGGATCT TCTGCTGGAG GGGAATGTGC TGCTGTCGCT GTCCTACTCC 
CGCGGGCAGG AGGCGGAGGC GGATCAGATC GGCCTGCGGC TCGCCGACGC CGCAGGGTAT 
GATCCGACCG GGTTGAAGGT ATTTTTTGAA ACGCTCGCGG CCGAGGTCGG AGACGGCGGT 
GGCTGGCTGT CCACCCATCC GGGCAATGAC GACCGCATCG AGGCAATCGA TGCCTATCTG 
GAGGCGCGCT AG

Protein sequence

MAHPEQVILG TAVSGGTSLQ VAARLLVRGD MAKLIAVETG GTMAEARLDA VRFDPPLGSL 
PRKLRFPDGA EFETGDREAI AALEPRGFWT RLHGWERLHP RLILFVVGGF AGGWLVYSVA 
LTALVAMAVA LTPEPLVRAM DRSTLSALDR VIASETALST ADQAEARAIF EDLRAVLPDR 
DLAEAVSLEF RALRGLGPNA LALPGGTVVL SDALVKQFDA DVVASVLGHE IAHVMEEHSL 
KRLYRSLGIY VMVALIAGET GPLLEDLLLE GNVLLSLSYS RGQEAEADQI GLRLADAAGY 
DPTGLKVFFE TLAAEVGDGG GWLSTHPGND DRIEAIDAYL EAR