Gene Phep_3598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3598
Symbol
ID	8254720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4293074
End bp	4294834
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	41%
IMG OID	644937250
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003093851
Protein GI	255533479
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.799906
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTGA GATCTATAGT ATTTTTTATT GCCTGCTTTT TCCTGCATAC CGCAGTTTTT 
TCGCAGGACA AGAATGTAAA GCTTCCGGCA AACTGGTATA ATCTGGACCT GATAAAAGAC 
GGATATTTTG GTATCAGTAC TGAAAAGGCA TATACTGAAC TTTTACAGCA TAGAAAGCCA 
AAAGAGAAGA TCATTGTGGC GGTGATTGAT GGTGGAGTGG ACATTAGCCA TGAAGATTTG 
AAGGATGTAC TGTGGACAAA CAAAAAGGAG ATTGCAGGAA ATGGCATAGA TGATGATGGC 
AATGGATATG CGGATGATGT ACATGGCTGG AATTTTATAG GCTCAAAAAA GGGGAACCTG 
GCTTATGACA ATCTGGAGCT GGTAAGGATT TTCAGGGAGT ATCAGCCAAA ATACAGGTCT 
ACAATTAAAT CAACAATTTT GGACAGCACG CAAAAAGAGG AATTTGCCTT GTATACCAAG 
GTAACTGCGG CATTTGGAAA AAAATACGAT GAAGCACACC AGACTTTTGC AGTTGTGGCT 
ATGATCAATA AAGTGCTGGA TTCTGTAGGG CAGATCAACC ATAAGGCAAT TCCTTCACTG 
GAAGATATTG AGCGTTATAA GGCCGACAGT GAAGAAGAGG AACAATGCAA AAAGATTATC 
AGGAAAGGGG CCAGGGAAAG CGGATCTATA GAGAAGTTCC ACAAGGAAAT GAAGGATGCT 
TATAAACAGT ATGATGTGAT GCTGAAGTAT AACCTAAATC CTAAATATGA TGAACGTGGG 
GCACTGGTGG GGGATGACTA TTCGAATGCA AAAGAGCGGT TTTATGGAAA TAATGATGTA 
GCCGGACCAA ATGCGGAGCA TGGCACACAT GTTTCCGGTA TAATTGCTGC AAATAGAAAG 
AACAACATAG GCATAAACGG TGTGGCCGAT AATGTGAGTA TTATGGCCAT CAGAGTAGTG 
CCGGAAGGTG ATGAGCGCGA TAAGGATGTT GCCAATGGGA TAAGATATGC GGTAGATAAT 
GGTGCAAGAG TAATTAATAT GAGCTTTGGA AAAGGCTTTA AATGGAATAA GGAGGTTGTT 
GATGATGCTG TTAAATATGC TGAGAAAAAA GGCGTATTGC TGGTACATGC AGCCGGTAAT 
GATAACCAGA ATAATGACCT GGAAGAAAAT TATCCTACTA AATATTATGA CAGTCCGGAA 
GCCATAGCCT ATAAAAAGGC CCATAAGAAG CCAGACCTTA GTGCAATGTT GTTCAGGCCG 
AATGCCAATC AGCAGCAAGG CCCTGGCATG GGGCGTAATG TGCCGACACT GCCCTTGAAA 
CCGGTAATTG ATACCGCTAA GTTTAATTTG CCCCATGCCA ATAACTGGAT TGAGGTTGGT 
GCAAGTGCTT ATAAGAACGA TGCGAGTTTG AAGGCGTCTT TTTCTAATTA CGGCAAATAT 
ACCGTAGATG TTTTTGCGCC GGGTTTCATG ATTAAATCAA CTGTTCCGGG ATCTAAGTAC 
GAAGAGTTTG ACGGTACCAG TATGGCTGCT CCTGTTGTTT CTGGCCTGGC TGCCTTAATT 
TTGAGCTATT ATCCTGAACT TAAACCGCGT GAAGTAAGAG AGATCATTAT GAAATCTGTG 
GTTAAGGTTG AGCAGAAGGT AAAGCATGAA AATTCAAGGG GTGAAAGTGA ACGGATCAGT 
TTTAAGGAAC TGTGTGTAAG CGGGGGTGTT GTTAATGCTT ATGAAGCCTT AAAATTGGCA 
GAACATTATA AAACAAAATA G

Protein sequence

MKLRSIVFFI ACFFLHTAVF SQDKNVKLPA NWYNLDLIKD GYFGISTEKA YTELLQHRKP 
KEKIIVAVID GGVDISHEDL KDVLWTNKKE IAGNGIDDDG NGYADDVHGW NFIGSKKGNL 
AYDNLELVRI FREYQPKYRS TIKSTILDST QKEEFALYTK VTAAFGKKYD EAHQTFAVVA 
MINKVLDSVG QINHKAIPSL EDIERYKADS EEEEQCKKII RKGARESGSI EKFHKEMKDA 
YKQYDVMLKY NLNPKYDERG ALVGDDYSNA KERFYGNNDV AGPNAEHGTH VSGIIAANRK 
NNIGINGVAD NVSIMAIRVV PEGDERDKDV ANGIRYAVDN GARVINMSFG KGFKWNKEVV 
DDAVKYAEKK GVLLVHAAGN DNQNNDLEEN YPTKYYDSPE AIAYKKAHKK PDLSAMLFRP 
NANQQQGPGM GRNVPTLPLK PVIDTAKFNL PHANNWIEVG ASAYKNDASL KASFSNYGKY 
TVDVFAPGFM IKSTVPGSKY EEFDGTSMAA PVVSGLAALI LSYYPELKPR EVREIIMKSV 
VKVEQKVKHE NSRGESERIS FKELCVSGGV VNAYEALKLA EHYKTK