Gene Phep_3559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3559
Symbol
ID	8254680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4232986
End bp	4233987
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	41%
IMG OID	644937210
Product	metalloendopeptidase, glycoprotease family
Protein accession	YP_003093812
Protein GI	255533440
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.700407
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.724049
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGTAA TACTTGCTAT AGAATCTTCT TGCGATGAAA CTTCAGTTGC TATATGTAAC 
AACGGCAAAA TTACTGCCAA TGTTATTGCA AACCAAACAA TTCATGAAAA TTATGGTGGC 
GTAATACCTG AACTTGCATC AAGGGTACAT CAACAAAATA TCGTTCCGGT TATACAACAG 
GCATTAACTG ATGCTAAAGT AAGCAAAAAG GAATTAAGTG CCGTTGCATT TACCAGGGGA 
CCAGGTCTTT TGGGGTCATT GCTGGTTGGT GTTTCATTTG CCAAATCATT TGCTTTGGCG 
CTTGATTTGC CCTTAATAGC CGTTAACCAC ATGCATGCAC ACATTCTGGC ACATTTTATT 
GATGATCCCA AACCTGCATT TCCTTTTTTA TGCCTTACGG TTTCGGGAGG GCATACCCAG 
ATTGTATTGA TTAGGAGTTA TTTTGACATG GAGATCGTGG GGGAAACTCT TGATGATGCT 
GCTGGCGAGG CTTTTGACAA GACTGCCAAA ATCCTGAATC TTCCTTATCC GGGCGGACCA 
CTGATAGATA AACATGCAAA AGAAGGAAAT CCGCTGGCCT TTAAGTTCCC TGAACCTCAG 
ATAAAAGATT TAAATTACAG TTTTAGTGGC TTAAAGACTG CTATCTTGTA TTTTATCAGG 
GCGCAGGAAA AAGAAAATCC TGATTTTATT GCCGGCAATT TAAATGATAT CTGCGCATCT 
GTACAACATA GTATTGTTGA CATTTTGCTC AATAAATTAA AAAAGGCGGC CCAGCAATAT 
GGAATAAAAG AAATTGCAAT AGCCGGTGGG GTTTCGGCAA ACAGTGGCCT GCGGCATGCA 
CTTCAAAAAA TGGCGGGACA GCAGGGTTGG AATGTTTATA TCCCCGCATT TCAGTATTGC 
ACAGATAATG CTGCTATGAT TGCCATTGCA GGATATCATA AATATTTAAA CGGTGATTTT 
GTTGGCCAGG ATGTGGCTCC ACTTTCACGA ATGGAATTTT AA

Protein sequence

MSVILAIESS CDETSVAICN NGKITANVIA NQTIHENYGG VIPELASRVH QQNIVPVIQQ 
ALTDAKVSKK ELSAVAFTRG PGLLGSLLVG VSFAKSFALA LDLPLIAVNH MHAHILAHFI 
DDPKPAFPFL CLTVSGGHTQ IVLIRSYFDM EIVGETLDDA AGEAFDKTAK ILNLPYPGGP 
LIDKHAKEGN PLAFKFPEPQ IKDLNYSFSG LKTAILYFIR AQEKENPDFI AGNLNDICAS 
VQHSIVDILL NKLKKAAQQY GIKEIAIAGG VSANSGLRHA LQKMAGQQGW NVYIPAFQYC 
TDNAAMIAIA GYHKYLNGDF VGQDVAPLSR MEF