Gene Phep_3822 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3822
Symbol
ID	8254956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	4585332
End bp	4586918
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	42%
IMG OID	644937486
Product	peptidase M28
Protein accession	YP_003094075
Protein GI	255533703
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.116923
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGC ACCTTTTATA TAGCAGTATT ATTTTGCTGA TGGGCTGTAC CGCATCAGCA 
CAAAACAGAG ATGCGGTAAA ATTTAGTCAG ACCATTAACA AAGACAATGC CTATAGACAT 
CTTTCTGTGC TTGCCTCTGA CGAATATGAA GGTAGGGAGA CTGGTAAAAA AGGGGGCTGG 
ATGGCCGCAG AATATATTAA AAATCAGTTT AAGGTTCTGG GTTTAAATGG TCCGGTAAAC 
GGCGATTATT TTCAGTCTGT AGACATGGCT TCTTTTGGTA TTTCGCAGAT GCTAACGCTG 
GAAGGCCAAC CCGCAGAACC CATTAAAAAT TTTTATGTCG TACCTTCATC GGTATCAGGC 
AGCGGCTTTG CTTTTAATTC AGGCAGCATT TTATTTGCAG GTTATGGGCT GAACAAAGAG 
GGCTATAACG ACTACGAGGG GAAGGATATT ACCGGTAATG TAGTGATGAT CCTTAAAACT 
GCAGAACCTT CGGGTACAAC TACTGCAAAA ACAGGTGGTA ATATCAACAC AAAAATTAAA 
TACCTATCGG ATCATAAAGC CCGCGCTGTT CTGGTAATAG ACCCTGTGAT TGATATGCCG 
GATAACCTGA AAAACTATCT GCAATCTGAA CAGATGGTAA TGAAAACCAA AGAAAACCTT 
GACCGCCTGA ACGAGCCGCA GGGCATGCCC GTTATCTACA TCGGTACGAC TTTGGCCAAC 
CAGATCTTAA AGGGGGCAAA AACTACCTTA GATGCATTAA AAAAGAAAAT GACCGAAACC 
GGGAAGCCGG TTTCGCAGGT CTTAACCGTC TCTGTTACTG CCAGTGCAAA GAAAACTGAA 
AATAAAATAA GGACTGAAAA TGTTCTGGGC TTTTTGGAAG GCAGTGATCC AAAGTTAAAG 
AAAGAAATTC TAGTGATTAC TGCACATTAT GATCACATTG GCATTACTCC GGATGCAAAA 
GGTGACGATA AAATCAACAA TGGAGCTGAC GACGACGGCT CAGGGACAAC CGGAGTGCTG 
ATGATTGCCG AAGCCTTTTC AAAAGCTAAA AAAGCTGGGA AAGGCCCTAA AAGGAGTATC 
TTGTTTATGA CGGTAACGGG TGAAGAGAAG GGGCTGTTAG GTTCCGAATG GTATTCGGAA 
TATCCTGTTT TTCCATTGAT CAATACGATT ACCAATCTGA ATATAGATAT GATAGGCCGT 
GGAGATGCTG CGCATGCCCA GGATAACAAT TTTGTTTATA TCATTGGTTC TGATATGTTA 
AGCAGCGACC TGGACCGTAT AGGTAAAAAA GCGAATAAAG ATTATGTAAA GATGAACCTG 
GACGAACGTT ATAACAACCG TACAGACCCA AACCGTTTCT ACTACCGATC TGATCATTAT 
AATTTTGCCA AACATGGCAT CCCGGTTATC TTTTATTTCA ACGGGGTCCA CGAAGATTAT 
CATCAGCCGG GTGATGAGAT CAGTAAGATC GACTTTCCAA TGCTGGCTAA AAGGGCAAGA 
TTGGTTTACT ACACAGCCTG GGAGCTGGCA AATGGCGCCA AGCGACCTGC TGTGGACAAG 
AACGAAGACG GAACAAAGAA AAAATAA

Protein sequence

MKKHLLYSSI ILLMGCTASA QNRDAVKFSQ TINKDNAYRH LSVLASDEYE GRETGKKGGW 
MAAEYIKNQF KVLGLNGPVN GDYFQSVDMA SFGISQMLTL EGQPAEPIKN FYVVPSSVSG 
SGFAFNSGSI LFAGYGLNKE GYNDYEGKDI TGNVVMILKT AEPSGTTTAK TGGNINTKIK 
YLSDHKARAV LVIDPVIDMP DNLKNYLQSE QMVMKTKENL DRLNEPQGMP VIYIGTTLAN 
QILKGAKTTL DALKKKMTET GKPVSQVLTV SVTASAKKTE NKIRTENVLG FLEGSDPKLK 
KEILVITAHY DHIGITPDAK GDDKINNGAD DDGSGTTGVL MIAEAFSKAK KAGKGPKRSI 
LFMTVTGEEK GLLGSEWYSE YPVFPLINTI TNLNIDMIGR GDAAHAQDNN FVYIIGSDML 
SSDLDRIGKK ANKDYVKMNL DERYNNRTDP NRFYYRSDHY NFAKHGIPVI FYFNGVHEDY 
HQPGDEISKI DFPMLAKRAR LVYYTAWELA NGAKRPAVDK NEDGTKKK