Gene Phep_3840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3840
Symbol
ID	8254974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4611133
End bp	4612185
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	44%
IMG OID	644937504
Product	TPR repeat-containing protein
Protein accession	YP_003094093
Protein GI	255533721
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.745152
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGGAA AAGTATTTTT ATTGATTTTG CTGAGCTATA TACCTGCAGT ACGGGCGCAG 
CAGCCTGTGC AGGGATATGT AGATAGTAAT CTCGTGAAAA CGCTTTTTTT TGCCGGCCTG 
CGTGATAAGT TGAACGAGGA TTATAGCAGG GCCAATGAAA GTTTTACCAA AATACTGGTG 
CTAGACCCTA ACAATGCAGC CGTCCACTAT GAAATTGCGG TAATGAACTA CCGGCAGAAT 
AAACTTTTTG AAGCTGAAAT GGCCATAAAA AAAGCCCTTG TTGCTGATGG TAACAATGTG 
TGGTACTGGA TGCTGATGGC TGAGTTGTAT AAACGAAAGG GCGATATGGA AGCTCTGGTA 
GAGGTTCTGA ACCAGATGAT CAGGCTTGCA CCGGATAAGG AGGCCTATTA TTACGACCGG 
TCTAACGCCT GGCTACTGGC TGGGAATACA GACGCCGCTA TGAAAGGTTA TGATGAGCTG 
GAAAAAAAAT TCGGCAATTC TGAAGCACTG AACCATGCCA GGCAACGGGT AACGATGGAA 
AAGGATGATA CTGCAGGTGG ACAAAATGAG GGCCATCAGG CAGCAGCCTC GCTGAGCCCG 
GAACAAACAA TGCTGGTACT TGGCGAAAAA TTGTACAGGC AGGGCGATCT GAAAGGGGCA 
ATGGCCCAGT TTAAATCAAT ACTTAAAAAT ACCGATCAGA TTTATATGGC CTGGGAACGT 
GCAATACATA TTGAAGTGGT ACTGGGTTTA TATGCCGAGG CTTTAAAAAC AGCAGATGAA 
GCTTTATCTT TATATCCTAG TCAGGCAGTT CTGTATTATT ATAAGGCTGT AGCCCTGCAA 
CATATAAGTA ATTATGCGGA AGCCCTGACA AATATCGAAA CTGCCTTGCA GCTGGATGAA 
GGAAATGCGC TTTATATGGA GCTTTATGGC GATGTTTTGT TTTTGAAAGG AGAGCCTGCC 
CAGGCATTGC TGCAATGGAA AAAGTCGAAA GCGGCAGGGA ACAGTTCTGA AAAATTAAAC 
AAAAAGATCA ATGAACGGAA GTATTTGGAA TAA

Protein sequence

MKGKVFLLIL LSYIPAVRAQ QPVQGYVDSN LVKTLFFAGL RDKLNEDYSR ANESFTKILV 
LDPNNAAVHY EIAVMNYRQN KLFEAEMAIK KALVADGNNV WYWMLMAELY KRKGDMEALV 
EVLNQMIRLA PDKEAYYYDR SNAWLLAGNT DAAMKGYDEL EKKFGNSEAL NHARQRVTME 
KDDTAGGQNE GHQAAASLSP EQTMLVLGEK LYRQGDLKGA MAQFKSILKN TDQIYMAWER 
AIHIEVVLGL YAEALKTADE ALSLYPSQAV LYYYKAVALQ HISNYAEALT NIETALQLDE 
GNALYMELYG DVLFLKGEPA QALLQWKKSK AAGNSSEKLN KKINERKYLE