Gene Phep_3043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3043
Symbol
ID	8254155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	3637330
End bp	3638802
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	39%
IMG OID	644936692
Product	hypothetical protein
Protein accession	YP_003093303
Protein GI	255532931
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2866] Predicted carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0217728
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAGC ATTTTTTTTG GTCTAAGATA TTTTTAACCC TGTTGCTGCT GTGTTTAATA 
CAAACTGGTT TTAGTCAGGA TCTGTCTTTT TTGTGGGACC AATATGGTAT TTACAGGGAG 
CCAGCCTTGA AAGACCGTTT TTTTAAACAT AGTGATCTTG TTCCTTTGTT TCAAAAACTG 
GAAAAATCGG GTCTTTTTAA AATCGAAATT GCAGGCGGTT CTGCACAGGG ACGCAGTGTC 
TATCACCTAA CAGCTGGAAG GGGAAAGATA AAGGTATTGC TGTGGTCGCA AATGCATGGT 
GATGAAACCA CAGCCACAAG AGCATTATTT GACTTTTTTA ATTTTTTAAA GGCCAATGAT 
AAGAATGATG AGCTGAGAAA TAAACTGCTT GATCAGCTTG AACTTCATTT TGTGCCTATG 
CTGAACCCGG ATGGAGCTGA AATGTTTAAA AGAAGGAATG CGTTGGATAT TGATATCAAC 
AGGGATGCAA GAATGTTGGT TAGTCCGGAG GCAAGGATAT TAATGGACAT AGCCAAAAAA 
ATTAAACCTG ATTTTGGGTT TAACCTGCAT GATCAGAGTA CACTGTATTC GGCTGGACGT 
AGTAAAAATA CGGCAACAAT TTCTTTTCTG GATCCTGCCT TTAATTATGC AAAAGATATG 
GATGACGTAC GTAAAAAAGC CAGGCAGGTA ATTTTACTGA TGAATAACGT GCTGCAAAAG 
CTTATGCCTG ATAAAGTTGC AAAGTACAAT GATGATTATG ATCCAAGATG TTTTGGTGAT 
ACTTTTCAAG GGATGGGTAT TGCAACTATC CTGATCGAAT CGGGTGGTTA TCCTGGAGAC 
CCTGAAAAAG AATACATCCG TAAACTGAAT TTTTATGCTC TTTTAAGTGC GCTGAACTCC 
ATAGCTGATC AGTCTTATCT GAAAGAAGAT GTTGTACAAT ATGAAAAGAT TCCGGAAAAC 
AACAGGTCTT TATACAACGT GCTGATCCGA AATGTAAAAA TAACCAAACA GGGTAGTGTC 
TTTTTAACCA ATTTGGGTAT AAACCATACG CAGGTTAAGG ACAGTGATTA CAGGGGAGTT 
AGTTACCAGG GAAGTATTGA TGAACTGGGC GATGTAGAAA GGGTATATGG TTATGATGAG 
GCAGATGCCG GAGATTTGAA TTATACGCCT GGTAAATTGA AAATACTGAC AAAAAAAGAG 
TGGGAGAATT TAAACGCTGA ATCTGAAGTT CAACTGATAA GGGAAGGTTA TTTGTTTATA 
AAATGGTCGG ATGCAAAGTC GCCCGCAGGT CCGGTAAAAA ACAGGTTGCT GAATCTGACG 
AATAGTACTA GCGTGTCTGG ACAGGTTGGT TTAAATCAAG CAGCTAACTT TCTGCTTACC 
AAACAGGATA AGCCGGTTTT TGCAATTATT AATGGTTTTT TACTGAAGTT GGACCAGCCG 
GCAAAAGTAT TACACAATAC CTTTGGATAT TGA

Protein sequence

MMKHFFWSKI FLTLLLLCLI QTGFSQDLSF LWDQYGIYRE PALKDRFFKH SDLVPLFQKL 
EKSGLFKIEI AGGSAQGRSV YHLTAGRGKI KVLLWSQMHG DETTATRALF DFFNFLKAND 
KNDELRNKLL DQLELHFVPM LNPDGAEMFK RRNALDIDIN RDARMLVSPE ARILMDIAKK 
IKPDFGFNLH DQSTLYSAGR SKNTATISFL DPAFNYAKDM DDVRKKARQV ILLMNNVLQK 
LMPDKVAKYN DDYDPRCFGD TFQGMGIATI LIESGGYPGD PEKEYIRKLN FYALLSALNS 
IADQSYLKED VVQYEKIPEN NRSLYNVLIR NVKITKQGSV FLTNLGINHT QVKDSDYRGV 
SYQGSIDELG DVERVYGYDE ADAGDLNYTP GKLKILTKKE WENLNAESEV QLIREGYLFI 
KWSDAKSPAG PVKNRLLNLT NSTSVSGQVG LNQAANFLLT KQDKPVFAII NGFLLKLDQP 
AKVLHNTFGY