Gene Phep_1175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1175
Symbol
ID	8252273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	1391520
End bp	1393121
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	42%
IMG OID	644934830
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_003091455
Protein GI	255531083
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3525] N-acetyl-beta-hexosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA TAGCCGCAGG ACTTCTACTA ACTTGTATCC TATTTACCAA ATCAGCCAGT 
TCGCAGTTCA ATAACATCAT TCCACAACCC GTTCAGTTCA AATATGGCAT TGAACAAGCA 
TTCTTTAACA TTAGCCCTCA AACCCGACTT CTGGCCGATA CCTTAACCAG ATCCGCAAAC 
TTCCTCAATG AATACCTTTT AAACTACTAT GGTTTTGACT TAAAACAATC ATCCGCCGAA 
AGTAATCAGG TTATCAGTCT CAGTATCGAT CCGCGAAAAA ATCCAAGAGA TGGCCAATAT 
ACGCTTACGG TAAATCCTCG GAGTATCAAG CTGAGTGGCA ATTCCCCACA AGCAGTTTTC 
TACGGCATCC AATCGCTGAT CCAAATGTTC CCTGCAGAAA AGAACAACAG CAAATCGCTC 
TCGATACCAG CCTTAGAAAT TGTGGATTAC CCACGCTTCG CCTATCGCGG CATGCACCTG 
GATGTAAGCA GGCACTTTTT TGATGTCTCC TTTATCAAAA AGTACATCGA TTACCTGGCT 
TTACATAAGC TCAATAACTT TCATTGGCAC CTTACTGATG ATCATGGCTG GAGAATTGAA 
ATTAAAAAAT ACCCTAAACT TACCGAAATA GGCGCCTGGA GAAATGGTAC CATTATAGGT 
CTTTACCCCG GAACCGGCAA TGATGGCCTG CGCTATGGCG GCTATTATAC CCAGGAAGAG 
GTAAAAGAAG TGATCAGGTA TGCAGCCGAT CGTTATATCA ATGTCATCCC CGAGATTGAG 
ATGCCGGCCC ATAGTATGGC TGTGCTGGCC GCCTATCCTG AATTTGGCAC TGAACCTTCC 
AAAAAATACG AAGTGGCCCA AACCTGGGGT ATTTTTAACA AATTCAACAA TGTGTTCCAA 
CCTACCGATC AAACCTTTAA ATTTCTGGAG GGGGTTTTAA CTGAAGTGAT GAACCTCTTC 
CCTTCTCCAT ATATCCATAT TGGCGGCGAT GAAGGTTCGA AAATATGGTG GAAACAATCT 
GCCCTTTCAC AACAGATCAT GAAGGAAAAT GGGCTGAAGG ATGAAAGTGC GCTGCAAAGT 
TATTTCATCC ACAGGATTGA GAAATTTGTG AACAGTAAAG GCAAAACCAT TATCGGCTGG 
GACGAAATTT TAGATGGTGG ACTGGCACCC AATGCTATAG TCATGAGCTG GCGCGGTGAA 
AAAGGGGGTA TAGCTGCTGC AAAGCAGCAG CATAAGGTAA TTATGACACC CGAAAACATG 
ATGTACTTTA ACCATAGTCA GTTTTTAAAA GATGATTCGC TTACCGCCAA TAAATACCTG 
CCTTTAAAAA CGGTATACGA TTATGAACCT GTTCCGGCTG TGCTTAGTGC TGATGAAGCC 
CAATACATCT GGGGCGGACA AGCCAATTTA TGGTCTGAAT ATATTGCCAA TCCGGCAAAA 
GCGGAATACA TGCTTTTCCC GCGCCTGGAT GCCTTAAGTG AAATTTTATG GAGTCCTAAA 
GAAAAGCGCA ATTATAATGA TTTTCTGAAC AGACTGAAAA TGCAGTTTAA ACGCTACGAC 
CTGATGAAGG TAAATTACAG TAAAAGATAT TTAACAAATT AA

Protein sequence

MKKIAAGLLL TCILFTKSAS SQFNNIIPQP VQFKYGIEQA FFNISPQTRL LADTLTRSAN 
FLNEYLLNYY GFDLKQSSAE SNQVISLSID PRKNPRDGQY TLTVNPRSIK LSGNSPQAVF 
YGIQSLIQMF PAEKNNSKSL SIPALEIVDY PRFAYRGMHL DVSRHFFDVS FIKKYIDYLA 
LHKLNNFHWH LTDDHGWRIE IKKYPKLTEI GAWRNGTIIG LYPGTGNDGL RYGGYYTQEE 
VKEVIRYAAD RYINVIPEIE MPAHSMAVLA AYPEFGTEPS KKYEVAQTWG IFNKFNNVFQ 
PTDQTFKFLE GVLTEVMNLF PSPYIHIGGD EGSKIWWKQS ALSQQIMKEN GLKDESALQS 
YFIHRIEKFV NSKGKTIIGW DEILDGGLAP NAIVMSWRGE KGGIAAAKQQ HKVIMTPENM 
MYFNHSQFLK DDSLTANKYL PLKTVYDYEP VPAVLSADEA QYIWGGQANL WSEYIANPAK 
AEYMLFPRLD ALSEILWSPK EKRNYNDFLN RLKMQFKRYD LMKVNYSKRY LTN