Gene Phep_2779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2779
Symbol
ID	8253887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	3281812
End bp	3282948
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	47%
IMG OID	644936425
Product	exported exo-alpha-sialidase
Protein accession	YP_003093040
Protein GI	255532668
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4692] Predicted neuraminidase (sialidase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAAAA GAAGCACAGG TATAATCGGT TTACTGATTT GTTTAACCGG AGGATATGGT 
TTAAAGGCAC AATCGCAAAA ATGGCGGTCA GGTATTATAA CAGACGAATT CTTATATGAG 
AAGGCAGCAT TTCCTTCCTG CCATTCTGCT ACCATAGCCG AAACGCCTAC CGGATTGGTG 
GCAGCCTATT TTGGTGGTAC CCATGAACGC CATCCGGATG TGGAGATCTA TGTGAGCAGG 
CAGGTTAACG GAACCTGGCT TGCTCCGGTT TCTGTAGCCA ATGGTATACA AAACGACAAA 
GTAAGGCTGC CTACCTGGAA CCCTGTATTG TACCAGGTAC CTGGTGGAGA ACTGTTGCTT 
TTTTACAAAA TTGGCCCTAA GCCATCCGAA TGGTGGGGCA TGATGCGCAG CTCAAAAGAT 
GGCGGCATTA CCTGGTCTGA AGCGCAGAAA TTACCGGAAG GCCAGATTGG CCCAGTAAAA 
AACAAACCGG TGCTGCTCAG CAATGGTAAC TTGTTCTGTC CTTCCAGTAC AGAAGGCAAA 
GGCTGGAAAG TCCATTTCGA AGTAACCAAA GACAATGGCA AAACCTGGCG CTTAATCGGC 
CCGCTGGAAG GTGGGGAGAT CAATGCTATA CAGCCAAGTA TCCTGGATCA TGGCAATGGA 
AAACTACAGA TCCTGGCCAG GAGCAGGAAC AGGGCAATTG TAGAATCCTG GTCGCAGGAC 
AACGGTGAAA CCTGGTCTGC TTTAGCAAAA ACGTCCCTGC CAAACAACAA TTCAGGCACC 
GATGCAGTAA CTATGAAAGA TGGCAGACAT GTATTGGTAT ACAACCATGT ACTGCCTCCC 
GGAGACCTGG CAAAAGGGGC CCGGACGCCA TTAAATGTAG CGATTTCCAA AGATGGTAAA 
AACTGGTCGG CAGCGTTGAT CCTTGAGGAT TCGCCCACCA GCCAGTATTC CTATCCTGCG 
GTAATCCAAA CCTCAGATGG TTTGCTGCAT TTCATTTATA CCTGGAGAAG GGAAAAGATC 
AAACATGTAG TAGTTGATCC ATCAAAACTT AAGCTTAAAA AGATAGTAAA TGGCATTTGG 
CCAAAATTAA AGGGCTATAC AGCCCCTGTG GTTACTGATG TTAAAAACGA GGAATAG

Protein sequence

MLKRSTGIIG LLICLTGGYG LKAQSQKWRS GIITDEFLYE KAAFPSCHSA TIAETPTGLV 
AAYFGGTHER HPDVEIYVSR QVNGTWLAPV SVANGIQNDK VRLPTWNPVL YQVPGGELLL 
FYKIGPKPSE WWGMMRSSKD GGITWSEAQK LPEGQIGPVK NKPVLLSNGN LFCPSSTEGK 
GWKVHFEVTK DNGKTWRLIG PLEGGEINAI QPSILDHGNG KLQILARSRN RAIVESWSQD 
NGETWSALAK TSLPNNNSGT DAVTMKDGRH VLVYNHVLPP GDLAKGARTP LNVAISKDGK 
NWSAALILED SPTSQYSYPA VIQTSDGLLH FIYTWRREKI KHVVVDPSKL KLKKIVNGIW 
PKLKGYTAPV VTDVKNEE