Gene Phep_3253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3253
Symbol
ID	8254372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	3859580
End bp	3861151
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	44%
IMG OID	644936906
Product	glycosyl hydrolase BNR repeat-containing protein
Protein accession	YP_003093510
Protein GI	255533138
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4409] Neuraminidase (sialidase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.962324
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.018694
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAACA GAAAAATATT TAACCATTTT ATCCTGTTCA TCTTTATAGC AGCTGCATTA 
GCTTGTTCAG ATAAAATTTA CAAAGCCCGG GATAGGGGCG GCATAAGCAT TAAAGCCGAA 
CCAACCATTA ATCCTATCTT TAAAAGACTG GAAGTCAATC CGTATCTGCG TCTGGAAATT 
GACATCCCAG AAGGTACTGA GGCGATAACA TTCCAGCAAT TTAAAGGCAG TATAGAAACA 
GCAGGATTAC AAGATATCGC AAAGCTGGAG CTTTACCAGG GAGATGATCA GCAGGAACTT 
TCAAAAAATA AATTGCTGGG GAGTACAATA CCCTCAACAA ATCAGTTTAG CATTACGCTT 
GGCACGACTT TAACACCAGG AAAACACAGC TTATGGCTAA GTGTAACCTT AAAAGACAAT 
GCTGATATTG ATCATCAGCT GCGGATCAGA GCTGATCAAT TGACCAACGC ATCAGGCCTG 
ATCTATAAAG TGGCACAACA CCAGATCAGT TCAAGATACC TGGGCATCGC CCTGCGCAAA 
CCCAATGACG AAAATGTACA CACTTACCGC ATCCCCGGTA TGATCACCAC AGACAAAGGA 
ACTTTAATTT CCGTTTACGA TATCCGTTAT GACAATGACA AAGACCTGCC GGGCAATATT 
GACGTAGGAA TGAGTAGAAG TACCGACGGA GGTAAAACCT GGGATACCAT GAAAAATATT 
ATGGATATGG GTGGACCGGC AGATAACAGT GGTTCCGGCG ATCCTTCAAT CTTATTTGAC 
CCTGTCACTA AAACCATATG GGTTTCAGCC CTATGGAGTA AAGGTAACCG CTCTATTGCA 
GGCTCAGGAC CCGGTTTAAG TCCTGAAGAA ACCGGGCAGT TCCTGGTTAC CAGCAGTAAG 
GATGACGGAT TAACCTGGAC CAAACCCTAC AGCATCACTA ACCAGGTTAA AAATCCGGAA 
TGGCGCTTGT TTTTCCCTGG TCCGGGTAAT GGAATTGCCA TGGCAGACGG GAAAATTGTT 
TTCCCGGCAC AATACTGGGA TGCCGCAAAA ATGCCGCATT CCACCTTAAT CTATAGCGAT 
GACCATGGTA AAAGCTGGAA AGCAGGGCTT GGTGCAAAGT CAAATACCAC AGAGGCCCAG 
CTTGTAGAAA CAAACCCGGG AACTTTAATG CTGAACATGC GGGACAACAG GGGTGGGTTC 
AGGAGCGTAG CTACCACAAA AGATATGGGA CAAAGCTGGA TCGAACATGC AACGTCCTAT 
AGTGCCTTAC CCGACCCGGT TTGTATGGCC AGTTTAATAA AAGTCAATGT AAAATTTAAG 
CGCGTATCAA AGGATGTCCT GTTTTTCAGC AATTTGAATA TTTCAACGCC TCCCAGGGCA 
CATACTACCA TTAAAGCTAG TCTGGATTTA GGAGAGTCCT GGCAACCTGT AAATCTATTG 
CACCTTGATG AACGTAAATC TTACGGCTAT TCCGTACTTA CTAAAATAGA TGACCAGACC 
CTGGGTTTGC TATATGAAGG CATCAGGACT TTGCTGTTTG TTAAAATTCC CGTAAAGGAT 
ATCATTAAAT AA

Protein sequence

MNNRKIFNHF ILFIFIAAAL ACSDKIYKAR DRGGISIKAE PTINPIFKRL EVNPYLRLEI 
DIPEGTEAIT FQQFKGSIET AGLQDIAKLE LYQGDDQQEL SKNKLLGSTI PSTNQFSITL 
GTTLTPGKHS LWLSVTLKDN ADIDHQLRIR ADQLTNASGL IYKVAQHQIS SRYLGIALRK 
PNDENVHTYR IPGMITTDKG TLISVYDIRY DNDKDLPGNI DVGMSRSTDG GKTWDTMKNI 
MDMGGPADNS GSGDPSILFD PVTKTIWVSA LWSKGNRSIA GSGPGLSPEE TGQFLVTSSK 
DDGLTWTKPY SITNQVKNPE WRLFFPGPGN GIAMADGKIV FPAQYWDAAK MPHSTLIYSD 
DHGKSWKAGL GAKSNTTEAQ LVETNPGTLM LNMRDNRGGF RSVATTKDMG QSWIEHATSY 
SALPDPVCMA SLIKVNVKFK RVSKDVLFFS NLNISTPPRA HTTIKASLDL GESWQPVNLL 
HLDERKSYGY SVLTKIDDQT LGLLYEGIRT LLFVKIPVKD IIK