Gene Phep_3864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3864
Symbol
ID	8254998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4636577
End bp	4637779
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	45%
IMG OID	644937528
Product	glycosyl hydrolase family 88
Protein accession	YP_003094117
Protein GI	255533745
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.357687
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTATA AATTAAAAAC AAGCTGTTTT GTATTGCTGT TCATGGCTTT TGCCGCGGTG 
TCGGTAAATG CCCAGAAACG CTTTAAGCCG AATGGAAATC TATTAAAAGC GGTAAAAAGG 
GGTCTGAACG AATCAGCTCT GCAATATCAT TTTTTGATGG AACAGCTACC TGCCGGACGT 
TTCCCCGTTA CCTATTACAG TAAAGAACAA AAAATGATTA CCAGCGGCTC CGAGCCCTGG 
GTAGGTGGTT TTTATCCGGG GGGGTTACTT TACCTGTATG AAAGCACTAG AGATACAGCG 
CTATATAATG AAGCTTTACG CAAACTAAAA TTGCTGGAAA AAGAGCAGTT TAACAAAACT 
ACGCACGACC TTGGCTTTAT GATGTATTGT TCTTTTGGAA ATGCCCGAAG GCTGATGCAC 
ACAAGCGCAT ACGATCAGAT CATCATCAAC AGTGCAAAAT CACTTTCCAG CCGTTATAAT 
GATAAAGTGG GCTGTATCCG TTCATGGGAC TCTGATGCTG CACGTTTCAT GGTCATTATA 
GACAATATGG TCAATCTGGA ACTGCTGTTT GCTGCAACAA AATTAACCGG AGATTCCAGC 
TATTACCACA TCGCAGTGAA ACATGCGAAT ACCACCATGA AGCACCATTA CCGTGCGGAT 
TACAGTTCCT ACCATTTGGT CATCTATAAT CCTGAAACCG GTGCTGTTTC CAAAAAACAA 
ACAGTTCAGG GGGCAGCTGA TACTTCAGCA TGGGCGAGGG GGCAGGCCTG GGGATTATAT 
GGTTATACTG TAATGTACCG GGAAACAAAG GATAAAAAAT ATCTGGATAT GGCCAATCAC 
ATTGCGCAGT TTCTCCTTGG CCACCCCAAT CTGCCGAAAG ACAAGATCCC TTACTGGGAT 
TTTAATGCAG CAGGTATTCC CAATGCACCC AGAGATGCAT CTGCAGGTGC AGTGATCTGT 
TCAGCTCTGA TCGAACTGGC GGGCTACGCC GGCCCTAAAA TGGCGAAAAC TTATTTTAGT 
GCGGCAGAGA CCATGCTTGG GGCGTTGTCT TCTCCTGCCT ATCGTGCTGC AACAGGGGAA 
AATGGCGGGT TTATTCTAAA ACATGGCGTT GGTAATTACC CCCGTAATGC AGATATAGAT 
GTGCCCCTGA TTTACGCAGA TTATTATTAC ATCGAGGCCC TGTCAAGATA TCAGAAACTA 
TAA

Protein sequence

MHYKLKTSCF VLLFMAFAAV SVNAQKRFKP NGNLLKAVKR GLNESALQYH FLMEQLPAGR 
FPVTYYSKEQ KMITSGSEPW VGGFYPGGLL YLYESTRDTA LYNEALRKLK LLEKEQFNKT 
THDLGFMMYC SFGNARRLMH TSAYDQIIIN SAKSLSSRYN DKVGCIRSWD SDAARFMVII 
DNMVNLELLF AATKLTGDSS YYHIAVKHAN TTMKHHYRAD YSSYHLVIYN PETGAVSKKQ 
TVQGAADTSA WARGQAWGLY GYTVMYRETK DKKYLDMANH IAQFLLGHPN LPKDKIPYWD 
FNAAGIPNAP RDASAGAVIC SALIELAGYA GPKMAKTYFS AAETMLGALS SPAYRAATGE 
NGGFILKHGV GNYPRNADID VPLIYADYYY IEALSRYQKL