Gene Phep_1150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1150
Symbol
ID	8252244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	1346892
End bp	1348574
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	44%
IMG OID	644934801
Product	glycoside hydrolase family 43
Protein accession	YP_003091430
Protein GI	255531058
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3507] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCTT GTTTTTCTAT TTTAACTCTT GCTTTTTTTA GCCTGTTCTA TATACCCGGC 
ATTGATGCAC AGCAAAAAAA GAATTTAAAC ATTACTCCTG CTCCTGCAGG GTATGTTTCA 
AAAGTATGGG TGGCCGATCA GGGGGATGGT ACCTACAAAA ATCCTGTGCT GAATGCTGAT 
TATTCTGACC CCGATGCCAT TCGGGTAGGT GATGATTTCT ACCTGATCGC TTCCAGCTTT 
GATGCCGTTC CGGGTTTACC CATTTTGCAC TCTAAAGATC TGGTGAACTG GAAAATTATA 
GGGCATGCGT TAAAAAGACA ATTGCCTTTG GATCATTTTC AAAAAACACA GCATGGAAAT 
GGCGTATGGG CACCTGCTAT CCGTTACCAT AAGGATGAAT TTTATATCTA TTATCCTGAT 
CCGGATTTTG GCATCTATCT TACTAAGGCC AAAACGATCA CCGGTCCCTG GACTGAACCC 
GTACTGGTAG CGCCTGGTAA AGGTTTGATA GATCCATGCC CCCTTTGGGA TGCGGATGGC 
AGGGTATACC TTGCTTTTGC ATTTGCGGGA AGTCGTGCTG GTATAAAAAG TGTGATTGCA 
GTGAAACAGC TGAATGCAGA AGGCAACCAA GCCATAGATG AAGGTACAAT TGTATATGAT 
GGACATGAAA TTGACCCAAC CATAGAGGGA CCGAAGTTTT ATAAACGCAA TGGTTATTAT 
TATATTTTTG CACCCTCGGG TGGCGTTGCT ACAGGCTGGC AACTGGTGCT CCGTGCTAAA 
AATATATATG GCCCTTATGA GCGTAAAGTA GTCATGTCAC AGGGAAAAAG CCTGGTTAAC 
GGACCTCATC AGGGTGCCTG GGTAAATACA CAAACGGGCG AAGACTGGTT CCTGCATTTT 
CAGGATAAAG ATGCGTATGG CAGGGTGGTA CACCTTCAGC CTATGAAATG GGTAAATGAC 
TGGCCGGTAA TAGGTATGGA TGCAGATGGT GATGGTAACG GAAATCCGGT TATGCACTAT 
AAAAATCCTT CAGTAGGCAA AGTCTACCCC ATCAATACCC CGGCAGAAAG CGATGAATTT 
AACAATGTCG GTTTGGGCCT TCAATGGCAA TGGCAAGCCA ATCCCCTGAC CACGTATGCT 
TTTGCAGATG CTGCCAAAGG AAGCCTTAAA TTATATACCC AGCAAATTCC TGCTGAGGCC 
AAAAACTTAT GGGATGTGCC AAATGTATTG CTGCAAAAAT TTCCGGCAGA TGAATTTGTA 
GCCACCACAA AGCTCACTTT TAATCCTAAC CCAAAGCTGG AAAATGAAAA GACCGGATTG 
GTGGTGATGG GTTTAACCTA TGCAAACATC GCCATCAGGA GTAAGAAAGA TGGCTTGCAG 
CTGGTTACCG TAATCTGCGA AAAAGCAGAT AAGGGAAATG CGGAAAAGGA AAGTCTGGTT 
ACCAAATTAA AAACACCCAC AGTTTATTTA CGCTTAACAG TACAAAATGG GGCAAAATGT 
AAGTTTAGTT ATAGCCTTGA TGGCGAAAGG TTTATAGATT CCGGACTTAG TTTTGAGGCT 
AGCCCCGGCA AATGGATTGG AGCCAAAATG GGTCTTTTTG CGACAAGGGA AGACCAGATC 
AATGATTCGG GGTATGCAGA TTATGACTGG TTCAGGGTGG AGGCATTAAA TCTTACTTTT 
TAA

Protein sequence

MKPCFSILTL AFFSLFYIPG IDAQQKKNLN ITPAPAGYVS KVWVADQGDG TYKNPVLNAD 
YSDPDAIRVG DDFYLIASSF DAVPGLPILH SKDLVNWKII GHALKRQLPL DHFQKTQHGN 
GVWAPAIRYH KDEFYIYYPD PDFGIYLTKA KTITGPWTEP VLVAPGKGLI DPCPLWDADG 
RVYLAFAFAG SRAGIKSVIA VKQLNAEGNQ AIDEGTIVYD GHEIDPTIEG PKFYKRNGYY 
YIFAPSGGVA TGWQLVLRAK NIYGPYERKV VMSQGKSLVN GPHQGAWVNT QTGEDWFLHF 
QDKDAYGRVV HLQPMKWVND WPVIGMDADG DGNGNPVMHY KNPSVGKVYP INTPAESDEF 
NNVGLGLQWQ WQANPLTTYA FADAAKGSLK LYTQQIPAEA KNLWDVPNVL LQKFPADEFV 
ATTKLTFNPN PKLENEKTGL VVMGLTYANI AIRSKKDGLQ LVTVICEKAD KGNAEKESLV 
TKLKTPTVYL RLTVQNGAKC KFSYSLDGER FIDSGLSFEA SPGKWIGAKM GLFATREDQI 
NDSGYADYDW FRVEALNLTF