Gene Phep_2237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2237
Symbol
ID	8253343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2589552
End bp	2590601
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	48%
IMG OID	644935886
Product	glycoside hydrolase family 43
Protein accession	YP_003092503
Protein GI	255532131
COG category	[R] General function prediction only
COG ID	[COG3940] Predicted beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.572744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.998954
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGCCA CCTTAAGCGG ATATACCGCT GCAGATGAGG GTAAAAATGA ATTACCGGAT 
ACCTTAAAAG GGATGTTTAA AAACCCGATA GCAGCGGGGG CAGATCCCTG GGTAATTAAA 
TCGGGAAAAT ATTATTATAC CTGCCTGAGC AACGGGAACG TGGACAGTAA AGGGATTTCG 
GTTTGCAGAT CACTGAAACT TACGGAGCCC GGCAGCAAAA TAACAGTATG GACAGCCCCG 
GATACCGGCT GGAATTCGAC CCAGATCTGG GCTCCTGAAC TGCATCACAT GAACAACAGG 
TGGTATATTT ATTATGCCGC GGGCAGAAAA AAGGGAGCGC CGTATATCCA TCAGCGCTCT 
GGTGTACTGG AATCGGTTTC TGATGATCCG CAGGGACAAT ATATAGACCG GGGATTATTA 
CAGACAGGTG TAGATAAGAA TGATCCGAGT GGTACGATAT GGGCAATTGA TGTAAATGTA 
GCCAGTATAA AGGGCAAACT CTATGCAGTA TGGTCAGGAT GGGAAAAAAA TATGGATACA 
GATAAAACAT CGCAGCAGCT TTATATTGCA GAGATGAGCA ATCCCTGGAC GATCAGTTCA 
AAACGGGTTA AACTATCGGG CCCCGACCAG CCATGGGAAC AGGGAGGCCC TTTGAACCTG 
AACGAAGGCC CCGAGTTTTT ACTGCATAAG GGACAGGTTT TTATCATTTA CTCTACCCGT 
GAATCCTGGA CACCTGAATA CAGACTTGGA CAGCTCCGTT TAAAGGATCC GGCCAGATCA 
CTCCTGGATG CTGCCAACTG GCTGAAATCC GGTCCTGTAT TTCAGGGTAC CCAGACAGTT 
CATGGCACGG GGCATGCGAG TTTTACCACT TCGCCAGACG GGAAGGAATG GTGGATGATT 
TACCATACCA AGCGTAGCAC AAAGCCGGGC TGGGAACGTG ATATCATGAT GCAAAAGTTT 
AAATGGGACA AAGATGGCAA CCCGGATTTT GGAAAACCGG AGCCAGCAGG CAAACTGTTG 
AAAAAGCCTT CGGGAGAAGA GGGGGGATAA

Protein sequence

MLATLSGYTA ADEGKNELPD TLKGMFKNPI AAGADPWVIK SGKYYYTCLS NGNVDSKGIS 
VCRSLKLTEP GSKITVWTAP DTGWNSTQIW APELHHMNNR WYIYYAAGRK KGAPYIHQRS 
GVLESVSDDP QGQYIDRGLL QTGVDKNDPS GTIWAIDVNV ASIKGKLYAV WSGWEKNMDT 
DKTSQQLYIA EMSNPWTISS KRVKLSGPDQ PWEQGGPLNL NEGPEFLLHK GQVFIIYSTR 
ESWTPEYRLG QLRLKDPARS LLDAANWLKS GPVFQGTQTV HGTGHASFTT SPDGKEWWMI 
YHTKRSTKPG WERDIMMQKF KWDKDGNPDF GKPEPAGKLL KKPSGEEGG