Gene Phep_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2026
Symbol
ID	8253130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2335069
End bp	2336331
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	41%
IMG OID	644935674
Product	ABC transporter related
Protein accession	YP_003092293
Protein GI	255531921
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1134] ABC-type polysaccharide/polyol phosphate transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.476742
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0046378
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTAACC TGATGCTAAA AGCAGAAAAC ATATCAAAAT ATTACCGACT GGGCGTAATA 
GGATCCGGAT CATTTAAAGA AGATCTCCAA AACCTCTGGA AGAAAACATT TTCAATTGGC 
AATAATACAG CAACGAACGA CCTCCATATC GACAAAGGAA AAGAACTATG GGCGCTTAAA 
GACATTAATT TTGAGATAAT GAAGGGCGAC GTGGTCGGCT TTGTTGGCAA AAACGGAGCT 
GGAAAATCAA CCCTGTTGAA AGTACTGTCG CGCATTACGC TACCAACAAC CGGCACCATT 
AAAGGCAAGG GCCGCATTGC AAGTTTATTG GAAGTTGGCA CAGGCTTCCA TTTAGAGTTG 
ACAGGCCGCG AGAACATCTT TTTAAATGGG CAAATTTTGG GTATGCACAA AAAAGAGATC 
ATAGCTAAAT ATGACGAAAT TGTAGCTTTT TCCGGTATTG AGCGATTTCT GGATACTCCT 
GTAAAACGCT ACTCCAGCGG GATGTACGTT CGGCTTGCAT TTGCCATAGC TGCGCATTTG 
GATCCCGAAA TCCTCATCGT TGATGAGGTA TTAGCTGTGG GTGATGCTGA ATTTCAGAAA 
AAATGCCTGG GTAAAATGAA ACAGGTGTCG ACAGAAGAAG GCAAAACTGT ACTTTTTGTA 
AGCCATAATT CGCAAGCGCT AAAAAGCTTA TGTACCAAAG CAATCTACCT TGAAAAAGGG 
CGGCTAATTG ATATGGGAAA TATGCAAGAT GTAATAGGCA ATTATTTAAA GCGTGAGCAA 
ACATTATATC TAAGCAGGAT ATACGATGAC CCTGACACTG CGCCAGGAAA TGAAAGTGTC 
CGTATCAAAC GTGTCGAAAT GTTGCCACAA TATCCCGATT CCAGCAATAT CATAGACATC 
AGAACACCTC TGCTCATCGA ATTCGAATTT TGGTATTTAC CAGCGGAAGA AATGGATCTG 
GGTGTAAACA TTATATTAAA CACCGTAATG GGAGAATGTG TTTTTAATGT CGCCTCAACT 
TCAAAGCAAT ATACCAAGGG GGTAATTAAA GGGAAATGTA CTATACCTGG CGACTTTCTG 
AATAATGGGT CCTATTCCAT AGACCTGTCA TTTGTTAAAA ACACCAGCAG TCCATTGTTT 
GATTTTGAAG AATGCTTATC TTTTGAAGTG GAGGACTTTA GGGAGAATAC GGCATGGTAT 
GGCGACTGGG TTGGCTCGGT TAGGCCAAAG TTTAAAGTAC AACTGCAACA AGACAACTTT 
TAA

Protein sequence

MSNLMLKAEN ISKYYRLGVI GSGSFKEDLQ NLWKKTFSIG NNTATNDLHI DKGKELWALK 
DINFEIMKGD VVGFVGKNGA GKSTLLKVLS RITLPTTGTI KGKGRIASLL EVGTGFHLEL 
TGRENIFLNG QILGMHKKEI IAKYDEIVAF SGIERFLDTP VKRYSSGMYV RLAFAIAAHL 
DPEILIVDEV LAVGDAEFQK KCLGKMKQVS TEEGKTVLFV SHNSQALKSL CTKAIYLEKG 
RLIDMGNMQD VIGNYLKREQ TLYLSRIYDD PDTAPGNESV RIKRVEMLPQ YPDSSNIIDI 
RTPLLIEFEF WYLPAEEMDL GVNIILNTVM GECVFNVAST SKQYTKGVIK GKCTIPGDFL 
NNGSYSIDLS FVKNTSSPLF DFEECLSFEV EDFRENTAWY GDWVGSVRPK FKVQLQQDNF