Gene Phep_3271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3271
Symbol
ID	8254390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	3882807
End bp	3884735
Gene Length	1929 bp
Protein Length	642 aa
Translation table	11
GC content	40%
IMG OID	644936924
Product	sulfatase
Protein accession	YP_003093528
Protein GI	255533156
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.269035
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAAGAG AAAATCCAAT AACCTTAAAC CTGTATGTGG CCCTGGCCTA CAGGTTCCTG 
ATTTTACTGG TTTTATATAC TTTATGCAGA TTGGGCTTCT TCTTTTTTAA CCATAGCCTG 
TTCCAGCACA TTACCTTACC CAAATACCTG TACATGCTAT GGGGCGGACT AAAGTTTGAC 
GTTTCGGCAC TCATCTATAT CAATGCCATC TTCCTTTTAA TGCAGCTGGT ACCTGCCCCT 
TTTAAGTACA AAGATGGCTA TCAGCGCTTT TGCAAATGGC TTTTTATCAT TAGCAACAGC 
ATTGGCATTA TGGCCAACTT TGCCGATTTT GCCTACTATA AATATACACT TAAAAGAACT 
ACAGCAACTG TTTTTAGCCA GTTTAGCCAT GAACAGAACA AGTTTAAACT GTTTATAGAT 
TTTTTAACAG ATTACTGGTA CCTGTTTCTG CTTTATGCCC TGTTTATATG GGGCTTTGTA 
AAGCTTTACC AGCTGGTAGG TGTTAAAAAA GTAAAAACTT TTAAATGGCC TGCATACCTG 
TTGCAAACCG TATTGCTGTT TGCTATTGCA CTGGTTTGCC TTACAGGTGT ACGTGGTGGC 
TGGGGCTATG GCACCAGGCC CATTACGCTG AGCAATGCAG GAGAATTTGT GGATACACCA 
GATCAGATGA GCCTGGTGCT GAACACACCT TTCTGTATAT TCAGGACTTT AAAAGTGTCT 
AAACTAAAGC CTGTAAACTA TTACGATGAG CAGACATTGA ACAGCATTTA CAATCCCATA 
CACCTGCCCA AAGATACGGT TGCCTTTAAA AAGCTGAATG TCGTTTTCCT GATCATAGAA 
AGTTTGGGTA AGGAACATAT AGGCGGCTTA AATAAAGACC TGATGGGTGG AAAGTACAAA 
GGTTTTACCC CTTTTATTGA TTCGCTGATT GAACAGAGCT ATACCTTTAC CCATACTTAT 
GCCAATGGCC GTAAATCTAT AGATGCGCTA CCTTCTGTGA TTTCAGGTAT TCCTTCTATC 
CGTGAGCCTT TTGTACTTTC GGTATACTCA GGGAATAAGA CCACCAGCAT TGCCAAGCTT 
TTAGGTGATA AGGGGTATGA AACTGCCTTT TTTCATGGGG CACCAAATGG TTCGATGGGT 
TTTTCCTCTT ATACCCATCT TGCAGGAATC AAACATTATT TCGGACAGAA CGAATATAAA 
AAAACAGGAG ATTATGACGG TACCTGGGGC ATTTGGGACA ATCCTTTTAT GCAATATATG 
GCCCAAACCA TGAATACGCT GAAGCAACCT TTTTTCTCAG CATTTTTCTC GCTTTCTTCT 
CATCATCCTT TCAAGCTGCC CGATGAATAT GCAGGTAAAT TCCCTAAAGG TCATTTGCCT 
GTACAGGAAG TACTGGGCTA TACAGACATG GCACTGCGTA ATTTTTTCAG AACGGCATCT 
GCTATGCCCT GGTATAAAAA CACACTGTTT GTATTGTGTG CGGATCATGC CACAGTATCT 
TACTTCCCTG AATATCAAAC CACTCCCGGA TATTTTTCTA TTCCGATTGT TTTTTATTAT 
CCTGGCGGGG ATTTAAAAGG GAAAGCGGAT AAAAACGTAC AACAGATAGA TATTATGCCC 
ACTGTTTTGA ATTATCTGCA TTATGACAAA CCTTATTTTG CGCTTGGCTT TGATGCTTTT 
GACAAAAGAC AGGATAATTT TGTGGTAAAC AATAACGATG GTACCTTTAG CTTTTACCAG 
GGCGATTATT TACTGATCAA TGATGGCAAG ATCAACCTTT CATTATACAA TTTAAAAACC 
GACCGTCTTA CTCAAAACAA CATATTAGAT AAAGAACCGT TAATTGCACA ACAAATGGAA 
AAATACCTGA AAGCTTTTGT GCAACAGTAC AACAACCGGA TGATTGAAAA CAAATTAACG 
GCGAATTAG

Protein sequence

MKRENPITLN LYVALAYRFL ILLVLYTLCR LGFFFFNHSL FQHITLPKYL YMLWGGLKFD 
VSALIYINAI FLLMQLVPAP FKYKDGYQRF CKWLFIISNS IGIMANFADF AYYKYTLKRT 
TATVFSQFSH EQNKFKLFID FLTDYWYLFL LYALFIWGFV KLYQLVGVKK VKTFKWPAYL 
LQTVLLFAIA LVCLTGVRGG WGYGTRPITL SNAGEFVDTP DQMSLVLNTP FCIFRTLKVS 
KLKPVNYYDE QTLNSIYNPI HLPKDTVAFK KLNVVFLIIE SLGKEHIGGL NKDLMGGKYK 
GFTPFIDSLI EQSYTFTHTY ANGRKSIDAL PSVISGIPSI REPFVLSVYS GNKTTSIAKL 
LGDKGYETAF FHGAPNGSMG FSSYTHLAGI KHYFGQNEYK KTGDYDGTWG IWDNPFMQYM 
AQTMNTLKQP FFSAFFSLSS HHPFKLPDEY AGKFPKGHLP VQEVLGYTDM ALRNFFRTAS 
AMPWYKNTLF VLCADHATVS YFPEYQTTPG YFSIPIVFYY PGGDLKGKAD KNVQQIDIMP 
TVLNYLHYDK PYFALGFDAF DKRQDNFVVN NNDGTFSFYQ GDYLLINDGK INLSLYNLKT 
DRLTQNNILD KEPLIAQQME KYLKAFVQQY NNRMIENKLT AN