Gene Phep_2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2202
Symbol
ID	8253308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	2533061
End bp	2534422
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	44%
IMG OID	644935851
Product	protein of unknown function DUF1080
Protein accession	YP_003092468
Protein GI	255532096
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.262021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCT CACAATTATT AATTTTAACA GGTTTGCTGT TTGGCAGCAC CGCAGGTACT 
TTACAGGCAC AAGGCGGGAA ATGGCAAAAC CTTTTTAACG GCAAAGACCT GAAGGGCTGG 
AAACAGTTAA ATGGAAAGGC AAAATACGAA GTTGTAAACG GGGAAATCGT AGGTACTACG 
GTACGCGATA CGCCCAATTC TTTCCTGGCT ACAGAGAAGA ACTATGGTGA TTTTATTTTT 
GAAGTAGAAT TGCTGGTAGA CAATTCCATG AACTCGGGCA TACAGTTCAG GAGTGAAAGT 
AAGGCCGACT ATAAAGAAGG CAGGGTGCAT GGTTATCAGA TGGAGGTAGA TCCTTCTGAC 
AGGGCCTACA GTGGCGGCAT TTATGATGAG GCCCGTCGTG GCTGGCTGTA TCCGATGGAC 
ATTAACCCTG CAGGTAAAAC AGCTTTTAAA AAGGGGGAAT GGAACAAATA CCACATCGAA 
TGCATTGGCA ATTCGATCAG GACCTGGGTA AATGGTGTGC CTACGGCTAA TGTAGTTGAC 
GATATGACCT CCTCAGGTTT TATTGCCCTG CAGGTACATG CTATTGGTAA AAATGATGAG 
CCGGGTAAAC AGATCAGGTG GAGGAACATC CGTATCCAGA CAGAAAACCT GAAGCCTGCA 
AAAGCAGACC ATATATTTGT GGTGAACATG ATCCCCAATA ACCTGTCGCC TGCCGAAAAA 
GTAAACGGAT ACAGCCTGTT ATGGGATGGT AAGACCAGTA ATGGCTGGAA AGGTGCCTAT 
AAGCCTGGTT TTCCTGAAAA GGGATGGGAG ATTAAAGATG GGGTGCTGAG TGTACTGAAG 
TCCAACGGTG CGGAATCGAC CAATGGCGGT GACATTGTAA CGGTTAAACA ATACGGTGCT 
TTTGAAATGA AGTTTGATTT TAAACTTACT GAAGGTGCAA ATAGCGGGGT TAAGTATTTT 
GTTACCCTTA CTGAAGGCAA TAAAGGTTCG GCGATTGGGC TGGAGTATCA GATACTGGAT 
GATGAGAGAC ATCCGGATGC CAAACTGGGC AAAAACGGTA ACCGTAAACT GGGTTCTTTG 
TATGACCTGA TCACCAGCAA AAAAATACCC AATGCACAAA GGAAAATCGG CGAATGGAAC 
AAAGGGGTAA TTAAGGTATA TCCCAACAAT AAGGTTGAAT ATTATTTAAA CGGATTTAAG 
ATCCTTGAAT ATGTACGGGG ATCGGCCGAG TTTGAGGCAT TGGTTGCAGA AAGCAAATAT 
AAGAACTGGA AAAATTTTGG TATGGCGCCT AAAGGCCATA TCCTGCTCCA GGACCATGGC 
GACAGTGTAT CCTTCAGAAG TATTAAATTA AAAGAACTAT AA

Protein sequence

MKTSQLLILT GLLFGSTAGT LQAQGGKWQN LFNGKDLKGW KQLNGKAKYE VVNGEIVGTT 
VRDTPNSFLA TEKNYGDFIF EVELLVDNSM NSGIQFRSES KADYKEGRVH GYQMEVDPSD 
RAYSGGIYDE ARRGWLYPMD INPAGKTAFK KGEWNKYHIE CIGNSIRTWV NGVPTANVVD 
DMTSSGFIAL QVHAIGKNDE PGKQIRWRNI RIQTENLKPA KADHIFVVNM IPNNLSPAEK 
VNGYSLLWDG KTSNGWKGAY KPGFPEKGWE IKDGVLSVLK SNGAESTNGG DIVTVKQYGA 
FEMKFDFKLT EGANSGVKYF VTLTEGNKGS AIGLEYQILD DERHPDAKLG KNGNRKLGSL 
YDLITSKKIP NAQRKIGEWN KGVIKVYPNN KVEYYLNGFK ILEYVRGSAE FEALVAESKY 
KNWKNFGMAP KGHILLQDHG DSVSFRSIKL KEL