Gene Phep_2203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2203
Symbol
ID	8253309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	2534436
End bp	2535794
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	47%
IMG OID	644935852
Product	oxidoreductase domain protein
Protein accession	YP_003092469
Protein GI	255532097
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.13021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGATT CAAGAAGAAA ATTTATCAAA CAATCTGCCA TAGCCGCGGC AGGAACTTAT 
TTGGGAACAA TGGGTTTGAG CGCGAAGAGT TATGGAAATA TTATTGGGGC CAACGACCGG 
GTAAGGGTTG GTGTGGTCGG TTTTTCTGAC CGCTTTAAGA GTTCCCTCCT TCCCTCTTTT 
TTAAACCACA ACAAAGAACT GAATTTTGAC ATTGTAGCGG TTTCTGACCT TTGGAATTAC 
CGCAGGGGTT TGGGTGTAGA GCATTTGAAA TCGAAATTTG GCCATGACAT TACGGCCTGC 
CGCAACAATG ATGAACTGTA TGGTTTAAAG GATATTGATG CGGTGATTGT GAGTACTGCA 
GATTTTCAGC ATGCTACCCA CTGTGCCGAA GGCGTAAACA ACAAATGTGA TGTGTATTGC 
GAAAAGCCTT TTGCGGAGAC GATGGAAGAT GCACGTATGG CATTGAAGGC CGTTAAAGCT 
TCTAAACAGA TTGTCCAGAT TGGTTCTCAG CGGAGGAGCG GCAACAATTA CAAGGCTGCC 
GAGCGCTTTA TTAAGGATGG CAAGTTTGGC GACATTACCA TGGTGGAGCT GAGCTGGAAT 
GTGAACCAGC CGGGACGCTG GCGCAGACCA GAGCTTGTGG CCATGCTGAA ACAGGAGGAT 
ACCGACTGGA AGCGCTTTTT GATTAACCGC CCTTTTGAAG AATGGGATCC GCGTAAGTAT 
CTGGAGTATC GTCTTTTCTG GCCGTATTCT TCGGGTATGC CCGGACAGTG GATGTCGCAC 
CAGATTGATA CTGTGCATTG GTTTACCGAC CTGAAGCACC CAAGAAGTGT GGTGGCCAAC 
GGGGGTATTT ACCAGTGGAA AGATGGCCGC AGGAACTGGG ACACCACCAC AGCTGTATTT 
GATTATGGTA AGCCGAATGA TCCTAACAAT GGTTTCCAGG TGATATTTAC TTCAAGGATG 
CACAATGGTG ATGAGAACCC GGCAGAGATC TATTACTCGA ACGGCGGTGA ACTGAACCTG 
AACACGAATA TGGTTTCACC TAAAGGTGGT TTAACCGCAA AAGCTGCTGC AGCCATGAAC 
ATGAAGCCAA ACCTGTTGCC TGAGTTGAAG CTGAGTGACA TGACGGAGAA AGTTGCTGCA 
TCGGCCGATA CCGGTGGCGA TAAGCTGACC TCTGCACATA TGCGCAACTG GATGGAATGT 
GTGAGGAGCA GAAAGCAGAC CAATGCGCCT GTTGAGGCTG GATATTATCA TTCTATTGCG 
AACATTATGA CGAATGCTGC AGTGAGGACG GGTAAGAAAG CAGTGTTTGA TGAGAAAACG 
CAGGAAGTAA TGGTAGATGG GAAGGTGTTT AAGTACTAA

Protein sequence

MLDSRRKFIK QSAIAAAGTY LGTMGLSAKS YGNIIGANDR VRVGVVGFSD RFKSSLLPSF 
LNHNKELNFD IVAVSDLWNY RRGLGVEHLK SKFGHDITAC RNNDELYGLK DIDAVIVSTA 
DFQHATHCAE GVNNKCDVYC EKPFAETMED ARMALKAVKA SKQIVQIGSQ RRSGNNYKAA 
ERFIKDGKFG DITMVELSWN VNQPGRWRRP ELVAMLKQED TDWKRFLINR PFEEWDPRKY 
LEYRLFWPYS SGMPGQWMSH QIDTVHWFTD LKHPRSVVAN GGIYQWKDGR RNWDTTTAVF 
DYGKPNDPNN GFQVIFTSRM HNGDENPAEI YYSNGGELNL NTNMVSPKGG LTAKAAAAMN 
MKPNLLPELK LSDMTEKVAA SADTGGDKLT SAHMRNWMEC VRSRKQTNAP VEAGYYHSIA 
NIMTNAAVRT GKKAVFDEKT QEVMVDGKVF KY