Gene Phep_2077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2077
Symbol
ID	8253181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	2393759
End bp	2394760
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	45%
IMG OID	644935725
Product	aldo/keto reductase
Protein accession	YP_003092344
Protein GI	255531972
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.97994
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.282857
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTATA CACCTGATCC AGCCAGATAT ACGCAAATGA AATATCGCCG CTGTGGCAAT 
AGCGGATTAA AATTATCTGC CATTTCCCTG GGCTTATGGC ATAATTTCGG ACATGTTGAT 
CAGCTTGAAA ACTGTAGCAA CATCCTGAAA CTTGCTTTTG ACAGTGGCAT TACCCATTTT 
GATCTGGCTA ACAATTACGG GCCACCCCCG GGTGCTGCCG AAGAAAATTT TGGCCTGCTC 
TTAAAAAGGG ATTTTCCAGG TTACAGAGAT GAAATGATCA TTTCAACAAA GGCGGGCTAT 
ACCATGTGGG ATGGACCTTA TGGCGACTGG GGATCTAAGA AATACCTCGT TTCCAGTTTA 
GACCAGAGCC TGAAAAGACT TCAACTGGAT TATGTGGATA TCTTTTACCA CCATCGACCG 
GACCCCGAAA CCCCGCTGGA AGAGACGATG TCTGCCCTGG ACCTGATCGT CCGCCAGGGT 
AAAGCACTTT ACATCGGAAT TTCTAATTAT AAACCTGCAG AAGCTGCAAC TGCAATACAG 
CTTTTAAAGG AGCTGGGTAC ACCCTGTATT ATTCATCAAC CTAAATACTC CATGTACGAA 
CGCTGGATAG AGGGGGGATT GCTGGAGCTG CTCGGAAATC AGGGAGTAGG TTGCATACCT 
TTTTCTCCAC TTGCGCAGGG ATTGTTAACG GATAAATATC TTAAAGGGAT ACCTGCTGAT 
TCAAGGGCAG CAAAAACATC TGGTGCATTA CAGCCAGATC AGATTACAGC AGAACGGCTT 
CGGCAGTTAA ACCAGCTGAA TGAGCTGGCA CAGTCACGGG GACAAAAACT TGCGCAAATG 
GCCTTATCAT GGATATTACG TGATGAGCGT GTGACTTCAG TATTGGTAGG GGCAAGCAAA 
CCTGAACAAC TTGCTGATTC TTTAAAATGT CTGGACAATA CCACCTTCAG TACAGCCGAA 
TTACATCAAA TTGATTTGAT ACTTTCCGGT TCATCAACCT GA

Protein sequence

MSYTPDPARY TQMKYRRCGN SGLKLSAISL GLWHNFGHVD QLENCSNILK LAFDSGITHF 
DLANNYGPPP GAAEENFGLL LKRDFPGYRD EMIISTKAGY TMWDGPYGDW GSKKYLVSSL 
DQSLKRLQLD YVDIFYHHRP DPETPLEETM SALDLIVRQG KALYIGISNY KPAEAATAIQ 
LLKELGTPCI IHQPKYSMYE RWIEGGLLEL LGNQGVGCIP FSPLAQGLLT DKYLKGIPAD 
SRAAKTSGAL QPDQITAERL RQLNQLNELA QSRGQKLAQM ALSWILRDER VTSVLVGASK 
PEQLADSLKC LDNTTFSTAE LHQIDLILSG SST