Gene Phep_2271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2271
Symbol
ID	8253377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2638045
End bp	2639670
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	40%
IMG OID	644935920
Product	Aldehyde Dehydrogenase
Protein accession	YP_003092537
Protein GI	255532165
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0315969
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTCAA AAAATCAGCT CGATTCTATT TTCGTAGCAG AAAATCAGAT CCCTGAAGCG 
TTTAAATTAT CCGAAGAAAT ACACCAGCGT GAATACCTGA CTAATGGTGA AATGCGCGCC 
TGGAATGGTG AGGTACATGA AGTTCTATCT CCTGTTTGTA TTAGAACAGA AAAGGGACTG 
GAAAGAAAGT TAATAGGAAC ATATCCTTTA TGTAGTGAAA AAGAGGCTGA TGAAGCACTT 
CAGGCTGCAG TAGCCGCATA CAACAACGGA AGAGGAGAGT GGCCAACTAT GAGTGTAGCA 
GACAGGATCC ATTGCGTAGA ACAGTTTACG CATAAAATCA TTGAAAAGAA GGCCATCGTT 
GTCAAATTGT TAATGTGGGA AATAGGTAAA TCATATGCCG ATTCTGTCAA AGAATTTGAC 
CGTACAGTGG AGTATATTTA TGCTACAATT GATGCGCTGA AAGACTTAGA CAGACAATCT 
TCTAAATTCA GCATAGAGCA GGGAATTGTG GCACAGATCA GACGTTCACC CTTAGGTGTG 
GTATTGTGCA TGGGGCCATT TAATTATCCC TTAAATGAAA CTTTTACCAC ACTGATCCCT 
GCGTTGATCA TGGGAAATAC CTTGCTGTTT AAACCACCTA AGCATGGTAC GCTGTTACAT 
TACCCACTGT TGGAAGCATT TAGGGATTGT TTTCCAAAAG GAGTAGTAAA CACCATATAC 
GGTCGGGGAA ATAAAATTAT TCCTGATCTC ATGAAATCTG GTCAGATTAA TGTTTTAACA 
TTAATTGGAT CAAGCAAGGT AGCCAATGAA CTTAAAAAGT TACACCCTAA AGTTAACAGG 
TTAAGGGCAA TCCTTGGTTT AGATGCCAAA AATGCCGCAA TAATTACCGC AAAAGCTGAT 
ATTAACCTGG CAGTACAGGA AACTGTATTG GGGTCATTGT CTTTTAACGG ACAAAGGTGT 
ACTGCCCTTA AGATCGTTTT TATACACCGA AGCCTGGCCG ACGTATTTCT GAAAGAGCTT 
TCCGCTGCAG TCGCTGAACT TAAATTTGGT ATGCCATGGG AAACAGGTGT TTCTTTAACT 
CCTTTACCGG AGCCACAAAA ACCGGCTTAC CTTAAAGACT GTATAGCTGA TGCAGTAGCT 
AAGGGTGCTA AGATTGTGAA CGACAATGGG GGAGATAGCT GTGAATCATT TGTATATCCT 
GCAATTGTTT ATCCTGTAAA TAAGCACATG AAGTTGTATA CAGAGGAGCA ATTTGGACCT 
GTAATACCAG TTGTACCATT TGATGATCTG GAAGAAACCA TTCAATATCT TATTGATTCT 
ACACATGGAC AACAGGTGAG TATTTTTAGC AATGATGATG AAGAAATCGC TGCGCTTATT 
GATCCGCTGG TTAATCAGGT AAGCAGGGTT AATATCAATT GCCAATGCCA ACGCGGACCG 
GATGTATTTC CGTTTACAGG CAGGAAAGAT AGCGCAGAAG GAACCTTATC TGTAATTGAT 
GCCTTAAGGT CGTTTTCTAT CCGCTCTTTA GTGGCTACTA AATTAAATGA GAGTAACAAA 
CACCTGATCA ATGAAATTGT AGACAGCAAT AGTTCCAATT TCCTGAGTAC AAAATATTTG 
TTTTAA

Protein sequence

MFSKNQLDSI FVAENQIPEA FKLSEEIHQR EYLTNGEMRA WNGEVHEVLS PVCIRTEKGL 
ERKLIGTYPL CSEKEADEAL QAAVAAYNNG RGEWPTMSVA DRIHCVEQFT HKIIEKKAIV 
VKLLMWEIGK SYADSVKEFD RTVEYIYATI DALKDLDRQS SKFSIEQGIV AQIRRSPLGV 
VLCMGPFNYP LNETFTTLIP ALIMGNTLLF KPPKHGTLLH YPLLEAFRDC FPKGVVNTIY 
GRGNKIIPDL MKSGQINVLT LIGSSKVANE LKKLHPKVNR LRAILGLDAK NAAIITAKAD 
INLAVQETVL GSLSFNGQRC TALKIVFIHR SLADVFLKEL SAAVAELKFG MPWETGVSLT 
PLPEPQKPAY LKDCIADAVA KGAKIVNDNG GDSCESFVYP AIVYPVNKHM KLYTEEQFGP 
VIPVVPFDDL EETIQYLIDS THGQQVSIFS NDDEEIAALI DPLVNQVSRV NINCQCQRGP 
DVFPFTGRKD SAEGTLSVID ALRSFSIRSL VATKLNESNK HLINEIVDSN SSNFLSTKYL 
F