Gene Phep_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2100
Symbol
ID	8253205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2421367
End bp	2422740
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	48%
IMG OID	644935749
Product	Aldehyde Dehydrogenase
Protein accession	YP_003092367
Protein GI	255531995
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.773732
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.123203
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATAA AATCTATTGA CCCGACAAAT GGCAAGGTAA TTAAATCTTA TCCTGAAACC 
ACCAAAGCAC AAGTTGTTAA AAAGATTGAA CAGGGACATA AAGCCTGGAC AGAATGGAGA 
AAAAGCAGTA TTAAAGAAAG GGCTGCCCTG CTAAGGGGTC TCGCTGATCA GCTGCACATA 
CAAAGAGCGG AGCTGGCAAG GCTCATGGCT TTGGAAATGG GCAAACCCCT GAACGATGGC 
CTGGCCGAGA TAGACAAATG TGGCGCTGTA TGTAAATACT ACGCAGAAAA AGGGGCAGAT 
TTTTTGCAGG ACCAGCGGAT TGAGACTGAG GCTTCAAAAA GCTACGTCAG CTTTCAGCCT 
CTGGGTGTAG TGCTGGCCGT AATGCCCTGG AATTTTCCTT ACTGGCAGGT ATTCAGGTTT 
CTTGCCCCCG CCCTGATGGC GGGCAATTGC GGGGTACTGA AACACGCTTC AAATGTACCG 
GGATGCGCCC TATCTATAGA AAAGCTGGTA AAGGATGCGG GTTACCCTGC CCATGTATTT 
CAAACCCTGA TGATTGGCAG TAACGTGGTA AACGAAGTGA TTGCCCATCC GCTCATAAAG 
GCGGTAACCC TTACCGGAAG CACGCAGGCA GGAATGAAAG TTGCCGCACA GGCAGGCATG 
CTGCTGAAAA AAACAGTACT TGAACTGGGG GGCAGTGATC CTTATTTGGT ACTGGAAGAT 
GCCGACCTGG AATTTGCAGC CGAAACCTGC GTAAACAGCA GGCTGATCAA CAACGGGCAG 
AGCTGTATTG CAGCAAAAAG ATTTATTGTT GTAAAAAAGA TAGAAAAGGA ATTTACCAGG 
CTTTTTGTGC AAAAAATGAA ACAGAAAAAA CTGGGTAACC CTTTGGAAGC GGATATCAAC 
CTGGGTCCTA TGGCCCGTGC AGATTTACGT GACGAGCTGC ACCAGCAGGT ACTGAAGAAT 
ATAGAAATGG GTGCAAAATG CCTGCTTGGC GGCCGGATTC CTGCGTTTAA AGGCCAGCAT 
GCCTACTATG AACCTACTGT ACTTAGCGGA ATAAAAAAAG GGATGCCTGC TTACAGCGAG 
GAAATGTTTG GCCCGGTGGC GGCCATACTG ACGGCCAGAG ATGTGGAACA AGCCATTGAG 
CTGGCCAACG ATACTTCATT CGGACTTGGA GCTGCCGTAT TTACAGCTAA TGAAAAACTG 
GGTGAAGAAA TAGCAAGGAC CCGCCTTCAG GCTGGTTCCT GCTTTGTAAA TTCGCTGGTA 
AAATCCGATC CCCGCCTACC CTTTGGGGGC ATTAACCAAA GCGGCTACGG GCGCGAACTG 
GGCCTGTTTG GTATTCATGA ATTTGTAAAC ATTAAAACGG TTTATGTGAA ATGA

Protein sequence

MSIKSIDPTN GKVIKSYPET TKAQVVKKIE QGHKAWTEWR KSSIKERAAL LRGLADQLHI 
QRAELARLMA LEMGKPLNDG LAEIDKCGAV CKYYAEKGAD FLQDQRIETE ASKSYVSFQP 
LGVVLAVMPW NFPYWQVFRF LAPALMAGNC GVLKHASNVP GCALSIEKLV KDAGYPAHVF 
QTLMIGSNVV NEVIAHPLIK AVTLTGSTQA GMKVAAQAGM LLKKTVLELG GSDPYLVLED 
ADLEFAAETC VNSRLINNGQ SCIAAKRFIV VKKIEKEFTR LFVQKMKQKK LGNPLEADIN 
LGPMARADLR DELHQQVLKN IEMGAKCLLG GRIPAFKGQH AYYEPTVLSG IKKGMPAYSE 
EMFGPVAAIL TARDVEQAIE LANDTSFGLG AAVFTANEKL GEEIARTRLQ AGSCFVNSLV 
KSDPRLPFGG INQSGYGREL GLFGIHEFVN IKTVYVK