Gene Phep_4268 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_4268
Symbol
ID	8255404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	5146056
End bp	5147444
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	48%
IMG OID	644937934
Product	Aldehyde Dehydrogenase
Protein accession	YP_003094521
Protein GI	255534149
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCACT CCGCTTTTGA AGCCCAGCAA AAACATAAAT ATACACTTAG AAACAGCAAT 
GCTGCACAAA GAATTGACAA ATTAAAAACC TTAAAGGCCT GTATAGAAAG CTATGAGGAA 
AAAATTTATG CTGCCCTGCA AAGTGATCTG CGAAAAAGCC GGTTTGAAAG TGCGCTTACA 
GAACTGATCT TTATTTACAG TGAGATCGGC TTTGCCATCC ATAACCTGAA CAGCTGGATG 
AAACCGAAAA GGGCTGGCAA AACCATCAGT AATCTTTTTG CGAAAAACAG GATCTGTTAC 
GAGCCAAAGG GCTGCTGCCT GATCATTGCG CCCTGGAACT ATCCTTTTCA GCTCCTCATG 
AGCCCCCTCA TCTCGGCCAT AGCTGCGGGC AATTGCGCGA TACTGAAGCC ATCTGAACTG 
AGCCCGGCTA CCAGTTCGGT GATTGCAGCG CTGATCAGGG ATTGTTTTGA TGAACGTGAG 
GTCTGTTGTT TTGAAGGGGA CGCCGGCATT TCCACTGCGT TGCTTGAGCT GCCTTTCGAC 
CATATCTTTT TTACCGGCAG TACCGCAATT GGCAAACTGG TTATGCAGGC CGCCGCCAAA 
AACCTCAGCT CGGTTACCCT GGAGCTTGGC GGCAAATCGC CTGTTATTAT AGAGGAAACG 
GCCAACCTGA AAAAAGCAGC CGAAAAAATT GCCTGGGGCA AACTGATCAA TGCGGGCCAG 
ACCTGTATTG CCCCCGATTA TGTGCTGATC CCCCGCGATC TGCAACAGTC TTTTATCGAA 
TATTATAAAG AGGCCGTTAA CCGCTTGTTT TTTAAGAACG GAAAGCTCAA TACCGAAGTT 
TATGCAAAGC TGATCAGTAA AAAACACTTT GAAAGGCTGT CAGACTTAAT AACAGATGCC 
CTGGATAAAG GGGCCATCAC GGTGCTGGGT GGCGAAAAAG ATGAATCCAG CCAGACCATA 
TCCCCAACTG TACTGGCCCG GATCCCCGTA GGAACGACCA TCATGAAGGA AGAGATCTTT 
GGGCCTGTCC TGCCCCTTAT CGCTTACCAG ACCCTCAGCG AAGCGGTTGC TTATGTAAAC 
CATAAAAGCA AGCCGCTGGC TTTATATGTT TTTAGTGCCA ACCGCAAAAA CATTCAATAC 
ATCCTCAAAA ACACCTCTTC CGGAGGGGCC TGTATCAACG ATGTCCTCAT CCACATTTCC 
AATCCGAAAC TCCCTTTTGG TGGGGTAAAC GGGAGCGGAA CGGGCAGCTG CCACGGCTTT 
TTTGGCTTCA AGGCCTTTTC TCATGAAAGA GCAGTAGTCT ACCAGTCGCC CATCAATACC 
ACAGCGCTCA TTTACCCGCC TTATGAAAAC AAGTCCCGGC TGCTGAAATG GTTAAAAAAA 
CTGCTGTAA

Protein sequence

MMHSAFEAQQ KHKYTLRNSN AAQRIDKLKT LKACIESYEE KIYAALQSDL RKSRFESALT 
ELIFIYSEIG FAIHNLNSWM KPKRAGKTIS NLFAKNRICY EPKGCCLIIA PWNYPFQLLM 
SPLISAIAAG NCAILKPSEL SPATSSVIAA LIRDCFDERE VCCFEGDAGI STALLELPFD 
HIFFTGSTAI GKLVMQAAAK NLSSVTLELG GKSPVIIEET ANLKKAAEKI AWGKLINAGQ 
TCIAPDYVLI PRDLQQSFIE YYKEAVNRLF FKNGKLNTEV YAKLISKKHF ERLSDLITDA 
LDKGAITVLG GEKDESSQTI SPTVLARIPV GTTIMKEEIF GPVLPLIAYQ TLSEAVAYVN 
HKSKPLALYV FSANRKNIQY ILKNTSSGGA CINDVLIHIS NPKLPFGGVN GSGTGSCHGF 
FGFKAFSHER AVVYQSPINT TALIYPPYEN KSRLLKWLKK LL