Gene Phep_4272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_4272
Symbol
ID	8255408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	5149902
End bp	5151146
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	52%
IMG OID	644937938
Product	imidazolonepropionase
Protein accession	YP_003094525
Protein GI	255534153
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID	[TIGR01224] imidazolonepropionase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCCC TGCTGCTCAT CAATATTGGC TGCCTTGTTG GCCTCCACCC CGGCAACACA 
AGGCAGTTAA AGGGCGCACA GCTGGGCGAA CTCCCGCTGA TGGAAAACGC CTGGTTGTTG 
TGCGAAGACG GAAAGATCTC GGATTTTGGA AAGATGGGCA GCCTGCCTGC ACAATTGCCA 
AATGCCCTGC ATACACACGA TGCTAAAAAG GGCTATGTCT TTCCTTCCTG GTGCGATTCA 
CATTCCCATA TAGTTTTTGC GGCCTCCCGG GAAGAGGAAT TCGAGATGAA AATAGCCGGA 
AAAAGCTATG AAGAGATCGC TGCTGCAGGA GGTGGCATCT TAAATTCTGC ACGTAAGCTG 
CAGCACGCTT CAGCAGATGC GCTTTATGAT GCTGCAGCGC TGCGGATGAA CGACATGATC 
AGGCAGGGTA CAGGCGCTGT AGAGATCAAG AGCGGCTATG GATTGACCAC AGCCAGCGAA 
CTCAAAATGC TGAGGGTGAT CCGCAGATTA AAAGAATCTT TCCCCATTCC GGTTAAAGCT 
TCCTTTTTAG CAGCACATGC CTATCCCCCG GAATATAAGA ACGACCATGC CGCTTACATT 
AAGCTGATTA CCGATGAAAT GCTGCCCAGG ATTGCGGATG AAGGCCTGGC CGACTATATG 
GACGTTTTTT GCGAGCAGGG CTTCTTTTCT GTGGCTGAAA CGGATGAGCT GCTTGCTGCA 
GCAGCGGGTT ACGGACTAAA ACCTAAAATC CATGCCAACC AGTTATCGGT ATCGGGCGCG 
GTACAGTTGG GGGTAAAGCA CCAGGCCGTG TCGGTAGACC ACCTGGAAGT TACAGATGAG 
GCCGTCATCA GCAGTTTGCA AAACAGCCAT ACCATCGCTA CCTTATTGCC TTCCTGTTCT 
TTTTACATCA ATATCCCCTA TGCCAACGCC AGGGGGCTGA TCAATGCCGA TATCCCTGTA 
GCCATAGCCA GCGATTACAA CCCGGGCTCT ACCCCTTCCG GCAACATGAA CCTGGTCGTG 
TCCCTGGCCT GCATCAAACT GCGGATGCAG CCCCGGGAAG CCATCAATGC GGCTACCCTG 
AACGGGGCTG CGGCTATGGA GCTGAGCGGG GAAACCGGTA GCATTACCAA AGGTAAAAAA 
GCCAACCTGT TCATCACCAG GCCCATGCCT TCCCTTGCCT TTCTGCCCTA TAGCTTCGGA 
CAGTCGCAAA TAGAAAGCAT TATCCTTAAC GGAAAGATCT GCTGA

Protein sequence

MAALLLINIG CLVGLHPGNT RQLKGAQLGE LPLMENAWLL CEDGKISDFG KMGSLPAQLP 
NALHTHDAKK GYVFPSWCDS HSHIVFAASR EEEFEMKIAG KSYEEIAAAG GGILNSARKL 
QHASADALYD AAALRMNDMI RQGTGAVEIK SGYGLTTASE LKMLRVIRRL KESFPIPVKA 
SFLAAHAYPP EYKNDHAAYI KLITDEMLPR IADEGLADYM DVFCEQGFFS VAETDELLAA 
AAGYGLKPKI HANQLSVSGA VQLGVKHQAV SVDHLEVTDE AVISSLQNSH TIATLLPSCS 
FYINIPYANA RGLINADIPV AIASDYNPGS TPSGNMNLVV SLACIKLRMQ PREAINAATL 
NGAAAMELSG ETGSITKGKK ANLFITRPMP SLAFLPYSFG QSQIESIILN GKIC