Gene Phep_2364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2364
Symbol
ID	8253471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2760225
End bp	2761679
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	42%
IMG OID	644936014
Product	aminoacyl-histidine dipeptidase
Protein accession	YP_003092630
Protein GI	255532258
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01893] aminoacyl-histidine dipeptidase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.807685
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.043104
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTTG AAAATTTAGA ACCAAAGGCA CTATGGAACA ATTTTGTTGC TTTAAATGCC 
ATACCCCGTG CTTCAAAAAA AGAAACCCAG GTGATAAAAT TTATGCTTGC TTTTGGCAAA 
CAGCTCGGAC TGGAAACCAT TAAAGACCAT GTTGGAAATG TTGTGATCAA AAAGCCGGCA 
ACTGAGGGCA TGAAGGATAA ACAAACTGTC ATCCTGCAGT CGCACCTGGA TATGGTCCAT 
CAAAAAAATA GCGATACAGA TTTTGATTTC GATAGGGAAG GCATTAAGAT GTATGTTGAT 
GGAGATTGGG TAAAAGCCAG AGGCACCACC CTTGGGGCTG ATAATGGAAT TGGTGTAGCT 
ACAATTATGG CTATACTGGC GGCTTCCGAC CTGGTGCACC CTACCATTGA AGCCTTGTTT 
ACCATAGATG AAGAAACAGG TATGACCGGT GCAAAGGAAC TTGACCCGTC TAATTTATCT 
GGAAAAATAT TGTTAAACCT CGATACTGAA GAAGACACAG AATTAACCAT TGGTTGTGCT 
GGCGGCATAG ATACAACAAC TACATATCAT TATCATACCC ATCCTGTTGC CAAAAACAGC 
ACTGCGTTCC AGATATCAAT TAAAGGCCTG ATTGGCGGGC ATTCCGGAAT GGACATTCAT 
AAGGGACGTG CCAATGCCAA TAAGCTGATG AACCGTCTGC TATATAATGG AAATAAAGTT 
TTAGACCTGC AGCTGGCCAG CGTTGAAGGT GGAAGCCTGA GAAATGCGAT CCCACGTGAG 
TCTGTTGCGG TAGTTGCAGT TTCGGGAAAT CAGAAAAAGG CATTTCTTTC CTTTATAGCA 
GATTTTACGG AGGTCATTAA AGCCGAATAC CATGCAATAG AACCTTTTAT GAAAATTACT 
GCAGAAGAAA CAGTACTGCC TGCAGAGGTT TTGGAAAAGG AAGAATACAT GGAGATCATC 
AATACACTAT ATGCAGTGCC AAATGGCGTG TTCAGGATGA GCCCTGAAAT TCCGGGACTT 
GTTGAAGCGT CATCAAATCT GGCAAAAGTG ATCATTAAAG ACGGGGAATT TATTACCTTA 
TCGTTACAGC GGAGCAGTGT AGAAAGCACA AAGGAAGATG TTGCTATTGC AGTGGGGGCA 
GCTTTTGAGA ATATGGGTTG TAAAGTTAAC AGCAGTGGCG ATTATCCTGG GTGGAAGCCC 
AATGCTGCTT CAGAAATACT GTCGCTGATG CGGAGTTTGT ATAAGGTTAA TTTTAAGACT 
GAACCCAATG TAAATGCCTG TCATGCCGGT TTGGAATGTG GTATTTTAGG CGCCCATTTA 
TCAGAAATGG ACATGATTTC TTTTGGTCCC AATATCCATG GCGCACATTC GCCAGACGAA 
CGCGTTCAGA TTTCTTCGGT GAACAAGTTC TGGAACTATC TTTTGAAAGT ACTGGAAGAA 
ATACCTGCTC GTTAA

Protein sequence

MKVENLEPKA LWNNFVALNA IPRASKKETQ VIKFMLAFGK QLGLETIKDH VGNVVIKKPA 
TEGMKDKQTV ILQSHLDMVH QKNSDTDFDF DREGIKMYVD GDWVKARGTT LGADNGIGVA 
TIMAILAASD LVHPTIEALF TIDEETGMTG AKELDPSNLS GKILLNLDTE EDTELTIGCA 
GGIDTTTTYH YHTHPVAKNS TAFQISIKGL IGGHSGMDIH KGRANANKLM NRLLYNGNKV 
LDLQLASVEG GSLRNAIPRE SVAVVAVSGN QKKAFLSFIA DFTEVIKAEY HAIEPFMKIT 
AEETVLPAEV LEKEEYMEII NTLYAVPNGV FRMSPEIPGL VEASSNLAKV IIKDGEFITL 
SLQRSSVEST KEDVAIAVGA AFENMGCKVN SSGDYPGWKP NAASEILSLM RSLYKVNFKT 
EPNVNACHAG LECGILGAHL SEMDMISFGP NIHGAHSPDE RVQISSVNKF WNYLLKVLEE 
IPAR