Gene Phep_3080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3080
Symbol
ID	8254197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	3678912
End bp	3680153
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	42%
IMG OID	644936733
Product	ATP-dependent Clp protease, ATP-binding subunit ClpX
Protein accession	YP_003093339
Protein GI	255532967
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.01313
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAAAC AAAACAAAGA ATCCCGTTGC TCTTTTTGCG GCTCAGGTAA GCAGGATACA 
CTAATGCTTA TTGAAGGACT GGATGCATTT ATCTGCGATA AGTGTGTAAC CCAGGCCAAT 
CAGCTGCTGG TACAGGAGCT GGGGAGTAAA AAATCGAAAG CTTTAGATAC TTCGATCACG 
CTGTTAAAGC CCCTGGAAAT TAAAGCTCAT ATTGACCAGT ATGTAATTGG TCAGGATGAT 
GCTAAAAAGG TGCTTGCAGT GGCGGTATAT AACCACTATA AAAGGTTAAG TCAGAAAGTA 
GACAAGGGTG ATGAGGTTGA GATTGAAAAA TCCAATATCA TGTTGGTAGG TGAAACGGGT 
ACAGGTAAAA CCTTACTGGC TAAAACTATT GCCAAGATAT TACATGTACC TTTCTGTATA 
TGTGATGCAA CGGTACTTAC AGAGGCTGGG TATGTTGGTG AAGATGTGGA GAGCATTCTT 
ACCCGATTAT TACAGGCTGC TGATTATGAC GTGGCTTCGG CAGAACGTGG CATTGTATAT 
ATTGATGAGG TAGATAAGGT GGCACGTAAA AGTGATAATC CTTCTATTAC CCGGGATGTA 
TCTGGTGAAG GCGTACAGCA GGCTTTACTG AAGATATTAG AAGGTACGGT AGTAAACGTT 
CCACCACAGG GCGGACGTAA ACATCCTGAT CAGAAGATGA TCCCGGTAAA TACAAATAAC 
ATTCTGTTTA TATGCGGCGG GGCTTTTGAT GGCATAGAAC GTAAAATTGC CAACAGGCTG 
CGTACACAGG CAGTAGGTTA TAAGGTTAAA AAGGACGACG CTGAACTGGA TCTTAAAAAC 
CTTTATAAAT ATATTACGCC TCAGGATTTA AAATCGTTTG GTTTAATTCC GGAACTGATT 
GGACGTGTGC CGGTTTTGAC CCACCTGAAC CCATTGGATA AGCAGGCATT ACGCAACATC 
CTGACCGAGC CTAAAAACTC GCTGTTCCGT CAGTATGTAA AATTGTTTGA ACTGGAAAAT 
GTGAAACTTA CATTTGATAA CGAAGTTTTG GACTTTATAG TAGATAAAGC GATGGAATAT 
AAGCTTGGTG CAAGGGGCCT GCGCTCTATT TGTGAGGCCA TTATGCTGGA TGCGATGTTC 
GAGATCCCTT CTGATACCAG TGTCAAGGAG TTGAGCATTA CACTCGATTA TGCGGTTGAA 
AAGTTTGAGA AGGCCGACTT TAAAAAGTTA AAAGCTGCTT AG

Protein sequence

MAKQNKESRC SFCGSGKQDT LMLIEGLDAF ICDKCVTQAN QLLVQELGSK KSKALDTSIT 
LLKPLEIKAH IDQYVIGQDD AKKVLAVAVY NHYKRLSQKV DKGDEVEIEK SNIMLVGETG 
TGKTLLAKTI AKILHVPFCI CDATVLTEAG YVGEDVESIL TRLLQAADYD VASAERGIVY 
IDEVDKVARK SDNPSITRDV SGEGVQQALL KILEGTVVNV PPQGGRKHPD QKMIPVNTNN 
ILFICGGAFD GIERKIANRL RTQAVGYKVK KDDAELDLKN LYKYITPQDL KSFGLIPELI 
GRVPVLTHLN PLDKQALRNI LTEPKNSLFR QYVKLFELEN VKLTFDNEVL DFIVDKAMEY 
KLGARGLRSI CEAIMLDAMF EIPSDTSVKE LSITLDYAVE KFEKADFKKL KAA