Gene Acid345_0572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0572
Symbol
ID	4073061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	699667
End bp	700836
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	59%
IMG OID	637982577
Product	Ste24 endopeptidase
Protein accession	YP_589651
Protein GI	94967603
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0501] Zn-dependent protease with chaperone function
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.209932
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACTG TTTCGACCCT AAAGCCCGAC AGCCTCGAGG CACGCCGCTA TAACCGTCTC 
AAACGATGGC TGGAGGTGTC AGACCTGATC GTCGGTTTCG TGCTGCTGCT GGCCCTGGTC 
CTCACCCACG GCAGCGCGCG GCTGCGCGAC CTCGCGTATC TCGCGTCGCG ACAGTATTAC 
TCCATCGCCG TATTCATGTT CGTGCTTTTC CTGCTGCTCA TCAGCAAGGT GCTCTCGCTG 
CCGATCGATT ATTACGGCTT CCGCCTGGAG CACGAGTTCA AGCTCTCGAA TCAGAAACCT 
GGCGCGTGGC TTTGGGATGA GTTGAAGGGC TGGCTCGTCG GGCTGGTTAT CCTTACGATT 
CTCGTCGAGG TACTTTACGC GACGATCCGT CTCTACCCGG ATTATTGGTG GCTGGTTGTG 
TGGGCAGTAT TCATCGGGTT CACCGTCCTG CTGGCGCAGC TTGCGCCGGT GGTGTTATTC 
CCGATCTTCT ACCGTTTTGA GCCGCTGAAA AACGATGCCC TCCGCGAGCG ACTGGTGAAG 
CTCGGAGAGA AGGCGGGAAC CAAGGTCCGC GGCGTGTACG AGTGGAAGAT CTCGGAGAAA 
TCGAAGAAGG CAAATGCGGC GCTGACGGGC CTGGGGAAAA CGCGGCGAAT CATTATCGCC 
GATACTCTGC TCGAAAATTA CAGCGACGAC GAGATCGAGG CGGTGCTGGC GCATGAGCTG 
GGACATCATG TGCACGGGCA CATCGCGAAG GGAATCCTGG TGCAGGTGGG GATTACGTTC 
GTGGGCTTCT GGGCGTCGCA CATCATCCTG CGGTATGTCG TGGACCAGCG TCAGATGTTT 
CAGTCAATGT CGGACTTTGC GAACTTGCCC CTATTGGCGC TGATTGCCGC GGTGCTGGGT 
TTGGTGCTGA CACCGGTGCT GAACGCGTAC TCGCGCTACA ACGAGCGGCA GGCCGACTCG 
TATGCGTGGA AGTCGATACC CTCGGTTGAG CCATTCGTGA CGTCGATGCA CAAACTAGCG 
AGCCAGAATT TGGCAGAAGA GAACCCGGCG CGATGGATCG AAGTGCTGTT CCACTCGCAT 
CCTACGATTG CGAAGCGAGT GGAAGCGGCG GAGAAGTGGC GGGAGCGGCA GGCCGTCCCG 
CCAAGCGAGA CACCCGCGAC ATCGGTTTAA

Protein sequence

MNTVSTLKPD SLEARRYNRL KRWLEVSDLI VGFVLLLALV LTHGSARLRD LAYLASRQYY 
SIAVFMFVLF LLLISKVLSL PIDYYGFRLE HEFKLSNQKP GAWLWDELKG WLVGLVILTI 
LVEVLYATIR LYPDYWWLVV WAVFIGFTVL LAQLAPVVLF PIFYRFEPLK NDALRERLVK 
LGEKAGTKVR GVYEWKISEK SKKANAALTG LGKTRRIIIA DTLLENYSDD EIEAVLAHEL 
GHHVHGHIAK GILVQVGITF VGFWASHIIL RYVVDQRQMF QSMSDFANLP LLALIAAVLG 
LVLTPVLNAY SRYNERQADS YAWKSIPSVE PFVTSMHKLA SQNLAEENPA RWIEVLFHSH 
PTIAKRVEAA EKWRERQAVP PSETPATSV