Gene TM1040_0864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0864
Symbol
ID	4076234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	917929
End bp	919350
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	64%
IMG OID	638006166
Product	peptidase M48, Ste24p
Protein accession	YP_612859
Protein GI	99080705
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0891552
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTTG AGCGCGTATT CTCTCTGGCG TCAATCCCGT GCGCACGTCT GTTTCGTCTT 
CTGGCCGCAG CGGTGGGCAG AGGGTGCGGC CGTGGGCCGG TGCTGGCAGC ATGTCTTGCC 
GCCGTGCTGG CCTTTGCGCC GATCGCGGCG CAGGCGCAAT CCATTCGCCT TCTGCGCGAC 
GCCGATATCG AACACGGGCT GACGGAGCTT GCGCGCCCCA TTCTAACCGC CGCCGGTCTG 
AGCCCGCGAC GGGTGCGCAT CCTTGTGGTG AATGACAGCA GTTTCAATGC CTTCGTGATC 
GACCACCGGG CGATCTTTAT CAACTACGGT CTGATCCTGA AGGCCGAGAG CCCAGAGATG 
CTGCAGGCGC TGATCGCCCA TGAAGCGGCC CATATCGCCA ATGGCCACAT CGGGCGGCGG 
GTGCAGAACA TGCGCTCTGC GAGCACGGCC GCAGGCCTTG GGGTTGCGCT CGGGCTGCTG 
GCATCGGCCG CAGGGGGCGG CAAGGCAGGC GCGGGCGTGG CCTTTGGGGT GCAATCCTCG 
GCGCTGCGCA ATTTCCTGTC GCACACCCGC GCCGAAGAAG CCTCTGCCGA CCGCTCCGCC 
ATCGGGTTCA TGACAGCCGC CGGGGTCAAT CCCAAGGGCA TGGTGGAACT GCACAGGATT 
TTTGCTGGCC AAGAGGTCCT GAGCACAGGT TCGCAAGATC CTTATATGCG CTCGCACCCG 
CTGACACGCG ACCGGATGCG CGCCGCAGAA GCCTATGTGG CCAGCGCGGG CGCCGCGGCG 
GCCTCCGACC CTGCCGCCGC CTATTGGCTG GCGCGGGTGC AGGGCAAGCT TTCTGCCTTT 
ACGCGCGCGC CAAGCTGGAC CAAGCGACGG GTCGCCTCCG AAGGGTATGC GGATGTCAAA 
CGCATGCGTC TTGCGGTGGC GCATCACCGG CAAAACAGTT TCTCCCGCGC GCAAAAGGAA 
ATGCAGGCGC TTTTGGCCAC ACGCCCGAAG GACGCCTATT ACCACGAGCT CTGGGGTCAG 
ATCCTCTATG AAAACCGCCG CTGGGGCGCT GCAGTCTCGG CCTTTGGCAC AGCCGCCAGC 
CTCTCCCCAA ACGAGCCTTT GATCCTCGCA AGCCTCGGGC GCGCGCAGCT GGCAGCGGGC 
AATCCCCGCG CCGCCCTCAA GACGATGGAA AAGGCCCGAG GCCTTGATTT TCGCAATGCA 
ACCCTCTTGC GCGATATGTC GCTGGCCTAT GCGCAAACCA ATCAGACCGG CATGGCTGCG 
CTTGTGACCG CCGAGCGCTA TGCGCTTCAG GGGCGTCTCA AGGATGCAGG ACCACATGCC 
AAACGCGCAA CCGGCCTTCT GGCCAAAGGG TCCCCGGCCT GGCGCCGGGC CCAGGATGTT 
CTAATTGCCT TTGAACAAGA CGAGAAAAGG AACCAAAAAT GA

Protein sequence

MSFERVFSLA SIPCARLFRL LAAAVGRGCG RGPVLAACLA AVLAFAPIAA QAQSIRLLRD 
ADIEHGLTEL ARPILTAAGL SPRRVRILVV NDSSFNAFVI DHRAIFINYG LILKAESPEM 
LQALIAHEAA HIANGHIGRR VQNMRSASTA AGLGVALGLL ASAAGGGKAG AGVAFGVQSS 
ALRNFLSHTR AEEASADRSA IGFMTAAGVN PKGMVELHRI FAGQEVLSTG SQDPYMRSHP 
LTRDRMRAAE AYVASAGAAA ASDPAAAYWL ARVQGKLSAF TRAPSWTKRR VASEGYADVK 
RMRLAVAHHR QNSFSRAQKE MQALLATRPK DAYYHELWGQ ILYENRRWGA AVSAFGTAAS 
LSPNEPLILA SLGRAQLAAG NPRAALKTME KARGLDFRNA TLLRDMSLAY AQTNQTGMAA 
LVTAERYALQ GRLKDAGPHA KRATGLLAKG SPAWRRAQDV LIAFEQDEKR NQK