Gene TM1040_0094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0094
Symbol
ID	4078760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	97110
End bp	98543
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	62%
IMG OID	638005381
Product	peptidase M16-like
Protein accession	YP_612089
Protein GI	99079935
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACTG AGGCAGCAAT CCTGTCGGGG CTTCGGGCCA GCTGGCGGTC TGCGCTTTGT 
GCCGTCGTGA TGGCGACAGG ACTTGGCGCG CCGGGTCTTA TGGCGCAGGA GACGTCCGTG 
GATGGGGCAG GGGCCGCGCA AACCTCGCAA AGCGGCGCCG AGATGGTCAC AACCTTCACA 
CTTGAAAATG GCATGATGGT GGTCGTGGTC GAAGACCATC GCGCCCCTGT GGTGCAGCAT 
ATGGTCTGGT ACCGTGCCGG TTCTGCAGAT GAGCCAGTCG GTCAGAGCGG TGTTGCGCAT 
TTTCTCGAAC ATCTGTTGTT CAAAGGGACC GACACGCTGG AGGCGGGCGA GCTTTCGGCG 
ACGGTCGCGC GCAATGGCGG GCGCGACAAT GCGTTCACCA GCTATGACTA CACCGCGTAT 
TTTCAGCGCG TGGCTGCCGA CCGGCTTGAG CTGATGATGC AGATGGAAGC GGACCGGATG 
CGCAATCTGC GCCTCACCGA GACCGACATC GTGACCGAGC GCGAGGTGAT CCTAGAGGAG 
CGCAATCAGC GCACCGACAA TGATCCAACG GCCCTGTTTC GAGAGCAGAT GCGCGCGGTG 
CAATATCTCA ACCATCGCTA TGGCCAGCCG GTGATTGGCT GGCGGCATGA GATGGAGACC 
CTGTCGATGG AGGACGCGCT GTCCTACTAC GGCACATATT ATGCGCCAAA CAATGCCATC 
CTTGTGGTGT CGGGCGATGT GCAACCCGAG GCGGTCCGCA AGCTGGCCGA GACCTATTAC 
GGCGTGATCC CGGCCAACCC AGATCTGCCC GAGCGGCTGC GCAGCGAGGA GCCCCCCCAA 
ACCGCGGCGC GTCGGCTGAC CTTTGCCGAC CCCCGGGTGT CTCAGCCTTA TGTGCAGCGG 
TCTTATCTGG CGCCCGAACG TGACAGTGGC AGTCAGGAAA AAGCGGCGGC GCTTTATCTG 
CTCTCGCAGC TTCTGGGCGG GGGCAGCACG TCTTATCTCG CCAATGCGCT CCAGTTCGAG 
CAGCAGGTGG CGGTTTATAC GGCAGCCTTC TATTCTGGGG TGTCGCTGGA TGACACCACG 
TTTGATTTTG TGATTGTGCC TGCCGATGGC GTCACGCTGG ACGAGGCCGA GGCCGCGCTG 
GATCGCAGCG TTGCGCAGTT TCTTGAGGCT GGCGTTGATA CCGCACAGCT CGACCGGATC 
AAGCTGCAGC TGCGCGCCTC GGAGATTTAT GCCCGCGATG ACGTCGATCG GATTGCCAAC 
CGCTATGGTC GCGCGTTGAC CTCCGGGCTG ACGGTTGAGG ACGTGCAGGA CTGGCCACGG 
GTGCTGCAAT CCATCACTGA AGACGAGATC ATCGCCGTCG CGCGCGAGGT CTTGCGCCCG 
CAAGCCTCGG TCACCGGATA CCTGATCCAA AGCCCGCAGG AGGTCGCCCA ATGA

Protein sequence

MTTEAAILSG LRASWRSALC AVVMATGLGA PGLMAQETSV DGAGAAQTSQ SGAEMVTTFT 
LENGMMVVVV EDHRAPVVQH MVWYRAGSAD EPVGQSGVAH FLEHLLFKGT DTLEAGELSA 
TVARNGGRDN AFTSYDYTAY FQRVAADRLE LMMQMEADRM RNLRLTETDI VTEREVILEE 
RNQRTDNDPT ALFREQMRAV QYLNHRYGQP VIGWRHEMET LSMEDALSYY GTYYAPNNAI 
LVVSGDVQPE AVRKLAETYY GVIPANPDLP ERLRSEEPPQ TAARRLTFAD PRVSQPYVQR 
SYLAPERDSG SQEKAAALYL LSQLLGGGST SYLANALQFE QQVAVYTAAF YSGVSLDDTT 
FDFVIVPADG VTLDEAEAAL DRSVAQFLEA GVDTAQLDRI KLQLRASEIY ARDDVDRIAN 
RYGRALTSGL TVEDVQDWPR VLQSITEDEI IAVAREVLRP QASVTGYLIQ SPQEVAQ