Gene TM1040_0937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0937
Symbol
ID	4077565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	999907
End bp	1001070
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	60%
IMG OID	638006240
Product	peptidase M20D, amidohydrolase
Protein accession	YP_612932
Protein GI	99080778
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.47047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0807888
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGTCG TGAACCGCAT CGCTGATTTT GCCGAAGACA TGAAGACCTG GCGTCGCCAC 
CTGCACCAGA TCCCCGAACT GGGGTTGGAC ACAGTAAAAA CCGCTGCATA TGTGACTGAG 
ATCCTTGAGA CATTCGGCGT AGATGAGATC CACGGCGGTA TTGCGCAGAA CGGGATCGTG 
GCGATCATCA ACGGTCAGGG CGAAGGGCCA ACACTTGGGC TTCGCGCCGA TATGGACGCG 
CTGCCGATCA CCGAGGTGCG CGACCTCGAC TACAAATCCC AGACCCCCGG CAAAATGCAT 
GCCTGCGGCC ATGACGGGCA CACCACCATG TTGCTCGGGG CGGCGAAATA TCTGGCGGAA 
ACGCGTAATT TCAAAGGCCG CGTGGCGCTG TTGTTCCAGC CCGCCGAAGA GATCATCGGC 
GGCGCCAAGA TCATGGTCGA AGAGGGCGTG ATGGAGCGCT TTGACATCAA GGAGGTCTAC 
GCGCTGCACA ATGCGCCGGG CTTGCCGGTC GGGCATTTCA TGACAACGCC GGGCGCTTTG 
ATGGCGGCGG TGGATGAGTT TACCATCAAC ATCAAAGGGC TGGGTGGCCA TGGCGCAATG 
CCGCATGAAA CCCGTGATCC GGTGATGGCC GCCTGTGGCA TGGCGCAAGC GATCCAGACC 
ATCGTCAGCC GCAACCATCA GGCCACCGAA GATCTGGTGA TCTCCGTCAC CCAGATCCAC 
ACTGGTACCG TCGACAATGT GATCCCCGAG ACCGCCTATG TGAATGGCAC CATCCGCACC 
TTCAATCCCG AGGTGCAAAA GATGGTCATG GCGCGCTTTG ACGAGATCGT GAAAGGCTGC 
GCCGTGGCCT ATGGGGTGGA AGCGGAGCTG GATTACGAGG TCGGCTATCC CGCCACGATC 
AACGACGCGG AAAAGGCGGC TTTTGCCACC GATATCGCGC GCGACATCTC GGGCGAGGCC 
AATGTGCAGG GCGATGCGGG GCGCGAGATG GGGGCTGAGG ATTTCTCTTA TATGCTGGAG 
GCCCGTCCGG GCGCCTACCT GTTCCTCGGG CAGGGGGATA CGGCGGGGCT GCACCACCCT 
GAGTATGACT TCAACGACGA GATCTCGCCT ATTGGGGCAT CGTTCTTTGC CCGTCTGGTG 
GAGAAAGCAC AGCCAGCGGG TTGA

Protein sequence

MPVVNRIADF AEDMKTWRRH LHQIPELGLD TVKTAAYVTE ILETFGVDEI HGGIAQNGIV 
AIINGQGEGP TLGLRADMDA LPITEVRDLD YKSQTPGKMH ACGHDGHTTM LLGAAKYLAE 
TRNFKGRVAL LFQPAEEIIG GAKIMVEEGV MERFDIKEVY ALHNAPGLPV GHFMTTPGAL 
MAAVDEFTIN IKGLGGHGAM PHETRDPVMA ACGMAQAIQT IVSRNHQATE DLVISVTQIH 
TGTVDNVIPE TAYVNGTIRT FNPEVQKMVM ARFDEIVKGC AVAYGVEAEL DYEVGYPATI 
NDAEKAAFAT DIARDISGEA NVQGDAGREM GAEDFSYMLE ARPGAYLFLG QGDTAGLHHP 
EYDFNDEISP IGASFFARLV EKAQPAG