Gene TM1040_0719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0719
Symbol
ID	4076996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	776435
End bp	777598
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	60%
IMG OID	638006016
Product	peptidase M20D, amidohydrolase
Protein accession	YP_612714
Protein GI	99080560
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.093275
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGTCA AGAACCGCTT TGCTGAGTTG CTGCCCGAAA TTACTGCGTG GCGACGTGAC 
CTGCACGAAA ACCCCGAAAT CCTGTTCGAA ACCCATCGCA CCAGCGCGCT GGTGGAGGAG 
AAACTCAAGG CGTTCGGCTG CGACGAAGTG GTCACGGGCA TTGGCCGCAC CGGCGTTGTG 
GGCGTCATCA AGGGTAAATC CTCCGCATCA GGCAAGGTCA TCGGTCTGCG GGCCGATATG 
GACGCGCTGC CGATCCATGA AGAAACCGGG CTGGAGTATG CCTCCAAGAC CGCAAACGCC 
ATGCACGCCT GTGGTCATGA CGGTCATACC GCCATGCTTT TGGGCGCGGC GAAATATCTC 
TCCGAGACGC GGAACTTCGA CGGCACCGTT GTGGTGATCT TTCAGCCTGC CGAAGAAGGC 
GGCGGCGGCG GCAAGGAAAT GTGCGATGAT GGCATGATGG AGCGCTGGGG CATCCAGGAA 
GTCTATGGCA TGCACAATTG GCCGGGTCGC CCGGTTGGAA GCTTTGCAAT CCGTTCGGGT 
GCCTTCTTTG CGGCGACCGA TCAGTTCGAC ATCACCTTTA CCGGCAAAGG CGGCCATGCC 
GCTAAGCCGC AGGAAACCAT CGATTCGACC GTGATGGCAT CGCAGGCGGT GCTTGCCCTG 
CAAACCATCG CTGCCCGCAA CGCCGATCCC GTGCATCAGA TCGTGGTCTC TGTGACCTCT 
TTTGAGACCT CCTCCAAGGC GTTCAACGTG ATTCCTGAGC GCGTTCAGAT CAAAGGCACC 
GTGCGCACCA TGGCGCCCGA GATGCGGGAT CTTGCTGAAA AACGTATCAA GGAAATCTGC 
GCGGGCATCG CAGCGACCTT TGGCGGTGAA GCCGATGTGA CTTACCACCG TGGCTATCCG 
GTGATGGTGA ACCATGACGA GCAGACCGAG TTTGCCGCCA AAGTGGCGCG TGACATTTCC 
GGGCAGTGCG ATGAGGCGCC GCTGGTGATG GGGGGCGAAG ACTTTGCCTT CATGCTCGAA 
GAGCGTCCCG GTGCCTATAT TCTCGTCGGC AATGGGGACA CCGCCGCCGT GCATCACCCC 
AAGTATAACT TCACCGATGA TGCGATTCCC GCAGGCTGCA GCTGGTGGGC GGAGATCGTC 
GAGCAGCGCA TGCCCGCAGC CTGA

Protein sequence

MPVKNRFAEL LPEITAWRRD LHENPEILFE THRTSALVEE KLKAFGCDEV VTGIGRTGVV 
GVIKGKSSAS GKVIGLRADM DALPIHEETG LEYASKTANA MHACGHDGHT AMLLGAAKYL 
SETRNFDGTV VVIFQPAEEG GGGGKEMCDD GMMERWGIQE VYGMHNWPGR PVGSFAIRSG 
AFFAATDQFD ITFTGKGGHA AKPQETIDST VMASQAVLAL QTIAARNADP VHQIVVSVTS 
FETSSKAFNV IPERVQIKGT VRTMAPEMRD LAEKRIKEIC AGIAATFGGE ADVTYHRGYP 
VMVNHDEQTE FAAKVARDIS GQCDEAPLVM GGEDFAFMLE ERPGAYILVG NGDTAAVHHP 
KYNFTDDAIP AGCSWWAEIV EQRMPAA