Gene TM1040_0564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0564
Symbol
ID	4077915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	600959
End bp	602131
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	61%
IMG OID	638005861
Product	peptidase M19, renal dipeptidase
Protein accession	YP_612559
Protein GI	99080405
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0752699
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGCCT TTGCAAGATG GATCAAACGC CTCGTGGGTC TCGCCATATG TGCGATTATG 
GCGTTTTTTA TCTTCGCTCC GGCGGCTCTC GACCGCCAGC GCAACCCCGT TGCAGAGCAT 
GACTCTTATC CGATCAGCGA CGCAGCACGT GACCTGCACC AAAGCCTCAT CATCGGCGAT 
CTGCACGCAG ACCCGCTGCT GTGGAAACGT GACCTGACCA AGCGCAACGC GCGCGGCCAT 
GTGGACATCC CCCGGCTGAT CGAGGGCAAT GTCACCTTGC AGGTCTTCAC CGCTGTGACC 
AAATCCCCCG CCGGGCAGAA CTATGACCAT AATGATGCGG ATGCGCGGGA CAACATCACG 
CTGCTTGCGA TCGGTCAGCT TTGGCCCCTT CCCACCTGGA CGTCGCTCTA TGAACGCGCC 
CTGCATCAAG CCGAGAAGTT GCACCGGTTC CAGGAACGCT CCGAAGGGCG GCTGCGTATC 
ATTCGTACTG AGGCCGATCT CGACATTCTG CTGGAGCGCA AACGCGCAGG TCACGAAGTC 
GTCGGTGGGC TTTTGGGCAT CGAGGGCGCA CACCCGCTGG AGGGCGACAT CAGTAAACTG 
CAAGGCCTAG AGGAGGCCGG ATACCGCCTG ATCGCGCTGC AGCATTTCTT TGACAATGCG 
CTTGGGGGTT CGTTGCATGG CGCAGGCGAT CTGGGTCTCT CGGCGTTTGG GCGCGACGTG 
GTTTCGGAGT CGGTTGATCG CGGCTTGATC CTGGATCTTG CACATTCCAG CCCGCAGGTG 
GTGCGGGATG TCATTGCGAT GACCGATGTC CCGTTGGTTC TGTCGCACAC CGGCATCCAC 
AAGGCCTGCC CCGTAAAGCG AAACCTACCG GACGCCCTGA TGCGCGACAT CGCCGCTACG 
GGCGGGGTGA TCGGAATTGG CTACTGGGCA GATGCCGTGT GTGATGCCTC CCCCAGTGGG 
ATCGCCCGTG CCATTCACAG CGCCATCGAG GTGGTTGGAG AAAACCACGT TGCCCTTGGT 
TCAGACTTTG ACGGCTCTGT TGCGACGACT TTCGACAGCT CCGAACTTGC TGCGCTAACC 
CAGGCCATGC TCGATGAGGG GCTGAGCGAG ACCCAAATCC GCAAAGTCGC CGGGGAGAAC 
ATGTTGCGCG TCCTGCGCGC ACGCCTCGAC TGA

Protein sequence

MPAFARWIKR LVGLAICAIM AFFIFAPAAL DRQRNPVAEH DSYPISDAAR DLHQSLIIGD 
LHADPLLWKR DLTKRNARGH VDIPRLIEGN VTLQVFTAVT KSPAGQNYDH NDADARDNIT 
LLAIGQLWPL PTWTSLYERA LHQAEKLHRF QERSEGRLRI IRTEADLDIL LERKRAGHEV 
VGGLLGIEGA HPLEGDISKL QGLEEAGYRL IALQHFFDNA LGGSLHGAGD LGLSAFGRDV 
VSESVDRGLI LDLAHSSPQV VRDVIAMTDV PLVLSHTGIH KACPVKRNLP DALMRDIAAT 
GGVIGIGYWA DAVCDASPSG IARAIHSAIE VVGENHVALG SDFDGSVATT FDSSELAALT 
QAMLDEGLSE TQIRKVAGEN MLRVLRARLD