Gene TM1040_1623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1623
Symbol
ID	4077725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1730142
End bp	1731089
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	64%
IMG OID	638006936
Product	serine peptidase
Protein accession	YP_613618
Protein GI	99081464
COG category	[O] Posttranslational modification, protein turnover, chaperones [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0616] Periplasmic serine proteases (ClpP class)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0324508
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAGG AATTGACGGC GCTGGTTGCG GCCATTCGGG CGCAGCCCTG GGCGATCATG 
CCGGATTATC TCGATGCGAT CGAAGCCATC GCGCTGCGCG CCCTTGATGA AGACGTGCTG 
AAGCGGATCG CGCAGGACGG CCACATTCCG CGCCTCGAAG GCAATTTGTC GGCCGTTGCG 
GCGGTAGGAA CGCGCCTCGA GGGAGCTGGG ATGAGCACTG TCCGCGACGG ATCCGCCGTG 
GTGCCGATGT TCGGGCCGAT TTTTCCACGG GCATCGATGA TTAACGCTTC TTCCGACGGA 
ACTTCCTTGA ACGCATTTAT GCGGGACATC CGCGTGGCGC AGGCGTCGAC CGATGTGCAT 
CGGATCGTCG TGGTGGTGGA TAGCCCGGGC GGCGTGGTCT CCGGGCTCGG CGAAGCGTCT 
GAAACGCTGC GTGCCACCAC AAAGCCGATC ACCGCCTTTG TCACCGGCAA CTGCGCCTCG 
GCGGCTTATT GGCTCTGCAG CCAATTTGGC GAGATCGTGA TGGATCGCTC TGCGGCGGTC 
GGCTCGATCG GGGTGGTCGC GTCGCTGTCC CGGCAGGAGG CGGCGGATAA CCAGGGGCGC 
CGGTCTTATG AGATCGTCAG CAGCAATGCC CCGAACAAAC GTCCGGATCC GTCCACGGAA 
GAGGGCCGGA CGGCCATCCA GAAAGACATC GACGCCATAG AGGAGGTGTT CATCGCAGAT 
GTGGCCGCCG GTCGCCGCGT CTCGGCCGAT CGCGTGCGAA GCGATTTTGG CCGCGGCGCA 
ATGCTCTCGG CCACGCGCGC CATCGAGGCG GGCATGGCTG ATCGCATTGG CACACTTGAG 
GGGGTGCTGA CTGAAGGTTC CGGGCGCACC CGGAAAACTG GAGCGGGTCG CAGTGCGCAC 
GCGGCCGCTG AAATCGAAAC GCGGCGGCGC GCCGCAATGA GGAACTGA

Protein sequence

MKQELTALVA AIRAQPWAIM PDYLDAIEAI ALRALDEDVL KRIAQDGHIP RLEGNLSAVA 
AVGTRLEGAG MSTVRDGSAV VPMFGPIFPR ASMINASSDG TSLNAFMRDI RVAQASTDVH 
RIVVVVDSPG GVVSGLGEAS ETLRATTKPI TAFVTGNCAS AAYWLCSQFG EIVMDRSAAV 
GSIGVVASLS RQEAADNQGR RSYEIVSSNA PNKRPDPSTE EGRTAIQKDI DAIEEVFIAD 
VAAGRRVSAD RVRSDFGRGA MLSATRAIEA GMADRIGTLE GVLTEGSGRT RKTGAGRSAH 
AAAEIETRRR AAMRN