Gene TM1040_1334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1334
Symbol
ID	4075905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1421393
End bp	1422862
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	59%
IMG OID	638006644
Product	carboxypeptidase
Protein accession	YP_613329
Protein GI	99081175
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2317] Zn-dependent carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTCTT TTGAAGAACT GATTGCTTTT GAACGCCAAA CGCAGGCTCT GGGTCAAATC 
GCAGGTCGGT TGGGCTGGGA TCAGGAGACC ATGATGCCTC GCGGCGCGGC CCCCCAGCGC 
GGTGAGGAGA TGGCGGCAAT CGAAGCCGTG CTGCACGCGC GTCGCTCTGA TCCTCGGGTC 
GCAGAGTGGC TCGACACTGC GCAGGCCCCG GATGAGACCG GCGCGGCACA ATTGCGCGAA 
ATTCGCCGCG CCTACGAGCG GGCGGTCAAG GTCCCCGGTG ATCTGGCCAG TCAGATCGCG 
CGAGTCACAT CCGAGGCACA AGGCAAGTGG GCGCAGGCCC GCGCCGATGA AGATGTCGCG 
GCATTCCTGC CGGTCCTCAG CGAAGTAGTC GCACTGAAGC GGCAGGAAGG TCAGGCATTG 
GCGGCGGGTG GAAACCTCTA CGACGCAATG GTTGCAGATT ACGAGCAGGG CACAACCTCT 
TCGGAAATTG CGGAAATTTT TGATGCGATG CGTCCGGGCC TGGTCGATCT ACGTGCGCGC 
GTGCTGGAAA AACCGACCCC GGCGGGGCTG TCTGGCACCT TTGACGAGAA CACCCAGATG 
AAGCTCGCGC GCAAGGTCGC CAAGACCTTT GGCTATGATA TGAGCCACGG TCGCGTCGAC 
AAAGCGGTCC ATCCTTTCAG TTCGGGTAGC GGTCTGGATG TGCGCATTAC AACGCGAACC 
AACCCGCTAG ATCCGTTCAA CTGCATCTAC TCAACCATTC ACGAAGTCGG CCACGGCGCC 
TATGAGCAGA ATATAGACCG GGTTCATCTG CTGACTTCGC TTGGCCGCGG CGTCTCCATG 
GGGGTGCATG AAAGCCAGAG CCGGATCTAT GAAAATCAGA TCGGTCGCAG CCGCGCCTTC 
ACCGGATGGC TCTTCAAGGA AATGACCGAA GCCTTTGGGG ATGTTGGCGT TTCTTCTCCG 
GAGGAGTTCT ACAAAGCGGT AAACCGCGTG GAGAATGGCT ACATCCGGAC AGAGGCGGAT 
GAGCTGCAGT ACAACCTGCA CATCATGCTC CGATTCGACC TGGAACGCGC CTTGATGCTG 
GGCGATCTGG AGGTTCAGGA CCTCGAGAGC GCCTGGAATG ATCGCTTCCT TGCCGATTTT 
GGCTATGCGG TGGACAAGCC CTCAAACGGA TGCCTCCAGG ACGTTCACTG GTCCGTTGGG 
CTCTTTGGGT ATTTCCCGAC TTACTCGCTT GGCAACGTCT ACGCTGGCTG CCTACATGAG 
GCGCTGCGCC GCGACATCGC GGATCTGGAT GCACAACTGT CTGAAGGAAA CACCTCTGGT 
GCGACCGAAT GGTTGCGGGA AAACCTGCAG CAATTCGGCG GGCTGCGAGA GCCGCAAGAG 
ACCATTGCCC ATGCTGCAGG CTCTGCGCCG ACCCACGCCC CATTGATGCA CTACCTCGAA 
GCAAAATTCT CAGAGATCTA TGATCTTTGA

Protein sequence

MSSFEELIAF ERQTQALGQI AGRLGWDQET MMPRGAAPQR GEEMAAIEAV LHARRSDPRV 
AEWLDTAQAP DETGAAQLRE IRRAYERAVK VPGDLASQIA RVTSEAQGKW AQARADEDVA 
AFLPVLSEVV ALKRQEGQAL AAGGNLYDAM VADYEQGTTS SEIAEIFDAM RPGLVDLRAR 
VLEKPTPAGL SGTFDENTQM KLARKVAKTF GYDMSHGRVD KAVHPFSSGS GLDVRITTRT 
NPLDPFNCIY STIHEVGHGA YEQNIDRVHL LTSLGRGVSM GVHESQSRIY ENQIGRSRAF 
TGWLFKEMTE AFGDVGVSSP EEFYKAVNRV ENGYIRTEAD ELQYNLHIML RFDLERALML 
GDLEVQDLES AWNDRFLADF GYAVDKPSNG CLQDVHWSVG LFGYFPTYSL GNVYAGCLHE 
ALRRDIADLD AQLSEGNTSG ATEWLRENLQ QFGGLREPQE TIAHAAGSAP THAPLMHYLE 
AKFSEIYDL