Gene TM1040_1016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1016
Symbol
ID	4078236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1086832
End bp	1088175
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	60%
IMG OID	638006320
Product	peptidase M24
Protein accession	YP_613011
Protein GI	99080857
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.116429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAAC ATTTTCGCGA TCGTCGCAAG ATCGACCCCA GCCGAGGCGC TGTGCTTGGC 
GACGGCACCC CCAACGACAA TGACCGCATC GAGATCGGCC CCACGCAACT GGCGTTTGCG 
GAATGGACGG CGGCGGGGCT CAGCCTGCCC AACCTTGAGG CAATGCGGAG CTATCGCTGG 
CAGCGATTGA CGCAGGCGAT TGTCGACCGG GACTATGGCG GGCTGTTGAT GTTTGACCCG 
CTCAACATCC GCTATGCCAC CGACAGCACC AACATGCAGC TCTGGAACAC GCACAACCCG 
TTTCGCGCCC TGCTGTTGTG TGCGGACGGT TACATGGTGA TGTGGGACTA CAAGAATTCA 
CCGTTTCTTT CGACGTTCAA CCCCTTGGTA CGCGAACAGC GCTCGGGCGC GGATCTGTTT 
TATTTTGATC GTGGCGACAA GGTGGACGTT GCAGCGGATG CGCTCTCCAA TGAAATCCGG 
AACCTAATTG CAGAGCATGG CGGTGGCAAC AAGCGCCTCG CGGTGGACAA GATCATGCTC 
CACGGGCTGC GCGCGCTCGA AGCGCAAGGC TTTGAGATCA TGGAAGGCGA AGAGGTCACC 
GAAAAGGCGC GCGCCATCAA GGGTGTGGAC GAGATCCTCG CCATGCGCTG TGCCTCACAT 
GCCTGCGAGA CGGCTGTACG CGCAATGGAG GATTTCGCAC GGCTGAATGT GGGCGACGGC 
ACGACATCAG AGGATGATAT CTGGGCGGTG CTCCATGCCG AGAACATCCG TCGCGGCGGC 
GAGTGGATCG AGACGCGGCT CTTGGCCTCT GGACCGCGCA CCAACCCGTG GTTTCAGGAA 
TGCGGCCCCC GGATCACGCA GCGCAACGAG ATCATCTCGT TTGATACCGA CCTTGTGGGC 
AGCTACGGGA TCTGCGTCGA CATCTCGCGC AGCTGGTGGA TCGGGGATGA GAAACCGCGC 
CCGGACATGA TCTATGCGAT GCAGCACGCC CATGAGCACA TCATGACCAA TATGGAGATG 
CTCAAACCCG GCGTGATGAT CCCCGAGCTC AGCGCAGGCA CCCATGTGCT TGATGCCAAG 
TATCAGGCGC AGAAATACGG CTGCCTGATG CATGGGGTTG GGCTCTGTGA TGAGTGGCCC 
CTTGTGGCCT ATCCGGATCA CGCGGTGGAG GGCGCCTATG ACTACCCGCT GGAGCCGGGC 
ATGGTGCTCT GCGTCGAGGC GCTGGTGGGC GAAGTGGGAG GGGATTTTTC CATCAAGCTC 
GAAGATCAGG TGCTGATCAC CGAGGATGGA TATGAGAACC TGACCACCTA CCCCTTTGAC 
CCGGCGCTGA TGGGACAGGA GTGA

Protein sequence

MNEHFRDRRK IDPSRGAVLG DGTPNDNDRI EIGPTQLAFA EWTAAGLSLP NLEAMRSYRW 
QRLTQAIVDR DYGGLLMFDP LNIRYATDST NMQLWNTHNP FRALLLCADG YMVMWDYKNS 
PFLSTFNPLV REQRSGADLF YFDRGDKVDV AADALSNEIR NLIAEHGGGN KRLAVDKIML 
HGLRALEAQG FEIMEGEEVT EKARAIKGVD EILAMRCASH ACETAVRAME DFARLNVGDG 
TTSEDDIWAV LHAENIRRGG EWIETRLLAS GPRTNPWFQE CGPRITQRNE IISFDTDLVG 
SYGICVDISR SWWIGDEKPR PDMIYAMQHA HEHIMTNMEM LKPGVMIPEL SAGTHVLDAK 
YQAQKYGCLM HGVGLCDEWP LVAYPDHAVE GAYDYPLEPG MVLCVEALVG EVGGDFSIKL 
EDQVLITEDG YENLTTYPFD PALMGQE