Gene TM1040_1831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1831
Symbol
ID	4076977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1927865
End bp	1928956
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	63%
IMG OID	638007146
Product	protein of unknown function DUF900, hydrolase-like
Protein accession	YP_613826
Protein GI	99081672
COG category	[S] Function unknown
COG ID	[COG4782] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.798525
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACAT TTCTGCCAGC CGTTGCCCGT TCGATATCTG TGATCCTCTG CCTTGGCGGT 
CCATTTGGCG TGATCCCCGC GCCACTGGCG GCCCAGTCTG AGGCTCAATC GGAGGCCCAA 
TCTGAAACCC AGTCGGAGAT TGAGGTTGCA GAGTTTCCCT ATGTCACGCT CCGGAACCGG 
ACCGGATCTG ATGATCCGGC GGAGTTCTAC GCAGGTGAGC GCAGTGATCC CAAAGCCGGC 
CGCTGTCGCG TCGAAGAACT CGACCTTGGC GTGCTTGCGC CCCTTGCCGG TGTCGCTCCG 
AATTTCCTGC GCGAGGAGCT GTTGCGCGTT CAGGCCATAG AGGAGGCCCC CACCGGCGCC 
ATTCTGGACC AGCTCGAAGC GACCGCCGGG GCACAGGGGC CTGCGCTCTA TGTCCATGGC 
TACTACATCA GTTTTGAAAA AGGCTGCCGC CGGGCTGCGC TGTTGCAGCA GAACGCGGAC 
CTTGAGGGGC GGCTTTTGTG GTTCAGCTGG CCCTCGGATG GGGCCGCCGC CTATTACACG 
CACGATGAGG TCGATCTCTA TTGGAGCCTG CCGGACCTCG CGGACACGAT TATCGAATTA 
CACGAGCGCT TTGGCCCCGG CGAGGTTGCG GTCATGGGGC ACAGCCTCGG GGCGCGCGGG 
GTCGTGCTGG CGCTGGCCGA GGTGGCCAAT CGGCGCCCCG ATATGCAGCT GGGTCAGGTC 
GTGCTGCTGG CGCCGGATAT GGACTTTGGG ATCTTTGAAC GCATCCTGCC ACGCATTCGC 
CCAATCGCAG AAAACCTGAC CATCTATGTC ACCAGCGGTG ACCGACCGCT TGCGCTTTCG 
GCGCAAGTGC ATGGCTACCC GCGGCTCGGG GAGGCGGGAA ACCCGGTGTC GCGTCTCACG 
GGCGTCGAGG TGATCGATCT GAGCGACTTG CCCAGCGAAG GCCCGACGGG GCACCTCTAT 
CATATCTACA GCCAGATCGT GGGCGCGGAT CTGAGCCGGC TTTTGCGCAG CGGCGAGGGG 
GCGTCCGAGC GTCCGGGCCT TGTGGCTCAG AGCAAAAACC TATGGCGCCT CAGGCCTGAA 
AAACGCGAGT AG

Protein sequence

MKTFLPAVAR SISVILCLGG PFGVIPAPLA AQSEAQSEAQ SETQSEIEVA EFPYVTLRNR 
TGSDDPAEFY AGERSDPKAG RCRVEELDLG VLAPLAGVAP NFLREELLRV QAIEEAPTGA 
ILDQLEATAG AQGPALYVHG YYISFEKGCR RAALLQQNAD LEGRLLWFSW PSDGAAAYYT 
HDEVDLYWSL PDLADTIIEL HERFGPGEVA VMGHSLGARG VVLALAEVAN RRPDMQLGQV 
VLLAPDMDFG IFERILPRIR PIAENLTIYV TSGDRPLALS AQVHGYPRLG EAGNPVSRLT 
GVEVIDLSDL PSEGPTGHLY HIYSQIVGAD LSRLLRSGEG ASERPGLVAQ SKNLWRLRPE 
KRE