Gene TM1040_2998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2998
Symbol
ID	4078028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	3166064
End bp	3167128
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	57%
IMG OID	638008327
Product	extracellular solute-binding protein
Protein accession	YP_614992
Protein GI	99082838
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.593817
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.519466
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTGC GCTCTATTTG GTTTTGTCTT GTCACAGTGT TGATGACCCT TCCAGCCTTG 
CCGCTGCGCG CGCAGGAACT GGTGGTCAAC ACGGTTACCC GTCCGCCGTT TTCAATGCCG 
GTCGGAGAGC ATGAGACGGG TTTTACCATG GATTTGATCC GCGAGGTCTC GCAACGCCTC 
GGTTGGGACA TCCAGATCAA TCGGGTCGAT AACTTTGCGC AGATGCTCGA AGAGGTCGAA 
CGCGGCGAGG CCGATATGGC GGCGGCAAAC ATCTCCATCA CGGCCGGGCG TGAAGCGGTA 
ATGGATTTCA GTCAGCCCAT CTTTGAAAGC GGCCTGCAGA TCATGCTGCA TCAGGACGAT 
GTGTCAGAGC CAAGCCTGAT TTCGGCGCTG ATGTCGTGGG ATCTCTTCGC GGCCATCGCA 
ATCGCATTTG TGCTCTTGCT GGTGGGCGGC ATGCTTATGT GGGTGTTTGA GCGCCGAGCG 
CAGCCCTATT TTGATCGCCC GTTGAAAGAT GCGTGGTTCC CATCTTTCTG GTGGGCTCTC 
AATCTGGTGG TGAACGGTGG TTTTGAAGAG CGGGTGCCGC GCAGCGCGCT TGGGCGGGTT 
TTTGGTGTTC TGCTGGTTCT CTCATCATTG TTCGTGGTGT CGGTCTTTGT CGCCAAAATC 
ACCGCCGCCA TGACCGTCGA GGCGATCAAC GGGTCGGTGA ATTCGGTGAA CGACCTCTAC 
GGCAAGCGCG TCGGCACGAT CCAGGGCTCC ACCGCGGCAG GATTTCTGGA TCGTCGTGAA 
ATCGACTATG TGGCGTTTCC GGGGCTCGAT AAGATGCTCG AGGACTTTGA AGACGGCGAT 
ACGCGCATAG TCGTGTTTGA TGCGCCGGTG CTCAACCACT ACGTCAAAAC CGACGGTGCG 
GGGATCGGGC ATGTGATGGG GCGGAAGTTC CTGACGGAAT ACTACGGGAT TATCTTCCCG 
CAGGGGTCCG ACATGGTGGA GCCGTTCAAT CGTGCCTTGC TGAAGATGCA GGAAGACGGC 
GCCTACGAGA CGCTCTATCG AAAGTGGTTT GGTCAGAGTT TCTAG

Protein sequence

MTLRSIWFCL VTVLMTLPAL PLRAQELVVN TVTRPPFSMP VGEHETGFTM DLIREVSQRL 
GWDIQINRVD NFAQMLEEVE RGEADMAAAN ISITAGREAV MDFSQPIFES GLQIMLHQDD 
VSEPSLISAL MSWDLFAAIA IAFVLLLVGG MLMWVFERRA QPYFDRPLKD AWFPSFWWAL 
NLVVNGGFEE RVPRSALGRV FGVLLVLSSL FVVSVFVAKI TAAMTVEAIN GSVNSVNDLY 
GKRVGTIQGS TAAGFLDRRE IDYVAFPGLD KMLEDFEDGD TRIVVFDAPV LNHYVKTDGA 
GIGHVMGRKF LTEYYGIIFP QGSDMVEPFN RALLKMQEDG AYETLYRKWF GQSF