Gene TM1040_0835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0835
Symbol
ID	4077541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	879761
End bp	880786
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	56%
IMG OID	638006133
Product	extracellular solute-binding protein
Protein accession	YP_612830
Protein GI	99080676
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.632681
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.843315
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACATC TGATTGCAGC CACAACGCTT GCGACCGTCT CCGCGACGGC GGCCATGGCG 
GAGGGGCAGT TGAATATCTA CAACTGGGGC AACTACACCA GCCCGGAATT GATCGAGAAG 
TTCGAACAGG AGTTCGACAT CGACGTCACC ATCACCGACT ATGACAGCAA CGACACCGCA 
CTGGCCAAGA TCAAGGCAGG TGGGCATGGC TTTGACATCG TGGTGCCGTC TGGCACCTAT 
GTGCCGATCT TCATCGGCGA AGGCCTGTTG ATGAAGTCGA TGCCCAACCA GATGGAGAAC 
TTCAAGAACA TGGACCCGCG CTGGGTCGAT GTGGATTTTG ATCCTGGCCG CGACTACACC 
GTGCCTTGGC AATGGGGCAC CGTGGGCGTC ACCGTCAATA CTTCGGTTTA TTCAGGCGAC 
ATCAACTCGG CGGCACTGAT CTTTGATCCG CCAGAAGAGC TGAAGGGCAA GATCAACGTC 
GTTCCAGAGA TGCTCGACGT GATGGGCATG GCCATTCACT ACATGGGCGG AGAGCAATGC 
ACCGCCGACA AGGACATGCT GGCCAAAGTG CGCGATAAAC TGGTCGAGGC CAAAAAGGAC 
TGGCTCTCCA TGGCCTATGG CAACATCGAG AAGTTCGCCA AGGGCGACCT CGCGGCTGGG 
GTCAATTGGA ACGGCGCCTC ATTCCGGGCA CGTCTGCAAA ACGATGACAT CGCCTTTGGC 
TATCCACAGA CCGGGTTTTC GATCTGGATG GACAACGCCG CGATCCTCGC GGATGCGCAG 
AATGTCGACA ATGCCAAACT GTTCCTGAAC TATATCATGG CTCCGGAGAA CGCAGCGCTT 
CTGTCCAATT TTGCCCGCTA CGCCAATGGC ATCAAAGGAT CTGAACCCTT TATGGATGCG 
GCCATGGCAG AGGCCTCCGA GGTGGTTATT CCCGACGAGC TCAAAGATGC CGGCTATCTC 
GCCAAGACCT GCCCACCCGA CGTGCAGCGG ATCTATTCCA AGATCTGGAC CGAAGTGACC 
AAATAA

Protein sequence

MRHLIAATTL ATVSATAAMA EGQLNIYNWG NYTSPELIEK FEQEFDIDVT ITDYDSNDTA 
LAKIKAGGHG FDIVVPSGTY VPIFIGEGLL MKSMPNQMEN FKNMDPRWVD VDFDPGRDYT 
VPWQWGTVGV TVNTSVYSGD INSAALIFDP PEELKGKINV VPEMLDVMGM AIHYMGGEQC 
TADKDMLAKV RDKLVEAKKD WLSMAYGNIE KFAKGDLAAG VNWNGASFRA RLQNDDIAFG 
YPQTGFSIWM DNAAILADAQ NVDNAKLFLN YIMAPENAAL LSNFARYANG IKGSEPFMDA 
AMAEASEVVI PDELKDAGYL AKTCPPDVQR IYSKIWTEVT K