Gene TM1040_3266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3266
Symbol
ID	4075408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	267890
End bp	268942
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	62%
IMG OID	638004775
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_611502
Protein GI	99078244
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.700035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.539349
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACACT ATCTCAGCAC CGTGGCGCTT GGCGCCGCCC TGGCCCTGGC CACGTCATCG 
GCCTTTGCCC AGACGGTTGG CCCCAAGGGC GAGGCCGCGA CACCAACGGC ATCGATCATG 
GTCGAAGACG GAGACCTCGA GACGATCCGC AGCGGCAATC ACACCGCCGC GCTCCTTTGG 
CATGACCAAA GCGATTTTGT AAATGCTGTG ACGGCAGGCG CGACCGATGA GCTGGCGCGC 
GCCGGGATCG AAGTCGTCGC CACCGCAAGC GCCGGGTTCG ACGCCGCCAA ACAGCGAAGC 
GATATCGAAA CCGCCCTGAG CAAAGACCCG AGCATCATCC TGTCACTCCC CCTCGATCCG 
GTAACCTCTG CCGCCGCGTT TGAGGAAGCC AAGGAAAACG GCGTGAAGCT GGTGTTCCTG 
TCCAACGTGC CCTCTGACTA TGAACACGCA AAGGATTACG CGGCGATTGT CACCGACGAT 
CTGTTCCAGA TGGGCAAGCA GGCTGCAGAC GCGCTGGCCG CATCCATGGG CGGGGCGGGC 
ACCGTGGGCT GGATCTACCA TGACGCCGAC TATTATGTGA CCAACCAGCG CGATAACGCC 
TTCAAGACCA CCATTGAAAA CGACTACCCG GAAATTTCAA TCGTAGCAGA GCAAGGCATC 
AGCGACCCTG CCCGCGCTGA GGACATTGCC AACGCGATGT TGCTGCGCAA CCCTGACATC 
GGGGGCATCT ACGTGACCTG GGCTGGTCCC GCCGAGGGCG TTCTGGCCGC ACTTCGGGCA 
AATGGCAATG ACACCACCAA AGTGGTGACG CTTGATCTCT CGGAGCCGGT GGCGCTCGAT 
ATGGTTCGGG GCGGCAATGT TGCAGCCATC GTTGCCGACG AAGCCTATGA GCTAGGCCGC 
GCCATGGCCG CAGCTGCGAT CCTTGATCTT TTGGGCAAGG ACGTCCCTCC ATTCGTGGTG 
GCCCCCGCAG TGACCGTCAC CGCTGAGAAT GTGGCCGAAG GCTGGATGCG ATCCCTGCAC 
ATCGACGCCC CAAAGAGCGT CACTGGCAAC TGA

Protein sequence

MKHYLSTVAL GAALALATSS AFAQTVGPKG EAATPTASIM VEDGDLETIR SGNHTAALLW 
HDQSDFVNAV TAGATDELAR AGIEVVATAS AGFDAAKQRS DIETALSKDP SIILSLPLDP 
VTSAAAFEEA KENGVKLVFL SNVPSDYEHA KDYAAIVTDD LFQMGKQAAD ALAASMGGAG 
TVGWIYHDAD YYVTNQRDNA FKTTIENDYP EISIVAEQGI SDPARAEDIA NAMLLRNPDI 
GGIYVTWAGP AEGVLAALRA NGNDTTKVVT LDLSEPVALD MVRGGNVAAI VADEAYELGR 
AMAAAAILDL LGKDVPPFVV APAVTVTAEN VAEGWMRSLH IDAPKSVTGN