Gene TM1040_0368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0368
Symbol
ID	4077698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	377973
End bp	378989
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	61%
IMG OID	638005663
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_612363
Protein GI	99080209
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAC TACTGCTGAC CACCATTGCC GGTGTGGGCT TGCTGGCGGG TGCTGCGCAA 
GCGGATGAAA AGGTGACGGC CTGCCTGATC ACCAAAACGG ATACCAACCC GTTCTTTGTC 
AAAATGAAAG AAGGGGCGAC CGCCAAGGCC GAGGAACTGG GCATGGAGCT CAAGGCGTTT 
GCGGGCAAGA TCGACGGGGA CCATGAAACC CAGGTGGCCG CGATTGAGAC CTGCATTGCA 
GACGGCGCCA AGGGTATCCT GCTCACCGCG TCTGATACGT CTTCGATTGT ACCCGCTGTT 
CAGCAGGCGC GCGATGCGGG CCTCGTGGTG ATCGCACTCG ATACACCTCT CAACCCGATT 
GATGCGGCTG ATGCGACCTT TGCCACCGAC AACTTCCTTG CCGGCGAGCT GATTGGCCAG 
TGGGCGGCGG CGGCCCTTGG GGATGACGCG GCCAATGCCA AGATTGGCAT GCTCGATCTG 
GCCGTGAGCC AGCCCACCGT CGGCGTGCTG CGCGATCAGG GCTTCTTGCA GGGCTTTGGC 
ATCGACATCG GGGACCCCAA CAAATGGGGT GACGAGACCG ACCCGCGGAT CGTCGGCAAT 
GACGTCACGG CGGGCAATGA GGAAGGTGGC CGCAAGGCGA TGGAGAATCT TCTCGCCAAA 
GATCCAATGA TCAACGTGGT TTACACCATC AACGAGCCTG CCGCTGCCGG GGCCTATGAG 
GCGCTGAAGT CCATCGGTCG GGAAAACGAT GTGCTCATCG TCTCCGTCGA TGGCGGCTGC 
CCTGGCGTGC AGAACGTCAA GGATGGCGTG ATCGGCGCCA CCTCGCAGCA ATACCCGCTG 
ATGATGGCCT CGCTGGGCGT TGAGGCGATT AAGAAATGGG CCGAAGAAGG CGTGAAGCCG 
GAGCCTACTC CGGGCAAGGC GTTCTTTGAC ACCGGCGTTG CGCTGGTGAC GGACCAGCCG 
GTTGACGGTG TTGAAAGCAT CGACACCACA GAGGGCACCA ACCTCTGCTG GGGCTGA

Protein sequence

MKKLLLTTIA GVGLLAGAAQ ADEKVTACLI TKTDTNPFFV KMKEGATAKA EELGMELKAF 
AGKIDGDHET QVAAIETCIA DGAKGILLTA SDTSSIVPAV QQARDAGLVV IALDTPLNPI 
DAADATFATD NFLAGELIGQ WAAAALGDDA ANAKIGMLDL AVSQPTVGVL RDQGFLQGFG 
IDIGDPNKWG DETDPRIVGN DVTAGNEEGG RKAMENLLAK DPMINVVYTI NEPAAAGAYE 
ALKSIGREND VLIVSVDGGC PGVQNVKDGV IGATSQQYPL MMASLGVEAI KKWAEEGVKP 
EPTPGKAFFD TGVALVTDQP VDGVESIDTT EGTNLCWG