Gene TM1040_0156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0156
Symbol
ID	4078823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	171551
End bp	173017
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	61%
IMG OID	638005450
Product	GntR family transcriptional regulator
Protein accession	YP_612151
Protein GI	99079997
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATTT CCGTCGAAAC GTTTTTTCTC AATACCGATG CGCAGGGCAC GTTACAGGCC 
CAGATCCAGG AGATGATTGC CGCTGGCATT CTCTCGGGGC GGTTTCGCGC GGGTGAAAAA 
CTGCCCTCAT CACGCAAATT GGCGCAGCAT CTCGGGGTGA GCCGCATCAC CGTGACGCTG 
GCCTATACGG AACTTGTGGC AAATGACTAT CTGAGCGCTC GCGGACGGTC GGGATATTTC 
GTCTCCCAGA CCGCGCCGGT GCCGCCCTCT TTCTCGCCTA TTCAAAAAGA AGCGGACAGC 
GTCGATTGGA ACCGCGCCAT CACTCAGGAT TTCACCGGCG GCGACAGCCC CCCCAAACCG 
CGTGACTGGC GCAACTATCG CTATCCCTTC ATCTACGGGC AGGCGGATGC CACCCTGTTT 
GATCACGCCA ACTGGCGCCT CTGCGCGCTC CGGGCGCTCG GGCAAAAGGA CTTTGCTGCG 
ATGACCGGCG ATTACTTTGA TCAGGATGAC CCGCTCTTGA TCGAATATAT CGCCCGCAAC 
ACGCTGCCGC GCCGAGGGGT GATTGCCCGG CCCGAGGAAA TCCTGATCAC GCTGGGTGCA 
CAAAACGCGC TCTGGACCGT GGTGCAGCTG TTGTTGCAGC CCGGCCGCAA GGCCGCCATT 
GAAGACCCGA GCTATTACAC GCTGCGTGAC CAACTCAGTC ATACAGGCTG CGATCTGGAT 
GTGATCGCGG TGGATGAGGA CGGGTTGCCG CCAGCACAGA TCGCAACCAA CACCGATGTG 
ATTTTCACCA CTCCGAGCCA TCAGAGTCCG ACCACCGCGA CAATGCCAAT GGCGCGCCGC 
AAGGCGCTGT TGTCGCGCGC CACTGAAATC GGTGCGGTGG TAGTGGAGGA CGACTATGAA 
TTCGAGATGT CCTTTCGCAA TCAGCCCTCG CCTGCGCTCA AATCCATCGA CCGCGATGGG 
CGGGTGATCT ATCTGGGCAG CTTCTCCAAA TCGCTCTTTC CGGGGTTGCG GTTGGGGTAT 
CTGGTGGGGT CGGAGCCCTT CATCCGACAG GCGCGCGCAC TCAGGGCCAA TGTCTTGCGC 
CATCCGCCGG GCCATGTGCA GCGCACCGTT GCCTATTTCC TGTCTCTTGG TCACTACGAC 
GCGCAAATCC GGCGCACCGC CAAAGTCCTG CAAGAGCGCC GCGCCGTACT GGAGCGCGCG 
GTCGAGGCCG AAGGATTGTG CCCCGCCAAT CGCAGCCTAT ACGGGGGATC CTCTCTCTGG 
ATGCAGGCCC CTGATCAGGT CAACATGGGG CAGGTGGGCC TGAAGCTGCG CGAAAAAGGT 
GTGTTGATCG AACCCGGCGC GCCCTTTTTT GCGCGAGACA CTCGGCGGCA CAACTTCTAC 
CGGCTCGGAT ATTCGTCGAT CGCCTCAGAG CGCATCCCGC AAGGCATCGC ACATGTGGCC 
GAGGCGATCC GGGATAGCCA GTCCTGA

Protein sequence

MAISVETFFL NTDAQGTLQA QIQEMIAAGI LSGRFRAGEK LPSSRKLAQH LGVSRITVTL 
AYTELVANDY LSARGRSGYF VSQTAPVPPS FSPIQKEADS VDWNRAITQD FTGGDSPPKP 
RDWRNYRYPF IYGQADATLF DHANWRLCAL RALGQKDFAA MTGDYFDQDD PLLIEYIARN 
TLPRRGVIAR PEEILITLGA QNALWTVVQL LLQPGRKAAI EDPSYYTLRD QLSHTGCDLD 
VIAVDEDGLP PAQIATNTDV IFTTPSHQSP TTATMPMARR KALLSRATEI GAVVVEDDYE 
FEMSFRNQPS PALKSIDRDG RVIYLGSFSK SLFPGLRLGY LVGSEPFIRQ ARALRANVLR 
HPPGHVQRTV AYFLSLGHYD AQIRRTAKVL QERRAVLERA VEAEGLCPAN RSLYGGSSLW 
MQAPDQVNMG QVGLKLREKG VLIEPGAPFF ARDTRRHNFY RLGYSSIASE RIPQGIAHVA 
EAIRDSQS