Gene Csal_2733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2733
Symbol
ID	4028785
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	3065043
End bp	3066446
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	69%
IMG OID	637967941
Product	GntR family transcriptional regulator
Protein accession	YP_574779
Protein GI	92114851
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAATTG ACCTGACTCC GTATCTGCCG TCCCAGGGGC CCAAGTATCT CGCCATCGCC 
CGAGCGCTCG CCGAAGCCAT TCGCCAGGGC GAACTCACGC CGGGCACGCG TCTGCCGCCG 
CATCGGTGCC TCGCCGACGC ACTGGCGGTC AGCGTCCAGA CCGTCTCGCG GGCCTATGCC 
CAGGCGGAAA AGATGGGCCT GGTGCAGGCC CGGGTGGGCA GCGGTACCTG GATCAACACG 
CTCGACGACA GCCAGGAGGC GGAATACCTG CGCAGCGCGG ACCTCCCCAC GGAGGGCGCG 
CCGGTGGACC TGTCCATCGC CCACCCCGTC TGTCCGCCCG GCCATCATCT GCGCTTTCGC 
GAGACGCTGC GCGAGGTGGC GGACAGCGCG CATCCCGACG CCATCGACGC GTGCCGCCCC 
ATCGCCGGAC TCGCGCATCA GCGCGAGCGC GCCAGTCACT GGCTTCAGGA AACGCTCGGC 
GTCCCCGGCA CCCCCGACGA CCGCGTGCTG TGCAACGGCG CTGCCCACGG CGTCATGCTG 
GCCATCGCCA CGCTGGTTCA ACATGGCGAT GTCGTGCTCA CGGAAGCGCT CACCGACCAT 
GGCCTGATCG CCCTGTCGCG CACGCTGGGT CTGCAACTGC GCGGTGTGGC GATCGACGAG 
CAAGGCGTGA TTCCCGAGGC CCTCGACGCT GCGTGCCGCC GCTATCATCC GCGTGCGGTA 
TGCCTGACAC CGACCCAGCA CAATCCCACC GGCGCGACCA TGGATGCCGA CCGGCGCGAC 
GCCATCGCCG AGGTGCTGGC ACGCCACGGC ACCTGGTTGA TCGAAGACGA CACCCATGCC 
CTGCTCGAGC CCCCGGGGCT GACGCCGCTG ACCGCTCGTC TGCCGCGCCA GAGCTTTCAT 
GTCACCAGCC TCACCAAGGC CACCGTGCCG GGGCTGAGAG CCGGCTACCT GAGCGTGCCG 
CGCGGCCAGT TGCACCACAC CCTGCCGCGC CTGCGCGCGA CCAGCTGGAT GGCCACGCCC 
CTGATTTTCG AGATCGCCGA CCGCTGGCTG GCCGATGGCA GCGTCGAGGC CCTGGCCGAG 
GAACAGCGCC AGCTGCTCGC CGAACGCCAG CAATTGACCC GCTCACGCCT GCAGGGCCAT 
GTCATGGCCT CGCGCCCCAC GGGGCTGCAT GTCTGGCTCG CCTTGCCACG CGCGTGGCGT 
GCCGAGGAGC TCCAGCAGCA AGCGCTGCGC GAAGGCCTGG CGATCGCCAC CGCGCAGCCG 
TTCATGGTGG GACAGGGAGC GCCGCCGCAA CGTGTCCGCC TGAGCCTCGG CGCCGAAAAC 
GACCTCGAGC GTTTCGATCA GGGCCTGACG ATTCTCGCGC GATTGCTCGG CGAAGCCCCG 
CCACCAATGC TACAAAACGT ATGA

Protein sequence

MTIDLTPYLP SQGPKYLAIA RALAEAIRQG ELTPGTRLPP HRCLADALAV SVQTVSRAYA 
QAEKMGLVQA RVGSGTWINT LDDSQEAEYL RSADLPTEGA PVDLSIAHPV CPPGHHLRFR 
ETLREVADSA HPDAIDACRP IAGLAHQRER ASHWLQETLG VPGTPDDRVL CNGAAHGVML 
AIATLVQHGD VVLTEALTDH GLIALSRTLG LQLRGVAIDE QGVIPEALDA ACRRYHPRAV 
CLTPTQHNPT GATMDADRRD AIAEVLARHG TWLIEDDTHA LLEPPGLTPL TARLPRQSFH 
VTSLTKATVP GLRAGYLSVP RGQLHHTLPR LRATSWMATP LIFEIADRWL ADGSVEALAE 
EQRQLLAERQ QLTRSRLQGH VMASRPTGLH VWLALPRAWR AEELQQQALR EGLAIATAQP 
FMVGQGAPPQ RVRLSLGAEN DLERFDQGLT ILARLLGEAP PPMLQNV