Gene Mlg_2686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2686
Symbol
ID	4269562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	3044406
End bp	3045569
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	65%
IMG OID	638127446
Product	LuxR family transcriptional regulator
Protein accession	YP_743516
Protein GI	114321833
COG category	[K] Transcription
COG ID	[COG2771] DNA-binding HTH domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.000494765
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTGACA GCGACTCGGG GCCAGGGACA GTCGCTCACA AGTGTACGCT ATCCACCATG 
AACTCATCAC GGCACGTCAC GTATTTCCGC CAGCTCGGCA TGCTCCAACT GGACAGCCGG 
ATCGTCATGC CCTCCCTGCT GCGGTCAGTC CGGCGTATGG TGGAGGCGGA TTTCCTGTTC 
TTTTTCTGGA CGAACGAGAA GGGTGCTGTA CTCGCTGAGT ACGAGGATCC CCCAAGCCCG 
GAGGGCGTCC GCGAGCGCTA TTTCGCGAAG TTTCACGACG TCGAACAACC GGGTCTGCCG 
CCTTTTTCGA CAGCCGCCCG CTTTGGCCCC GAGCTGAGCG TGGTGCCCGA CCTCCCGCAA 
CGAGTCCGGC GGCGTTCGGC ATTCTGGAAC GAGATCCTGA ACCCTCTGGG AAGCCGCTAT 
CAGTTGGTCA TGGTCCTGCG GGAAGGCACA CACCCTGAAG GGGTCTTGGT CATGCACCGC 
TCCGCGCTTA CCGGGCCGTT TTCGCACCAG GAAGCACAGG TGTTACGGGA GATTAGGCCC 
TATATCACCC AAGGCCTCGG CCACACCCCC CCTTGCCCCG CCACGGGAAC GCTTGGCGCC 
CCGGCCGGCG GTGACGGGGC AACCCGCATG GTGGAGAACG AGGAAGGCCT TCTGATCCTG 
GATCGATGGG GCCGATTGCT GAGCCGCTGC GCCACGAGCG GTCTGCTGCT CCAGATGATG 
CAAGGCGCCC GCCTCCCGCA GGCCCGACTA CCGGAACAGC TTCCCTCCCC GGTGACCACC 
ATTCACCGGA AGCTGCTCGA TGCAGAAGTG GGGGGAACGC CCTTCCCCCC ACTGGTCGTC 
GTGTCAGCCT GGGGCCGCTT CAGACTGCGT GCGTGCTGGC TGGACGGCGC CGACGGCGTG 
CGGGTCGGCA TCACCATCCG GCGCGAAATC CCGTTGCGCC TGCGCCTGTG GGAGAGGCTT 
TACGGCCAGC CGCTCTCCGC CCGGCAGGGC GAGTTATGCC TGTGGCTTGC GGACGACCTT 
TCCTACGCCG AGATCGCCGA GCGCATGGGC ATCAGCCGGC ACACCGTCGT GGAATACACC 
CAGACGATCT ACCGCAAACT GGGCGTCTCA GGGAAGGAGG CACTGATCGA AAGGCTGCTG 
CATCCCCCGC CGACACCCGG CTGA

Protein sequence

MIDSDSGPGT VAHKCTLSTM NSSRHVTYFR QLGMLQLDSR IVMPSLLRSV RRMVEADFLF 
FFWTNEKGAV LAEYEDPPSP EGVRERYFAK FHDVEQPGLP PFSTAARFGP ELSVVPDLPQ 
RVRRRSAFWN EILNPLGSRY QLVMVLREGT HPEGVLVMHR SALTGPFSHQ EAQVLREIRP 
YITQGLGHTP PCPATGTLGA PAGGDGATRM VENEEGLLIL DRWGRLLSRC ATSGLLLQMM 
QGARLPQARL PEQLPSPVTT IHRKLLDAEV GGTPFPPLVV VSAWGRFRLR ACWLDGADGV 
RVGITIRREI PLRLRLWERL YGQPLSARQG ELCLWLADDL SYAEIAERMG ISRHTVVEYT 
QTIYRKLGVS GKEALIERLL HPPPTPG