Gene Mlg_1541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1541
Symbol
ID	4270546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1761224
End bp	1762495
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	58%
IMG OID	638126299
Product	putative transcriptional regulator
Protein accession	YP_742380
Protein GI	114320697
COG category	[K] Transcription
COG ID	[COG2865] Predicted transcriptional regulator containing an HTH domain and an uncharacterized domain shared with the mammalian protein Schlafen
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.509332
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGATA CCGCGGCTGC GCTCTTGGAG AAGATACAGC TTGGGGAAGA TTCCTTCCTT 
GAGCTGAAGG AGGTTCGGAT CGCCGGGAAG CGAGTGACCG CACCACATCG CAACTCACTG 
GTGGACGAAT TGGCAGCGTT TGCGAATGCC AAGGGCGGTG TCTGTGTGCT CGGTGTGGAT 
GATGCAACGC GAGAAATTCT CGGGATTCCG CGAGACAAGC TGGACCTTGT GACTGACTAT 
GTCCGGCAGA CCTGCCTGGA CTCAGTGACA CCACCGTTGA CCCCAGTTAT TGAGCGGCTA 
CTTCTGCCTA CGACCACCGG TGACGAGGTG GCCGTATTGA AGGTGGAAAT CGGTCGCAGC 
TTGTGGGTGC ATCGCAGCCC CGGCGGCTAT ATGCATCGGG TGGGTGATGA AAAGCGTGAA 
ATGGCGCCGG ACTTCCTCGC CCGACTGTTT CAGCAGCGCA GTCAGGCCCG AATCATTCGC 
TTTGACGAGC AGCCAGTGCC GAATGCCACC CTGGATGACT TGAATGAGGC GCTTTGGCAA 
CGATTCGCAA CCGCACGTAC CCGGGATAAC CGCGATGACC TGCTGCGAAA GCTCGGCATG 
GCCCGCATGG ATGACGATGT CTTGCGCCCG TCGGTGGCGG GTATCCTTCT GGCTTCCGAT 
GATCCTCGCC ATTGGCTGCC CAATGCGTTT ATTCAGGCGG TCGCCTACCG GGGTACTGAA 
ATTCGACCGG TAGGCGACCA AGCGTACCAG CTTGATGCAG CAGATCTCAC CGGGCCTTTG 
GATCAACAGG TGCTTTCTGC CTGCCATTTT GTCAGCAAAA ATATGCGAGT CGCCGCGTCC 
AAAAGCGTGG GCCGAGAGGA TGTTCCTCAG TTTGATATGA CAGCCGTATT CGAGGCCATC 
GTCAACGCGG TCGCGCATCG TGACTACGCT ATGCAGGACG CCAAGATCCG GTTGCGCGTA 
TTCGCAGACC GCATGGAACT GTACTCCCCC GGAGCCATCC CTAACACCAT GACGGTGGAT 
AGCCTACCGT ACCGCCAGGC TGCACGGAAT GAAACGATTA CCAGTTTGCT GGCGAAATGT 
CGGGTGCCGG ATGAAGGCGG GCTGGGAACA GGCCGATCCA CCATGATGGA TAAGCGGGGC 
GAAGGCGTGT CCATCATCCT TCAAAATAGT GAAATGCTGT CCGGTCGTGT CCCGGAATAC 
AGCCTGGTTG ATGATAGTGA GCTCCGCCTG GTGATTTACG CACCAGCGGA AACGGATGGA 
GGGGAAGACT GA

Protein sequence

MFDTAAALLE KIQLGEDSFL ELKEVRIAGK RVTAPHRNSL VDELAAFANA KGGVCVLGVD 
DATREILGIP RDKLDLVTDY VRQTCLDSVT PPLTPVIERL LLPTTTGDEV AVLKVEIGRS 
LWVHRSPGGY MHRVGDEKRE MAPDFLARLF QQRSQARIIR FDEQPVPNAT LDDLNEALWQ 
RFATARTRDN RDDLLRKLGM ARMDDDVLRP SVAGILLASD DPRHWLPNAF IQAVAYRGTE 
IRPVGDQAYQ LDAADLTGPL DQQVLSACHF VSKNMRVAAS KSVGREDVPQ FDMTAVFEAI 
VNAVAHRDYA MQDAKIRLRV FADRMELYSP GAIPNTMTVD SLPYRQAARN ETITSLLAKC 
RVPDEGGLGT GRSTMMDKRG EGVSIILQNS EMLSGRVPEY SLVDDSELRL VIYAPAETDG 
GED