Gene Mlg_1341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1341
Symbol
ID	4270014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1539880
End bp	1540899
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	69%
IMG OID	638126094
Product	sigma E regulatory protein, MucB/RseB
Protein accession	YP_742180
Protein GI	114320497
COG category	[T] Signal transduction mechanisms
COG ID	[COG3026] Negative regulator of sigma E activity
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.12457
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGC CCGCGACTAG CCTGCCCGGT TCGCGCGACT GGTGCCGCGG ACTCGCGGTG 
CTGATGCTGG CGCTGATCTC GGTCGGGGCC TGGGCCGACC AGGGTGACAA CCCCGGGCTG 
CGCCTGCTGG AACGGATCGG CGAGCAAACC CCTCAACTGC ATTACCACGG TATCCTGGTC 
TATCGCCATG GCGGCGACAT GGAGACCCTC CGCATCATCC ACCGGGGCGG CGCTGAGCAC 
GAGCGCAGCG AGCGTTTCTA TACCCTCACC GGCATCCCCC GCGAGGTCAT TCGCAAGCCC 
GACGAGGTCA TCTGTATCCT GCCCGACGCC GAAGCCGTGG TGGTGGGCCG GCGACAGCTG 
CGCAATCCGA TTGCCCAGGC CCTGCCCCGG TATACCGAGG CGCTGCAGGA GGCCTATGAG 
GTCACCCTGG CCGGCGAGGG TCGGGTGGCG GACCGGGATG CGCAACAGGT GCTGATCGTG 
CCCCGCGACG ACCTGCGCTA CGGCCACCGG CTCTGGATTG ACGAGGCCTA CGGCCTGTTG 
CTGCGCGCCG ATCTGCTGGA CGAGCACCAG CAGGTGCTGG AGCAGGTCAT GTTCACCGAG 
GTCACCGTGG TGGAGGCGGT GCCGGATGCC TGGCTGGAGC CGGGGATCAG TGGTGAGAGC 
TTCACCTGGG TGAGGCCGGC GGACCGAGCG GATGCCGCCC CGGAGCAGCG CCGTTGGCAG 
GTCGCCGAGG TGCCGCCCGG CTTTCGCCTA ATCTCGCACC GCCAACGGCA GATCGCCGGT 
CACGACCCCC CCGTGGAGCA CCTCCACTAC AGTGACGGTC TGGCCTCGGT ATCGGTCTAT 
GTCTCCCCGC AGGCGGCCGA CAAGGTCCGG GAGCGGGCGG CCAGAATGGG GTTGATGGGC 
GCGGTGCGCG TGCCCCGGGA CGGTTTCACC GTCACCGTGG TCGGCGAGGT GCCGCGTGCC 
ACGCTGCACC TGTTCGCCGA GCGGCTGGCG GCCACCGGGG ATGAGGGGGC TCGACCGTGA

Protein sequence

MKAPATSLPG SRDWCRGLAV LMLALISVGA WADQGDNPGL RLLERIGEQT PQLHYHGILV 
YRHGGDMETL RIIHRGGAEH ERSERFYTLT GIPREVIRKP DEVICILPDA EAVVVGRRQL 
RNPIAQALPR YTEALQEAYE VTLAGEGRVA DRDAQQVLIV PRDDLRYGHR LWIDEAYGLL 
LRADLLDEHQ QVLEQVMFTE VTVVEAVPDA WLEPGISGES FTWVRPADRA DAAPEQRRWQ 
VAEVPPGFRL ISHRQRQIAG HDPPVEHLHY SDGLASVSVY VSPQAADKVR ERAARMGLMG 
AVRVPRDGFT VTVVGEVPRA TLHLFAERLA ATGDEGARP