Gene Mlg_1223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1223
Symbol
ID	4269754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1426186
End bp	1427754
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	64%
IMG OID	638125973
Product	SpoVR family protein
Protein accession	YP_742062
Protein GI	114320379
COG category	[S] Function unknown
COG ID	[COG2719] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.297925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.137117
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGC TGGAAGAGAG TGCCCGCCTG CTCTATCGCG GGCCGGACTG GGACTACCGC 
AAGCTCAAGC GGGTCCACGA CGCCATCGAG CGCATTGCTC ATGAGGAGCT GGGCCTGGAC 
ACCTACCCCA ACCAGATCGA GGTGATCAGC TCGGAGCAGA TGCTGGATGC CTACGCCAGC 
CTGGGGATGC CGCTATTCTA CCGTCACTGG TCCTTCGGTA AGCACTTTGC CCGCGATGAG 
ATGCACTACC GGAAGGGGCT GACCGGGCTG GCCTACGAGA TTGTGATCAA CTCCAGTCCC 
TGCATCAGCT ACGTCATGGA AGAGAACACC ATGACCATGC AGACGCTGGT CATTGCCCAC 
GCCGCCTTCG GCCACAACCA CTTCTTCAAG AACAACCAGC TCTTCCGTAC CTGGACGGAC 
GCCGAGGGAA TTCTCGACTA CCTGGATTTC GCCAAGTCCT ATATCGCCCA GTGTGAGGAG 
CGCTATGGGG TGCGGGAAGT CGAGCGGCTG CTCGATGCCG CCCACGCGTT GATGAGCCAT 
GGGGTGCATC GCTTCCCGCG CCGCGGGCGT CTGAACCTGC GCCAGGAACG GGAGCGCGAA 
GAGGAGCGGC GGCGCTACCT TGAGGCCACC TTCAACGACC TCTGGCGCAC GGTGCCCACC 
CCGGAGTCCG GCGGTGAGGT CGACCCGGAG CTGCGGGCGC TGGAGGCGCG CCAGGAGCGA 
CTCGGGCTGC CCGAGGAGAA CCTGCTCTAC TTCCTGGAGA AGCGTGCGCC GCGGTTACAG 
CATTGGCAGC GGGAAGTCCT GCGCATCGTT CGCCAGGTGG CGCAGTACTT CTATCCCCAG 
AAGCAGACCA AGGTCATGAA CGAGGGCTGT GCCACGACGG TGCACTACTA CATCATGAAC 
CGGTTGCACG AGAGTGGCCG GATCGATGAT GGCGCCTACA TGGAGTTTCT GCACAATCAC 
ACCAACGTGG TCACCCAACC GGAGTTCGAC GATCCGCGCT ACTCCGGCAT CAACCCTTAC 
GCCCTGGGGT TCGATATCCT GCAGGACCTC AAGCGCATCT GCGAGGCCCC TACGGAGGAG 
GATCGGCGCT GGTTCCCGGA TATCGCCGGC AACGGCGACC CCATTGGCAC CTGGAGGCAC 
GCCTGGGCGG AGTATCGCGA CGAGAGCTTC ATCATGCAGT TTCTGAGCCC GCGGATGATG 
CGGCGCTGGC GGCTGTTTCG TGTGCACAAC GACGCCGAGG ACCCGGATCT GGAGGTGACC 
GCCATTCACG ACGAGGCCGG CTATCGCGAG CTGCGCAAGT CGTTGGCGGC CCAGTACGAC 
CTGGCGCGGC ACGAGCCGGA CATCCAGGTG GTGGACGTGG ACTTGGTGGG GGACCGCAAG 
TTGATCCTGG AACACCGGGT GGTGGACGGC GTGCTGCTGG ACGTGAGCAC CGGCATGCAG 
GTGCTGAGGC ACTTGGCCAA TCTATGGGGT TACGCGGTCA TCCTGCAGGA GGTGGATGCG 
GTCAGTGGCC GTGTGGTCAA CGAGTACCCG GAGGTCGCGC CCGACCACCC CTTCGTCAAC 
GGGGCGTGA

Protein sequence

MTELEESARL LYRGPDWDYR KLKRVHDAIE RIAHEELGLD TYPNQIEVIS SEQMLDAYAS 
LGMPLFYRHW SFGKHFARDE MHYRKGLTGL AYEIVINSSP CISYVMEENT MTMQTLVIAH 
AAFGHNHFFK NNQLFRTWTD AEGILDYLDF AKSYIAQCEE RYGVREVERL LDAAHALMSH 
GVHRFPRRGR LNLRQERERE EERRRYLEAT FNDLWRTVPT PESGGEVDPE LRALEARQER 
LGLPEENLLY FLEKRAPRLQ HWQREVLRIV RQVAQYFYPQ KQTKVMNEGC ATTVHYYIMN 
RLHESGRIDD GAYMEFLHNH TNVVTQPEFD DPRYSGINPY ALGFDILQDL KRICEAPTEE 
DRRWFPDIAG NGDPIGTWRH AWAEYRDESF IMQFLSPRMM RRWRLFRVHN DAEDPDLEVT 
AIHDEAGYRE LRKSLAAQYD LARHEPDIQV VDVDLVGDRK LILEHRVVDG VLLDVSTGMQ 
VLRHLANLWG YAVILQEVDA VSGRVVNEYP EVAPDHPFVN GA