Gene Mlg_1123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1123
Symbol
ID	4269847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1314633
End bp	1315634
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	63%
IMG OID	638125874
Product	death-on-curing protein
Protein accession	YP_741964
Protein GI	114320281
COG category	[R] General function prediction only
COG ID	[COG3943] Virulence protein
TIGRFAM ID	[TIGR01550] death-on-curing family protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.637266
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAA TCGTAATCTT TGAAGATGCC AACCAGCCGG TCGAAGTCCG ACTGGAAGGC 
GAGTCAATCT GGGCGACTCA GAGCCAGATG GCCGAGCTGT TCGATACGAC AACGGACAAT 
ATCGGGCTAC ACCTCAAGAA CATCTATTCA GAGGGCGAGT TGGCCGAGTC GGCAACTACC 
GAGGAATTCT CGGTAGTTCG CCAAGAGGGC AACCGCCAGG TACGCCGGCG GCTCAAGCAC 
TACGATCTGG ACGCCGTGAT CTCAGTGGGC TATCGGGTCA ACTCGGGGCG TGCCACCCGC 
TTCCGCCAAT GGGCCACCCG CGTCCTGCGC GAGCATCTGA CCCAGGGCTA CAGCCTCAAC 
GAACACCGAC TGGCCCAGCA GGGCCTGTCC GAACTGGAGC AGGCGGTGGA GTTGCTGGGC 
CAGACGCTCA CCCGGCAGGA GCTGGTTTCC GACCTGGGCC AGGAGGTGGT GGGGCTGATC 
CTCGGCTATG CCCGCACCTG GCGCCTGCTG CAGGACTACG ACGAAGGCGC CTTGGGTCTG 
CCGCCCGGCG CCCGACCGGC CCGGGGCGTT CTGGCGCTGG ACGAGGCACG CCGCGCCCTG 
GATGCCCTCG CGGCTGAACT GCGCGAGCGG GGCGAGGCCA CGGAGCTGTT CGCACGGGAT 
AGGGGTGACG GGCTGGCCTC GATTCTGGGC AACCTGGAAC AGAGCATGTT CGGCGAATTC 
CTCTACAAGA CGCGTGAGGA ACGCGCCGCG CATCTGCTGT ACTTCGTCAT CAAGAACCAC 
CCCTTCTCGG ACGGCAACAA GCGCTCTGGC GCTTTCCTGT TTCTGCTTTA CCTGCGCCAG 
GAAGGCATGC GCCTCACCCT CAACGAACAG GGCCTGACCG CCCTGACCCT GTTGATCGCT 
GAGAGCGACC CCAAGGCCAA GGACCTGATG GTGCGCTTGG TCATGAACCT CATTTCGGAA 
GACGTGAGCA ACAACCACGA CGACAGAGCG AGTGCCGAAT GA

Protein sequence

MSEIVIFEDA NQPVEVRLEG ESIWATQSQM AELFDTTTDN IGLHLKNIYS EGELAESATT 
EEFSVVRQEG NRQVRRRLKH YDLDAVISVG YRVNSGRATR FRQWATRVLR EHLTQGYSLN 
EHRLAQQGLS ELEQAVELLG QTLTRQELVS DLGQEVVGLI LGYARTWRLL QDYDEGALGL 
PPGARPARGV LALDEARRAL DALAAELRER GEATELFARD RGDGLASILG NLEQSMFGEF 
LYKTREERAA HLLYFVIKNH PFSDGNKRSG AFLFLLYLRQ EGMRLTLNEQ GLTALTLLIA 
ESDPKAKDLM VRLVMNLISE DVSNNHDDRA SAE