Gene Mlg_1013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1013
Symbol
ID	4270042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1151893
End bp	1153563
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	67%
IMG OID	638125764
Product	serine phosphatase
Protein accession	YP_741856
Protein GI	114320173
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGAAG CGGCAGCGCC GGGCCGGCGG GTTTCGCGGG GTCTGACCTT TAAGCAGGCG 
GTCACCACCC TGGTGGTGGT CTTCCTGTTG GGTGTGCTGG CGGCCGCCGT GGAGATCTAC 
GCCGACTGGC GCTCCATGCG CGACGAGGTC CGTACCCATA TGCAGCAGAC CCTCGCCATG 
GTCGAGGGCT CGGCGGTGGA CGCCGCCTTC AACCTCAACC CGGACGGTGC CAATCAGATC 
GCCCGGGGGT TGGCCGAGTA CGAATTCATC CAGCGCGTGG AGTTGCACGA TAACTTTGGC 
GACCGGCTGG CGCTGTACGA TCGCCCCCGG GCGCTGAATG AGAATGGGAT GGCGGGCCGG 
CTGTTCGACG ACCTTTCCCA CTGGGAGGTC GAGCTGATCC GGCAGGACAT CATTGGCCGT 
GCTGAGCCCG TCGGTGAATT GCGGGTGCGA CTGGACCCGG AGGTGATCGC CGCCGGTTTC 
GTGCACCGCA CGGCAGTGAA CGCAGGGGTC AACTTGATCA AGGCGCTGGC CATTTCGTTG 
CTGGTCGTCG CGATCTTCCA CTTCCTCATC ACCCGTCCGC TGTTGCGGCT GAACACCGCC 
ATCGCCGGTG TAGACCCCGC CCACCCGGGC GATTGGTCGA GGCCGGGTAT GCCCGGCCAC 
CAGGGCGACG AGCTGGGCCA GATCGTGGGC TCGCTGGACC GTCTGCTGGG GGCCTTTCAG 
AAGGGGTTGA ACCAGCGGGA TCAGGCCGAG GGTGAGTTGA AGGCGCTGAC CGAGGAGTTG 
GAGCAACGGG TACAGGACCG CACCCGTAAG CTGCAGGATG CCATGGACGA GCTTGCCGCG 
GAGAAGGAAG AGACCGAGGC CGCCTATGGG CGCCTCAACG AGGCGCACCG GGAGTTGGAG 
CGGGCCAACC GCCTGGTGGT GGAGAGCATC CGCTACGCCC GCCGGATTCA GACGGCGATG 
CTCCCCGACA AGTCGGCACT GGGCGATGCC GTCCAGGAGA TCCATGTCTG CTGGGAGCCG 
CTCCACCTGG TGGGCGGGGA CTACTTCTGG CTGGAGCGTT TCGGGCGGCA GAGCCTGATT 
GTGGTGGTGG ATTGCACCGG GCACGGTGTG CCAGGCGCCT TCATTACCCT GGTGGTGGCC 
TCGGCGCTGG ACCGTATCCT CCACGAGCGC GATCTGCGCA GCCCGGCGGA GATCCTCACC 
GCCCTGGACG AGATGGTCCG GGCCCGCCTG CGTCAGGATG GGGAGGAGCC GGAGTCCGAC 
GACGGTCTGG ATGCCAGCAT CTGCCTCTGG GACGAGGCCG ATCGCAGCGT GACGTTCTCC 
GGTGCCGGCC TGCCCTTGAT TTACGTCGAG GATGGCGAGG CGCATGAAAT CAAGGGCAAC 
CGGGCCGGCC TCGGCTACCA TAGCCTGGTC CCGCGTAAAC CGTTCGTGGA TCACCGGGTA 
CCGGTGAAAC CGGGGATGTC CTTCTACCAA CTCACCGATG GCATCCCCGA CCACATGGGT 
GGGGAGCCCC GGCGACTGCT CGGCCGCCGG CGGGTGCGCC GGCTGATCGC CCGTAACGCC 
CATCTGCCCA TGGCCGAGCA GATCCAACGC CTGGAGGCGG AGCTGGAACG CTACCGTGGC 
CCCGAACCCC GCCGTGATGA CATGACCCTG GTGGGCTTCC GCCCCCTCTG A

Protein sequence

MQEAAAPGRR VSRGLTFKQA VTTLVVVFLL GVLAAAVEIY ADWRSMRDEV RTHMQQTLAM 
VEGSAVDAAF NLNPDGANQI ARGLAEYEFI QRVELHDNFG DRLALYDRPR ALNENGMAGR 
LFDDLSHWEV ELIRQDIIGR AEPVGELRVR LDPEVIAAGF VHRTAVNAGV NLIKALAISL 
LVVAIFHFLI TRPLLRLNTA IAGVDPAHPG DWSRPGMPGH QGDELGQIVG SLDRLLGAFQ 
KGLNQRDQAE GELKALTEEL EQRVQDRTRK LQDAMDELAA EKEETEAAYG RLNEAHRELE 
RANRLVVESI RYARRIQTAM LPDKSALGDA VQEIHVCWEP LHLVGGDYFW LERFGRQSLI 
VVVDCTGHGV PGAFITLVVA SALDRILHER DLRSPAEILT ALDEMVRARL RQDGEEPESD 
DGLDASICLW DEADRSVTFS GAGLPLIYVE DGEAHEIKGN RAGLGYHSLV PRKPFVDHRV 
PVKPGMSFYQ LTDGIPDHMG GEPRRLLGRR RVRRLIARNA HLPMAEQIQR LEAELERYRG 
PEPRRDDMTL VGFRPL