Gene Mlg_2672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2672
Symbol
ID	4268805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	3024507
End bp	3025547
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	70%
IMG OID	638127431
Product	sensory transduction protein kinase AlgZ
Protein accession	YP_743502
Protein GI	114321819
COG category	[T] Signal transduction mechanisms
COG ID	[COG2972] Predicted signal transduction protein with a C-terminal ATPase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000000000156498
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGGTGT TCGAACGAGG GGGTTCGTCC GTCAGGCGAT CGGCGATTCT GCCCGACTTC 
TGCCACCTGC AGACGGTGTT GGCCGTGGTG CTGGCCGGCC AGCTATTGGC CTTTGTGCTC 
TTTCTGGCGC GGCCCGCGAC GCAGTGGGAC TGGGCGACCC TGGGGCTGAT CTCGCTCTAT 
GTCCAATGGG TGGTGCTGCT GAGCACGGCG CTGCTCTGCC TGTCCCGCCG GCCACTGTCC 
CGGGTCAGTC CCGAGGCGGC GGGGCTGCTG GCCTGGCTGG GTATCATCGC GGTGGCTGCG 
GTGACCGCCG AGCTGGCCTG GCGCAGTACC GGGGGGGTGT TGGGCGCGGA GCGCTGGGCA 
TTGGTTCTGC GGTCGGTGGC CATCAGCGGC ATTATTGCGG CCCTGGTGCT CCGCTACCTC 
TATCTGCAGG GGGAGTGGCG CCGGGGGCTG CAGGCCGAGG CCCGGGCCTC CATGCAGGCC 
CTGCAGTCGC GCATCCGCCC CCACTTCCTG TTCAACACCC TTAACACCAT CGCCGCGATG 
CTCCGCCAGG CCCCGGAGCG CGCCGAGCAG GCGCTGCTGG ATCTTGCCGA TCTGTTTCGT 
GCCGGCCTGC GCGAGGTCGG CGGTTGGTCC ACGCTGGACG AGGAGCGGGC CCTGACCGAG 
CGCTACTTGC GTCTGGAACA GCTCCGGCTG CAGGAGCGGC TGCGGTTGGA CTGCGACTGG 
GACGGGTTGC CGGGCCAGGC CCGGGTGCCC TCGCTGATCT TGCAGCCACT GGCGGAGAAC 
GCCGTGGTGC ATGGCATCGA GCAACTGCCC GCAGGCGGTG AGCTGCGGCT GAGGGGGCGA 
CGGGAGGGCG ATACCCTGGT GCTGGAGCTG GAAAACCCCG TCCCGGCCGG TGGCTCCCTT 
CGCGGCGGCC ACGGCCTCGG GCTGGAGAGC GTGCGGCGCC GGATGCGCTA CGCCTTCGGT 
GCCGCGGCCG ATCTGGAGGT GACAGAGCGT GCCGGCCGTT TCCACGTAGT GCTCCGTTGG 
CCCTGGCAGG AGGCAGGATA G

Protein sequence

MAVFERGGSS VRRSAILPDF CHLQTVLAVV LAGQLLAFVL FLARPATQWD WATLGLISLY 
VQWVVLLSTA LLCLSRRPLS RVSPEAAGLL AWLGIIAVAA VTAELAWRST GGVLGAERWA 
LVLRSVAISG IIAALVLRYL YLQGEWRRGL QAEARASMQA LQSRIRPHFL FNTLNTIAAM 
LRQAPERAEQ ALLDLADLFR AGLREVGGWS TLDEERALTE RYLRLEQLRL QERLRLDCDW 
DGLPGQARVP SLILQPLAEN AVVHGIEQLP AGGELRLRGR REGDTLVLEL ENPVPAGGSL 
RGGHGLGLES VRRRMRYAFG AAADLEVTER AGRFHVVLRW PWQEAG