Gene Mlg_0306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0306
Symbol
ID	4270766
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	346195
End bp	347262
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	72%
IMG OID	638125032
Product	putative periplasmic ligand-binding sensor protein
Protein accession	YP_741151
Protein GI	114319468
COG category	[T] Signal transduction mechanisms
COG ID	[COG3292] Predicted periplasmic ligand-binding sensor domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCTA AGGCCCTGCA ACTCGGTGTG CCCGCCCTGG TCGCCGGCCT GCTGTACCTC 
GCCGGCACCG CCTGGGTCGG CGACCGGGAA CACTGGGTGC CGATCAGCCC CTATCCCGGC 
GAACACTTCA TGGCCCTCAC CACCGCCCCT GACGGGCGCC TGTTCGCCGG GGCCCAATCC 
GGCGCCGTGC TGGAACGTGA CCCGGGCGGT CCGTGGCGCC TGCACAATAC CGGCCTGCCC 
GCGATCACCT GGCTGCTGCC GGACGGTGAT GGGCTGCTGG CCGGAACCAT CCGAGGGGTG 
TACGCCTCGC CGGACGGGCG CCAGTGGGCA CCGGTGGAGC GGGGTCTGCC GGAGGGGCTG 
TGGGTGCTGC AGTTCGAGCC TCTGCCGGAC GGCCTGCGCC TGCTTAGCCC CGACCAGGGG 
CTCTACCGGC GGGATGACCA GGGGCGTTGG CACGCCGACC ACAGCCGCGG GCTGCCGGCG 
GGGGTCCACA TCTATCACTA CGCCCGGGAT ACCCAGGGCG GGGACCACGT GGGGACGGTG 
GCGGAAGGCG CCTATTACCG GCCAGACCCG GGGGCCGACT GGCGTCCCAA CAGCGAGGGT 
CTGCACCGCC ATGCCCGTGG ATTCTCCCTG CTCCGCCGGG AGGGTGGCAT CATCCTGGGC 
AGCGACCGCG GCGCCTGGTG GCAGTCCCAA CCCGGGGAAC GCTGGCAGGC CCTGGGCACC 
GGACGGCATG GCTTCCGGGT GCTCGATCTG GCCGCGGACG CCCGTGGCCG GGTCTGGGCG 
GCCAGCGACG AGGGGATTTG GGTCGCCGAC GAGAGCAATC GCGACGGCCG GCCGACACCC 
TGGCGCAGTG TCCCCATGCG CGACGAGGGC CCACAGGCGC CGGTCAGCCG TTTTCACATC 
GACGGTGATC AGCACCTGGC CGCCGCGGGC GCCATCTACC AATTGGAGCG GGACCGCGGC 
TGGCAGGTCC CTATCCTGGT GATGGCCATC CTCGCCGGGG TCATGACCTG GGCTATGATG 
CACGTGCCGG CGGTGACCGG CCGGCGACCA CCGCCGAACC ACCCCTGA

Protein sequence

MSAKALQLGV PALVAGLLYL AGTAWVGDRE HWVPISPYPG EHFMALTTAP DGRLFAGAQS 
GAVLERDPGG PWRLHNTGLP AITWLLPDGD GLLAGTIRGV YASPDGRQWA PVERGLPEGL 
WVLQFEPLPD GLRLLSPDQG LYRRDDQGRW HADHSRGLPA GVHIYHYARD TQGGDHVGTV 
AEGAYYRPDP GADWRPNSEG LHRHARGFSL LRREGGIILG SDRGAWWQSQ PGERWQALGT 
GRHGFRVLDL AADARGRVWA ASDEGIWVAD ESNRDGRPTP WRSVPMRDEG PQAPVSRFHI 
DGDQHLAAAG AIYQLERDRG WQVPILVMAI LAGVMTWAMM HVPAVTGRRP PPNHP