Gene Mlg_1899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1899
Symbol
ID	4270099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2164868
End bp	2166019
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	68%
IMG OID	638126655
Product	chaperone protein DnaJ
Protein accession	YP_742733
Protein GI	114321050
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID	[TIGR02349] chaperone protein DnaJ

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.61643
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.626034
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAAAA GCGATTACTA CGAAGCCCTG GGCGTTGCCC GCAACGCCTC GGATTCAGAG 
ATCAAAAAGG CCTACCGCCG CATGGCCATG AAGTATCACC CGGACCGCAA TCCGGGTGAC 
AAGGAGGCGG AGGCCCGCTT CAAGGAGGCC AAAGAGGCCT ACGAGATTTT GTCCGACCCG 
CAGAAGCGGG CCGCCTACGA CCAGTTCGGT CACGCCGGTG TGGACCCCTC CGCCGGCATG 
GGGGGCGCCG GGGGGCCGGG TGGCCCGGGC GGGCCGGATT TCGCCGATAT CTTCTCCGAC 
GTCTTCGGCG ACATCTTCGG GGGCGGCGGT CGCCGTGGCG GCGGGGGCCG GCGCGTCTTC 
CGTGGCGCGG ACCTGCGCTA CAACCTGGAG CTGTCGCTGG AGGACGCGGT GCGCGGCACC 
GAGGTGCAGA TCCGGGTGCC CACCCAGGAG GTCTGTGACG CCTGTGACGG CAAGGGCACC 
AAGGAGGGCA GCCAGCCCGA GACCTGCCCC ACCTGTAAGG GCCACGGTGA TGTCCGTATC 
CAGCAGGGCT TCTTCTCCGT GCAGCAGACC TGCCCGCGCT GTGGCGGCAG TGGTTCGGTT 
ATCACCGACC CGTGCCGTAA GTGTGGCGGG CGCGGGCGAG TGCAGTCGCA GAAAACGCTC 
TCCGTACGGG TGCCGGCCGG GGTGGATACC GGCGACCGGA TCCGCCTGTC CGGCGAGGGC 
GAGCCCGGTG AGAATGGCGG TCCGCCCGGC GATCTGTACG TGCAGATCAT GGTGCGTGAG 
CACGAGTTCT TCCAGCGCGA CGGGGCCAAT CTGCGCTGCG AGGTGCCCAT CAGTATCACC 
AAGGCCGCCC TCGGCGGTGA GGTGGAGGTG CCGACCCTGG ACGGGCGCGT CAACCTGCGC 
ATCCCCGCCG GCGCCCAGTC GGGCAAGGTC TTCCGGGTGC GCGGCAAGGG GGTGAAGCCG 
GTGCGCGGCG GTCCGCAGGG CGACTTGCTC TGCCGGGTGC ACGTGGAGAC CCCGGTCAAC 
CTCACCAAAA AGCAGAAGGA GCTGCTGGAG GAGTTTGGCC GCACCATGGA TGACACCGGC 
GACAAGCACA CCCCGCGGAC CAGCTCCTGG CTGGACAAGG CGCGCAAATT CTTCGAGGAC 
TGGAAGCTCT GA

Protein sequence

MSKSDYYEAL GVARNASDSE IKKAYRRMAM KYHPDRNPGD KEAEARFKEA KEAYEILSDP 
QKRAAYDQFG HAGVDPSAGM GGAGGPGGPG GPDFADIFSD VFGDIFGGGG RRGGGGRRVF 
RGADLRYNLE LSLEDAVRGT EVQIRVPTQE VCDACDGKGT KEGSQPETCP TCKGHGDVRI 
QQGFFSVQQT CPRCGGSGSV ITDPCRKCGG RGRVQSQKTL SVRVPAGVDT GDRIRLSGEG 
EPGENGGPPG DLYVQIMVRE HEFFQRDGAN LRCEVPISIT KAALGGEVEV PTLDGRVNLR 
IPAGAQSGKV FRVRGKGVKP VRGGPQGDLL CRVHVETPVN LTKKQKELLE EFGRTMDDTG 
DKHTPRTSSW LDKARKFFED WKL