Gene Emin_0100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0100
Symbol
ID	6263633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	104337
End bp	106196
Gene Length	1860 bp
Protein Length	619 aa
Translation table	11
GC content	46%
IMG OID	642610562
Product	chaperone protein DnaK
Protein accession	YP_001875003
Protein GI	187250521
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0443] Molecular chaperone
TIGRFAM ID	[TIGR02350] chaperone protein DnaK

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.843776
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.187258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGAA TCATAGGTAT AGACTTAGGA ACATCAAATA CGGCTGCTGC GGCCATGGAA 
GGCGGCAGGG CCACAATCAT TCCTTCAGCA GAAGGCAGCT CTATCGGAGG CAAAGCGTTT 
CCTTCATACG TGGCGTTTAC CAAAGACGGA CAGAGATTGG TAGGCGAACC CGCCAGAAGG 
CAGGCTATCG CCAATCCTGA AGGCACGGTT ACAGCTTTCA AAAGAAGAAT GGGCGAAGAT 
TACAAATTTA CTCTAAGAGG CCAGGAATTT ACACCACAGC AGTTATCGGC TTTCGTATTA 
CAGAAAGTTA AAAAAGACGC CGAGGCGTTC TTAGGAGAAC CTGTTGAAAA AGCGGTTATC 
ACCGTACCCG CCTATTTTAA CGACAACCAA AGACAGGCCA CCAAAGACGC GGGCAGAATC 
GCGGGTTTAG AAGTTGTAAG ACTTGTTAAC GAACCTACCG CGGCCGCCCT TGCCTACGGT 
ATTGATAAAG CGGGCAAAGA ACAAAAAATA ATGGTATTTG ACTTAGGCGG CGGTACGCTT 
GACGTTACAA TAATGGAAAT GGGTAAAGAA GGAACATTTG ACGTTTTATC CACCTCCGGC 
GACACAAAAC TCGGCGGTAC TGATATGGAC AACGCCATCA TTGAATGGAT GGTAAGCGAA 
TTTAAAAAAT CAACCGGCAT TGACTTATCA GCCGACAAAC AGGCCGCGCA ACGCTTAAAA 
GACGCCGCGG AAAAAGCAAA AATCGAACTT TCCACTACAA TGGAAACCGA CATTAACCTT 
CCGTTTATTA GCGCTGGAGC CGACGGCCCG AAACATTTGG AGCTTAAACT TTCCAGAGCT 
AAACTTGAAA GCTTAGTTGA TTCCATTGTA AAACGCTGCG GCGCTTCCAT TGACCAGGCT 
TTAAACGATT CTTCGCTTAA ATCAACCGAA ATAGACAAGA TTATTTTAGT AGGCGGCCCC 
ACAAGAATGC CTATAGTCCA AAAATATGTT GAAGACCATG CCGGCAAAAA AATTGAACGC 
GGCATTGACC CTATGGAATG CGTTGCCACA GGCGCCGCCG TACAAGCGGG TATTTTAACG 
GGCGACGTTA AAGACGTTCT TTTATTAGAC GTTACCCCGT TATCCTTAGG TCTTGAAACC 
TTAGGAGGAG TAACAACAAG GCTTATTGAA AGAAACACAA CCATACCTGT CAGAAAAACT 
CAGGTCTTCA GCACCGCTTC GGACAATCAG CCCGCGGTTA CAATTAACGT TCTTCAGGGC 
GAACGCCCCA TGGCAAAGGA CAATGTGCCT TTAGGCAAGT TTGATTTAGA CGGCATTCCA 
CCAGCGCCGA GAGGCGTACC GCAGATCGAG GTTACCTTTG ACATTGACGC TAACGGTATT 
TTAAACGTTT CCGCCAAAGA TTTGGGCACA AACAAACAAC AGCATATTAC AATTACTTCC 
AAAACAAAAT TAAGCGACGA TGAAGTACAA AAATTTGTTA AAGAAGCAGA GAAATTTGCT 
GATGAAGATA AGAAAACCAA AGAAAGAGTT GACGCTAAAA ACGAGGCTGA TTCAGTGCTC 
TTCCAAACGG AAAAAGCGCT TAAAGAACAC GGCGATAAAG TTCCCCAGGA AGACAGACTT 
AACATTGACC GCGCTTTAGG AGACCTTAAG GAAGCGTTAA AAGGCGACGA TGTTGAAAGA 
ATTAAAAAAG CCAAAGACGA CGCGCTTGCT GCAAGCCAAA AACTTGGGGA AATAATATAT 
AAAGAATCCC AGGCTAAAGC ACAAGGCGCG GCAGGCCCTC AACCGGGCGC GCAAGCCCAA 
GGCCAGCCCA ACGACGGCGG CAAAGAAGAT GTTGTTGAAG CTGAAGTTGT TGATAAATAA

Protein sequence

MARIIGIDLG TSNTAAAAME GGRATIIPSA EGSSIGGKAF PSYVAFTKDG QRLVGEPARR 
QAIANPEGTV TAFKRRMGED YKFTLRGQEF TPQQLSAFVL QKVKKDAEAF LGEPVEKAVI 
TVPAYFNDNQ RQATKDAGRI AGLEVVRLVN EPTAAALAYG IDKAGKEQKI MVFDLGGGTL 
DVTIMEMGKE GTFDVLSTSG DTKLGGTDMD NAIIEWMVSE FKKSTGIDLS ADKQAAQRLK 
DAAEKAKIEL STTMETDINL PFISAGADGP KHLELKLSRA KLESLVDSIV KRCGASIDQA 
LNDSSLKSTE IDKIILVGGP TRMPIVQKYV EDHAGKKIER GIDPMECVAT GAAVQAGILT 
GDVKDVLLLD VTPLSLGLET LGGVTTRLIE RNTTIPVRKT QVFSTASDNQ PAVTINVLQG 
ERPMAKDNVP LGKFDLDGIP PAPRGVPQIE VTFDIDANGI LNVSAKDLGT NKQQHITITS 
KTKLSDDEVQ KFVKEAEKFA DEDKKTKERV DAKNEADSVL FQTEKALKEH GDKVPQEDRL 
NIDRALGDLK EALKGDDVER IKKAKDDALA ASQKLGEIIY KESQAKAQGA AGPQPGAQAQ 
GQPNDGGKED VVEAEVVDK