Gene Emin_1366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1366
Symbol
ID	6263403
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1468518
End bp	1469630
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	42%
IMG OID	642611847
Product	butyrate kinase
Protein accession	YP_001876253
Protein GI	187251771
COG category	[C] Energy production and conversion
COG ID	[COG3426] Butyrate kinase
TIGRFAM ID	[TIGR02707] butyrate kinase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACACA ATATTTTAGT TATAAATCCA GGGTCAACCT CGGATGATAT AGGCTATTAC 
AAAGGCCCAA AAACCGTATT TGAAGAATCA GCAAGATATT CTCAAGAAGA GTTGGATTCA 
TTTGCAGGCA AAGAACTTTC CGAACAAATT CCTTTAAGAA GAAAATTTTT ATTAGACGTT 
TTAAAAAAAC ATGAAATCAA TTTAAATGAA ATAGACGCCG TTATCGGCCG CGGCGGGCTG 
TTAAAACATA TTGAAGGCGG CATTTATACA ATTAACGAAG CTATGCTTGC CGATTTAAAA 
AGGGGTTATA ACGGCCATCA CCCGAGCAAT CTGGGCGGTA TTTTGGCGCG TGAAATCGCC 
GAATCTTTGG GCAAACCATG TTTTATAGCG GACCCTGTGG TAGTGGACGA AATGGAGCCT 
CTTGCCAGAT ACACAGGATT TAAAGAAATA AAAAGAAAAT CAATTTTTCA CGCTTTAAAC 
CAAAAACGCG TGGCTATTAC CGCAGCCAAA GAACTGGGCA AAAAGTATAA AGAATGCAAC 
TTTATAGTAA TGCACGGCGG CGGCGGCGTA AGTGTGGGCG CACATAAAAA AGGTAAAGTT 
ATAGACGTGT CTGACGGCTT TGAAGGCGCA GGCCCGATGA CTCCGCAAAG AAGCGGCGTT 
TTACCCAGTT TAGAGCTTGT TGAAATGTGT TTCAGCGGGC AGTATACAAT ACAGGAGCTG 
CGTAAAAAAA TGCGCGGCCG CGGCGGCATG ATAGCGCATA CGGGCACTTC CGATATTGCG 
GATTTATATA ATTATATTTC CTCCGGGAAA AAGAAGCCCG GCTCAACAAT CAATTGTTCA 
AGAGAAGCGG CGCAGGAAGC ATTTGACGCC ATGATTTACC AAATCTCAAA AGAAATAGGC 
GCTATGGCTA CCGTACTTAA AGGGGATGTT GACGCTATTA TTTTAACAGG CGGGCTTGCC 
TATAATGAAT ATTTAGTTAA TATGATAAAG GAAAGAACAG GATTTATTAC GGATAAATTT 
TTTGTGTATC CCGGAGGCGA TGAAAAGGCC GCTTTAAAAG AAGCCGCCGC GCGCGCTTTG 
GAAAACCCTG AAATAATTAA ACAATATAAA TAA

Protein sequence

MEHNILVINP GSTSDDIGYY KGPKTVFEES ARYSQEELDS FAGKELSEQI PLRRKFLLDV 
LKKHEINLNE IDAVIGRGGL LKHIEGGIYT INEAMLADLK RGYNGHHPSN LGGILAREIA 
ESLGKPCFIA DPVVVDEMEP LARYTGFKEI KRKSIFHALN QKRVAITAAK ELGKKYKECN 
FIVMHGGGGV SVGAHKKGKV IDVSDGFEGA GPMTPQRSGV LPSLELVEMC FSGQYTIQEL 
RKKMRGRGGM IAHTGTSDIA DLYNYISSGK KKPGSTINCS REAAQEAFDA MIYQISKEIG 
AMATVLKGDV DAIILTGGLA YNEYLVNMIK ERTGFITDKF FVYPGGDEKA ALKEAAARAL 
ENPEIIKQYK