Gene Emin_1071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1071
Symbol
ID	6263834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1166106
End bp	1167134
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	43%
IMG OID	642611551
Product	ankyrin
Protein accession	YP_001875960
Protein GI	187251478
COG category	[R] General function prediction only
COG ID	[COG0666] FOG: Ankyrin repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	88
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA TATATTTTTT GTTAATTTTA CCTTTAGCAG TATTTTCTTA TGCCCAGGCG 
GAAAGCCAAT CTAATCAAAT GCAGTATACT GCTAAAGACG CTAAACAGAT GACGGAAGAT 
CCTTATAAAA CCTATCCCGG TTATCTATTG GGTGAAAGGG ATGGCGTAAA AGGCAGATAC 
GTTTATGACA CTTCTTTAAT CCGTTCCGTA AGAGCGCAAA ACGTTGACAG CGTAAAAACG 
CTTTTACGCG CCAGGGTTGA CCCTAATGAA AAAAATGACG AAGGCTTTAC CCCTTTGATA 
AAAGCGGCTG AAACAGGCAA TTTGGAAATA ATACAACTGC TTGTGGAAGC GGGCGCGGAA 
ATTGATAGTC CGGCTCAATA TGGCATAACG CCTTTAATGG TTGCCGCCGC CGGCGGGCAC 
CACCAGGTTG TTTCTTATTT AATAAATAAA GGCGCAAGCG TGCACAGGCA GGACGTTTTG 
CTTAAAACGC CTCTTGCCCA CGCCGCCGCC GGGGGCAATA AAAAGACGGT AAACATTCTT 
TTAAAAGCGG GCGCCAAAAT TGAGCAAAAA GATAAAAGCG GTGAAACTCC TTTAGTTATA 
GCGCTTAGAA CAGGCAACGA TGGTTCCGCC GCCGCTTTAA TAAATGCCAA CGCTGACTTA 
CAGGCTCCAG CGGGAAGAGA TGTTACCGCT GATTTTTTAG CTGAAAGCTA CGCTGGAAGT 
TCACAGGTGC AAAAAGCCAT AAAGCAGAAA GAAAAAGAAG CTGAAAAAGC CGCTAAAGCG 
GAAGCTAAAA AGGCCGCTAA AGAAGCTAAA TCCGACGTAA GCGCGGTTAA GGCGGACGCC 
TCTAAAACCA AATATATAGG TACGGAAACA ACTTTTAAAA AAGCAGAGGA TATTTCTTTT 
GAAAATAATC TCAGAATATC CGGCAGCACG GAGGATATGA AGCAATATGA AAGGCCCGAC 
GCCGAGATGG ACGAAGGTTT GATTATTGAA AAAGTGCAGC CCATAATTTT AGAAAAGAAG 
AAAAACTAA

Protein sequence

MKKIYFLLIL PLAVFSYAQA ESQSNQMQYT AKDAKQMTED PYKTYPGYLL GERDGVKGRY 
VYDTSLIRSV RAQNVDSVKT LLRARVDPNE KNDEGFTPLI KAAETGNLEI IQLLVEAGAE 
IDSPAQYGIT PLMVAAAGGH HQVVSYLINK GASVHRQDVL LKTPLAHAAA GGNKKTVNIL 
LKAGAKIEQK DKSGETPLVI ALRTGNDGSA AALINANADL QAPAGRDVTA DFLAESYAGS 
SQVQKAIKQK EKEAEKAAKA EAKKAAKEAK SDVSAVKADA SKTKYIGTET TFKKAEDISF 
ENNLRISGST EDMKQYERPD AEMDEGLIIE KVQPIILEKK KN