Gene Emin_0767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0767
Symbol
ID	6263117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	843772
End bp	845565
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	43%
IMG OID	642611243
Product	hypothetical protein
Protein accession	YP_001875659
Protein GI	187251177
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000133413
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000000000000929658
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGAAAA AATATTTAGC AGGGTTATCA ATAATTTGTC TTTTATCGGG CAACATTTGG 
GCGGCGGAAT CCATGGAAAT GGTTACCTAT TATCCCACAC CTTACGCTGC TTACTCCAAT 
GTTCAGGTTA ACGACACTAA AGTTAACCCT TCTAACGCTT CAGGCGCTAA AGTTAAACTT 
AAAACAGCCG ATATAGGCGT TTTAAAAGTT AATGAAAATT TAACTTCGGA TATTAAAAAA 
GTACAGGCCC AGGCTACAAA AACAGGTAAA AGCACCGCAG CAACGGGTAC ATTGCAAGTT 
GAAGGCGAAT ACCTTAAAAT AGCTTCGGGC GGTATACCGC AGGCGCAGGC TGTAAATATA 
ACAAACTCAG CCACGGGCAA TGCTTACGCG GCAAATACAA TTATGTTAGG CACGGGAACG 
GGGGCAAAAG TATTTCCTTA CGCTAAGGCT GCTGTACCGG GCGCTTCCAA CATGGTATGG 
AGGAGTATTA CTTATTATAT TGACCCTTCG GACCCTTCAA AAGGCAAGGA CACCAAAACA 
TTTTTAGTTA TTGACCAGGG CGCGCCACAA AACGCATGTG AAGATAAATA TGAATCGCAT 
AGTAACGCAC TATGGTCAAG CTATATGCCT GATAAACAAA GCTATTCCTT TGACCAGGCT 
AAAGCGCAAA TAGCAGCAAT GGATACCTGC CCCGATAAAA ACCCTAATAC CGCATATAAA 
TGCGACGGGA CCTTTGAAGG AACTTGTTAT GACATAAGGC ACCGCATACC CGGTAACGGC 
TGGGATCCGC AAAATATCTA TGGTTCCTGG CAGGAAATAC TAATTTGGAA TGACACATGT 
CCCGGTAAAA ATATTGAACA AGAATTTAAC TGTGAGAACA ACGCTACCAA ATCATATTAC 
ATGTGTAACG ATGTGACGCA ATCTCATTAT GTAAATCCTT ACACGGGAAA AATTTGTGAA 
TATAATGATG GAACCTGCAC TGCTGTTAAA AAAGTACGTA CTGTCGTATG CAACGAATTT 
GTTATTGATT ATGAAAGAAC AACCGTAACT TGTTGCGGTT CGGCTTCATG TTCCGCCCCT 
CAGGTGGATG TAAGCGGAGT ATGCAAAACA CCGTGCCCGA CGCTTTGTCC GATAGGGCAG 
ATAAAAACTT TATCTAAATA TACTGAAGAC GGCGAATGCT GCAAAGCGGA CCCGTGCGGC 
GACGGCTTTG TACAATGCCC CGCAACATAC TCTTTTGATA AAGCAACCGG CAAATGCAAC 
CCGTGTATAT CTGTTCCTGG CGGTTTACAA TGCAGAGAAT GTTTTGATCC CTCCAATTGC 
CAGGACCTGT GTTACAACGT TAAAACGGGG GGATTGACAG ATTTATCAAA ATGTATGGAA 
TGTAATTCAG CCGTAACAAC GTGCGACCCT TGTAAGAACA ACCCTTCTTC TACAGAGTGT 
TCCTGCGTTA ACGGAAATTT CAAAGCTTGC GGTTGTTTAA CTTTTGGTTC TGATTCAGCG 
GAATGTAAGT ATGGGGGCGT TATACCCTAT GACAGCCCAT ACTACAGTGT TCCTACGCAG 
GATTGGATGC GCTATATTAT TAACCAACAA AAAGCTAGAC TTACCTGTAA AGAGTATTGC 
AGTATGGATG GCGGATATAC GCTTAACTGC CCATGCGGAA CAAGAGGAGG ATACTATAAA 
TTTACAACAA ATCCGGAATC AGGTACAGAT GTCAGGCTTC AAGGAGTCTT AACATGCTGC 
AAATCTGACC CTTTTCCTAT TGGAGGCGGG TTGGGCTGCG CCTCAGGCTA TTAA

Protein sequence

MKKKYLAGLS IICLLSGNIW AAESMEMVTY YPTPYAAYSN VQVNDTKVNP SNASGAKVKL 
KTADIGVLKV NENLTSDIKK VQAQATKTGK STAATGTLQV EGEYLKIASG GIPQAQAVNI 
TNSATGNAYA ANTIMLGTGT GAKVFPYAKA AVPGASNMVW RSITYYIDPS DPSKGKDTKT 
FLVIDQGAPQ NACEDKYESH SNALWSSYMP DKQSYSFDQA KAQIAAMDTC PDKNPNTAYK 
CDGTFEGTCY DIRHRIPGNG WDPQNIYGSW QEILIWNDTC PGKNIEQEFN CENNATKSYY 
MCNDVTQSHY VNPYTGKICE YNDGTCTAVK KVRTVVCNEF VIDYERTTVT CCGSASCSAP 
QVDVSGVCKT PCPTLCPIGQ IKTLSKYTED GECCKADPCG DGFVQCPATY SFDKATGKCN 
PCISVPGGLQ CRECFDPSNC QDLCYNVKTG GLTDLSKCME CNSAVTTCDP CKNNPSSTEC 
SCVNGNFKAC GCLTFGSDSA ECKYGGVIPY DSPYYSVPTQ DWMRYIINQQ KARLTCKEYC 
SMDGGYTLNC PCGTRGGYYK FTTNPESGTD VRLQGVLTCC KSDPFPIGGG LGCASGY