Gene Emin_0811 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0811
Symbol
ID	6262588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	888331
End bp	889602
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	41%
IMG OID	642611289
Product	hypothetical protein
Protein accession	YP_001875703
Protein GI	187251221
COG category	[S] Function unknown
COG ID	[COG3681] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.000000789442
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACCTGC TTAAAGAAGT TTTAAAAAAC CAAGTTTACC CCGCTATGGG CTGTACGGAA 
CCTGTTTCCG TGGCCTTATG TGCCGCTTAC GCAGCTAAAG AATTGGGCAA ACCCGTGCAA 
AAAGCGGTTT TTTATTTAGA CGCCGGCACA TTTAAAAACG GCCTTGCGGT ACGTATTCCC 
AATACCAGCG GGGAAAGGGG TAATTTACTT GCCGGAACCG CCGGGCTTTT GATAGCAAAA 
CCGCAGTTAA AAATGGAAAT TTTAAAAGCC GCCACACCGT CAATACTTAA GCGCGCCAAA 
CAATTAATAG ACGATAAAAA AGCGTTTATC AAAGTAGCTC CCTGTAAAAA ACACTTTTAT 
ATAAAAGTAG AGGTTGAAAA CGGTAAAGAC AAAGCCTCCT GTGTTATATC GGACAGCCAC 
ACCACGGTCA GCAAATTAAC AAAAAACGGC AAAGTTATTT TTGAAAACAA ACCTTCCAAA 
AAGAAAGAAG ATAATTATAA GCAGCTTTTG GGTAAAGCCA CATTAAAAGA TCTTATAGCA 
CTTGCGGATA ACGCTGACAA CACGGATTTA AAATATATAA AAAAAGGCGT TGAAATGAAT 
TTAAACGCCT GTAAAGAAGG CAAAAAACTA AAAAAAGTAG GCTTTTTTTT AGAAAGCACT 
GTGGAAAAAA GTATTTTGCA AAAAAATCTT GTTACCGAAA CTAAAATAAT GGCCGCCCGC 
GTGGCCGACG CAAGGATGGA CGGCATTGCC GTACCGGTAA TGAGCAGCGG CGAAAGCGGA 
AATCAGGGCG TAGTGGCCAT TTTAGTGCCT TATAACGTGG GTAAAAAATC AAAGGTAAAA 
GAAGAAAAGA TATTAAAAAG CATAGCTTTT TCTCATTTAC TTAACGGATA TGTTAAAGTT 
TATACGGGAA GTCTTTCTCC TCTATGCGGC TGCGCCATAG CCGCGGGAGT CGGCGCCGCG 
GGAGCTATTG TCTACCAGCA AAACGGCGAT TTAAAAAAAA TAACATTAGC CATAAATAAT 
ATTATAAGCG ATATCGGCGG CATGTTATGC GACGGGGCAA AAAGCGGCTG CGCTTTAAAG 
GTGGTAAGCT CCGTTGACAG CGCTATAAGA GCCGCCTATA TGGGCCTTAA CAATTACGGC 
ATTACGGAAC TTGAAGGATT TATAGGTAAA ACAGCCGAAG AAACCATACA AAACCTGGGC 
AATATATCAA TTACCGGAAT GTGCGACGTT GACGCTGTTA TAGTCGATAT AATGAAGAAA 
AAGGTTAAAT AA

Protein sequence

MNLLKEVLKN QVYPAMGCTE PVSVALCAAY AAKELGKPVQ KAVFYLDAGT FKNGLAVRIP 
NTSGERGNLL AGTAGLLIAK PQLKMEILKA ATPSILKRAK QLIDDKKAFI KVAPCKKHFY 
IKVEVENGKD KASCVISDSH TTVSKLTKNG KVIFENKPSK KKEDNYKQLL GKATLKDLIA 
LADNADNTDL KYIKKGVEMN LNACKEGKKL KKVGFFLEST VEKSILQKNL VTETKIMAAR 
VADARMDGIA VPVMSSGESG NQGVVAILVP YNVGKKSKVK EEKILKSIAF SHLLNGYVKV 
YTGSLSPLCG CAIAAGVGAA GAIVYQQNGD LKKITLAINN IISDIGGMLC DGAKSGCALK 
VVSSVDSAIR AAYMGLNNYG ITELEGFIGK TAEETIQNLG NISITGMCDV DAVIVDIMKK 
KVK