Gene Emin_0709 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0709
Symbol
ID	6263447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	783350
End bp	784582
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	42%
IMG OID	642611181
Product	hypothetical protein
Protein accession	YP_001875601
Protein GI	187251119
COG category	[S] Function unknown
COG ID	[COG4198] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.000000000587987
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTACAG TAAAACCTTT TAAAGCGATA AGGCCTAATA AGGATGAAAA GCTTATAGCA 
TCTTTCCCTT ACGACGTAAT AAATTCCGAG GAAGCAAGAC AGATTGCCAA AGGCAACCCG 
CTTTCATTTC TTCATGTTGA AAAACCTGAA ATTGATTTAC CTGAGAATGT GGACCTTTAT 
GACCCAAGCG TCTACGCCAA AGGTAAAGAA AATTTGGAAA AATTTATTTC CGAAGGCATT 
TTAATACAAG AAGATAAACC CTGCTTTTAT TTATACGCCC AAACCATGGA CGGCAGAAAG 
CAGTATGGCT TTGTAGTGGC GGCAAGCACG GCTGAGTACG GGGCGGGCCG CATTAAACGC 
CATGAATTTA CCCGCAAAGA TAAAGAGGCT GACCGCACCC GCCATATCAA CACCATGGGC 
GCTACCACGG GCCCCGTTTT CCTTGCTTAT AAAGACAGTA AAGAGTTAAA CGAAGTAATT 
GAAAGGATTG CCAAAACAAC GCCTATTTAT AACTTTACGG CTGATGACGG CATAGGCCAT 
ACCGTTTGGA AAATAAGCGA TGATAAAGAT ATTATTGATA TAGAAGGCAA GTTTTTCAAA 
CTTCCCAATC TCTATATAGC GGACGGGCAC CACAGGGCGG CCAGCGCTTA TAATACCGCC 
CAATTAAGAA GAGTCGAAAA CCATAAACAT ACAGGGCTTG AAAACTACAA CTTCTTTTTA 
GCGGTAGTTT TCCCCGCTGA ACAACTTTAT ATTATGGATT ATAACCGCGC GGTTAAAGAT 
TTTAACGGTT TAAGCCGGGA CCAGTTTATG GCGGAAGTTG AAAAATGTTT TACCGTAACC 
AAAACTGACA CTAAAAAACC GCAAAATCGC CACGAGTTCG GTATGTATTT AAAAGGGCAG 
TGGTACACGC TTGAAGCTAA AGAAAATATT ATTAACGAAA CCGACCCCAT TAAATGCCTT 
GATGTCAGCA TTTTGCAGGA TAATTTGCTG GGTCCCGTTT TAGGTATTGA CGACCCAAGA 
ACAAGCAAAC GCATTGATTT TATAGGCGGC ATAAGAGGCA CAGCAGAGCT TGAAAAATAT 
GTTAACGAGC TTGGCTACTC GGCAGCGTTT TCAATGTTCC CAACTTCTAT GGACGAACTT 
ATGAAAGTGG CCGACGCAGG CCTTGTTATG CCCCCCAAAA GCACCTGGTT TGAGCCTAAA 
TTAAGAAGCG GGCTTTTAAC TTATAAATAT TAA

Protein sequence

MITVKPFKAI RPNKDEKLIA SFPYDVINSE EARQIAKGNP LSFLHVEKPE IDLPENVDLY 
DPSVYAKGKE NLEKFISEGI LIQEDKPCFY LYAQTMDGRK QYGFVVAAST AEYGAGRIKR 
HEFTRKDKEA DRTRHINTMG ATTGPVFLAY KDSKELNEVI ERIAKTTPIY NFTADDGIGH 
TVWKISDDKD IIDIEGKFFK LPNLYIADGH HRAASAYNTA QLRRVENHKH TGLENYNFFL 
AVVFPAEQLY IMDYNRAVKD FNGLSRDQFM AEVEKCFTVT KTDTKKPQNR HEFGMYLKGQ 
WYTLEAKENI INETDPIKCL DVSILQDNLL GPVLGIDDPR TSKRIDFIGG IRGTAELEKY 
VNELGYSAAF SMFPTSMDEL MKVADAGLVM PPKSTWFEPK LRSGLLTYKY