Gene Emin_0921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0921
Symbol
ID	6262623
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1020784
End bp	1022439
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	43%
IMG OID	642611400
Product	PTS system, glucose-like IIB subunint
Protein accession	YP_001875811
Protein GI	187251329
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific [COG1264] Phosphotransferase system IIB components
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000171728
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	9.61967e-19
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGTCTGAAA ACGGTATTAT AAGCAAAGTT TTTACTGTAT TGCAAAAAGT AGGCCGTTCG 
TTTTTCCTGC CCATATCAAT TCTTCCCGTA GCCGGGCTTT TGCTGGGCAT CGGGGCGTCA 
TTTTCCAATA TGGCAACGGT TGCGGATTAC GGCCTTGAAA GTATAATGGG CGCGGGTACG 
TTTCTCAACT ATACTTTTAT AATTATGAGC GCGGTGGGCG GCGCAGTTTT CGCTAACCTG 
CCTTTAATTT TCGCCATGTC GGTAGCTTTG GGCATGGCCA ATGAAGAAAA AGCGGTCGCC 
ACATTATCGG CGGCCATTTC TTTTATTATC ATGCACGTTA CAATAAGCAA AATGCTTTTG 
TTTACAGGCT ATATTCTGCC CGACGGCGCC CTGGCCGAAA AAGTTGTGGC GGGAACCATA 
GGCACGGTAC TTGGCATACA ATCGCTTGAA ATGGGCGTGT TCGGCGGTAT CGTGGTAGGC 
TTGGGCGTGG CCGCTTTACA TAATAGATTT TACAAGATAG AGTTGCCCGT GTTTTTATCT 
TTTTTCGGCG GTATAAGATT TGTGCCTATT ATATGCACAT TTGTGTTTCT TTTGGTCGGC 
GCAGGTTTCT TTTTTGTATG GCCGCCTATA CAAAAGTTAA TTTTGGCAAG CGGGCAGCTG 
GTTATTAAAT CGGGCTATTT TGGCTCGTTT ATTTACGGTT TTATGGAACG CGCTTTAATA 
CCCTTCGGCC TGCACCACGT TTTTTATATG CCTTTCTGGC AGACGGGACT TGGCGGAGCG 
CAGTTAATAG ACGGCGTTAT GGTATATGGC GCGCAGAATA TCTTCTTTGC GGAGCTGGCT 
TCCCCCAACA CACAGCACTT TACAATTGAA TCGGCCAGGT TCTTAACCGG CAAATACCCA 
TTTATGATAG CGGGTCTTCC CGGTGCGGCG CTTGCCATGT ACCACACAGC TAAAACCCAT 
AAAAAGAAAC TTGTGGGCGG GCTTTTGTTC TCAGCCGCTT TAACTTCTTT TTTAACAGGT 
ATTACCGAAC CAATTGAGTT TACATTCCTC TTTGTTGCGC CGGTTGTATT TATTATACAC 
TGCGGCTTTG CCGGCATAGC GTTTGTTCTT ACTCATTTAT TACAAATAGC TGTCGGAACC 
ACGTTTTCCT GCGGATTTAT AGACCTTACC CTTTACGGTA TTTTGCAAGG ACACGCGAAA 
ACAAACTGGA TGTGGCTTAT ACCCATATTT ATAGTTTATT TTATAGGTTA TTATTTCTTT 
TTCAGGTTTG TTATAACAAA ATGGAATCTT ATGACCCCCG GCAGAGAACC TGACGAACAA 
GACACAAAAC TTTACACAAA AGCAGATTAC CAGGCCAAAC AGCAAGACGG TAAAAGTGAA 
ACAACCCCGT CGGCAGCACT GCCCGCTTCT AAAGACGAGC AGCTTGAAAC CATATTACAA 
GGTTTGGGCG GTAAGGATAA TATTGAAAAT CTTGACTCTT GCGCCACAAG ATTAAGACTT 
AATGTTAAAG ACCCCTCTTT AGTTAATAAA GATTTATTAA AAAAAGGCGG AGCTTTGGGC 
GTGCTTTTAA AAGGCAACGG ATTACAGGTA GTATTCGGGC CTAAAGTAAG TTCAATCAAA 
CCTAAGCTTG AAGAATATAT AAATAAAATG AGATAG

Protein sequence

MSENGIISKV FTVLQKVGRS FFLPISILPV AGLLLGIGAS FSNMATVADY GLESIMGAGT 
FLNYTFIIMS AVGGAVFANL PLIFAMSVAL GMANEEKAVA TLSAAISFII MHVTISKMLL 
FTGYILPDGA LAEKVVAGTI GTVLGIQSLE MGVFGGIVVG LGVAALHNRF YKIELPVFLS 
FFGGIRFVPI ICTFVFLLVG AGFFFVWPPI QKLILASGQL VIKSGYFGSF IYGFMERALI 
PFGLHHVFYM PFWQTGLGGA QLIDGVMVYG AQNIFFAELA SPNTQHFTIE SARFLTGKYP 
FMIAGLPGAA LAMYHTAKTH KKKLVGGLLF SAALTSFLTG ITEPIEFTFL FVAPVVFIIH 
CGFAGIAFVL THLLQIAVGT TFSCGFIDLT LYGILQGHAK TNWMWLIPIF IVYFIGYYFF 
FRFVITKWNL MTPGREPDEQ DTKLYTKADY QAKQQDGKSE TTPSAALPAS KDEQLETILQ 
GLGGKDNIEN LDSCATRLRL NVKDPSLVNK DLLKKGGALG VLLKGNGLQV VFGPKVSSIK 
PKLEEYINKM R