Gene Emin_1215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1215
Symbol
ID	6263359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1314373
End bp	1315581
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	43%
IMG OID	642611693
Product	extracellular solute-binding protein
Protein accession	YP_001876102
Protein GI	187251620
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.000245671
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTATTTT GGATGATGCC AGACTCAGGC TCCAACACAA AAAAGGATTT TGAAAACTTT 
TTACTGCCTT TTAAAAAAGC CAACCCCGGC ATTAATATTA AGGTTGAGTA TATTACGCGT 
CATAATTTGT GGAATAAACT TTTTTTACTG AGGTTTGAAA AAAATCCCGG ACAGTTGCCA 
GATATTATTG AAATCCCGCA TACATGGACG CCTGTTTTAA CCGCGTCCGA TTTAATAGAA 
AATCTTTCGG AACTGGAACC TTCTTTAACT GTAAATAAAT ATTTGGCCCC GCTTGTCTCT 
CATTGCTATA AGCAGGGCAC AAAAGATATT TATTCTTTGC CTTGGTGGCT TGATGTTATG 
GCGCTTCACT ACCGCGCGGA CCATTTGGCT ACTGTAAGCA AAAACCCTGA GGCGGACTTG 
GGCACCTGGC AGGGTATGCT TGATATTTGC GCCAGGTTAA AAACGGAGTT CGCGCATGAT 
CCCAACTATT ACCCTATTCA AAACAGCGAC TGGAGGGGAA ACCTTTCCGT AAGAAGTATT 
TTACCTTGCA TTTGGGGCAG AGGTTCGGAC TTGTTTTCGC ATGACGGCTC ACGCTGCAAT 
TTTACGGAAC CCGCTTTTAT AGACGGGCTT GAAGATTATA TTAAACTGGC CGACCGCGGG 
TATCTGCCCG TACTTAGGGA GCGCGGATCT GTAGGAACTA TGGTATCGGG AAGGGCAAGT 
TTGTTTATAA CAAGGCGGCA GGGGTTAAGC ATGTTTGAGG CTACAAAAAC CCCTTTTCAA 
ATTAACACTT TAAATGTTCC CGCCACGGGT AAAGAAAGCG TGTCCTTTTT ATCAGGCATC 
AATTTGGTTA TAACAAAATC AAGCTCTAAA AAAGAAGAGG CCCTTAAATT TTTAAACTGG 
CTTATGACGC GTGAGGCGCA GCTTAAATAC GCCTCGCTTA TGGAAGCTTT CCCGGCGGTT 
GAAGACACTT TTGATGAATT TATTTTCTCC TCCCCCAAGC GTATGGTTAT ATACGCAAAA 
ATTATTGCTA CGGCAAGAAC AATTTCCACA AACATGGTTG CCGCCAGCGC TACAAAAATG 
ATTAATGAGG TGCTTGAAAA GGTTTCTATG GAAATTATTA ACGGGCGTTA CGACAGAGAA 
TTTCTTGAAC GTGAGCTTGT TCCCATATCC AAAGAGGCGG ATTATCTTCT TAATCTGTAC 
GGGGGTTAG

Protein sequence

MLFWMMPDSG SNTKKDFENF LLPFKKANPG INIKVEYITR HNLWNKLFLL RFEKNPGQLP 
DIIEIPHTWT PVLTASDLIE NLSELEPSLT VNKYLAPLVS HCYKQGTKDI YSLPWWLDVM 
ALHYRADHLA TVSKNPEADL GTWQGMLDIC ARLKTEFAHD PNYYPIQNSD WRGNLSVRSI 
LPCIWGRGSD LFSHDGSRCN FTEPAFIDGL EDYIKLADRG YLPVLRERGS VGTMVSGRAS 
LFITRRQGLS MFEATKTPFQ INTLNVPATG KESVSFLSGI NLVITKSSSK KEEALKFLNW 
LMTREAQLKY ASLMEAFPAV EDTFDEFIFS SPKRMVIYAK IIATARTIST NMVAASATKM 
INEVLEKVSM EIINGRYDRE FLERELVPIS KEADYLLNLY GG