Gene Emin_0994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0994
Symbol
ID	6262754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1081353
End bp	1082576
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	37%
IMG OID	642611474
Product	major facilitator transporter
Protein accession	YP_001875884
Protein GI	187251402
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.404838
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0000000117748
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAAAATAA AACAATATTA TAATAATATT TTAGGTGAAA ATCTGGGTAG TTTTTTAAAG 
GCCAATATAA TGGCGTTTAT AGGCCTTAAT ATAGGTATTA TCGGCGTTAA CTGGTTTATT 
ATAAACGTTA CGGGGCAAAA CAGGATTTTA GGTGTTTATG GGGCGGTTTC ATTAATAGCG 
TCTTTTTGCG CGTTGCTGTT TTTCGGCTCT CTGGCTGATA AATATAATAA GATAAAAATA 
CTTAAGTTTT GTCTGCTTAT AGAAGCATTT ATTTTTATTG CTGCGGCAGG GCTTAATTAT 
TTGAACTTTC CGGTTATTTT TCTTATTTAC GGTTTGGCTG TGTTAAGCAT GCCTGTTATG 
ATGCTGTATG CGGCGGTTTC CCGCGCCGCT TTGGCGCAAG TTGCTCCCGC GCAAAAACTT 
ATTAAAGGCA ATTCTGTTTT TGAAATAGCA ATACAATGCG GTGCAGTTTT AGCGGCGCTG 
GCTACCGGAT TTATATACCA CGGTTTCGGG TTTAACGTTC TTATGCTTAC CGCCTCTTTT 
ACTTTATTGC TTTCTTACAT TATGTTAGAT GAAGATTTGG CCGGAACGGA TTTAAATTCC 
AAATCTCACG CGGGGAAAAC CTATTTTGAA AATTTAAAAG AAGGTTTGCG GTATTTTAGA 
GAAAATAAAG TTTTGCTGCT GTTTGGTTTA ATAGTGTTTT TCCCAGGTAT AGTTATCGCT 
GCGTCTAATA CTGTTATTCC CGGTTATGTT GAGCAGTTTT TAAAGCAGGA TTCAAGAGTA 
TACGGAGCGG GGGAAATGTT TTTTGCTTCC GGCGCGCTGC TTTCGGGTTT TCTTACAGCG 
TGGGTTTCGT CATTTATAAA AAAAGAACTC CTGCAGTTTG TTTTATTTGT TTTATCTGCC 
GCGGTGCTTT TTAGTTTCTC ATTAAACAGA TTTGTGGCGG GTTTTTATAT CGCGATATTT 
CTAAGCGGTT TGTTTATAGC TTCTTTAAGA ATTATTTTAA ACGCTAAATT TATGGAGCTT 
ACCGGCAAAG AATTTCTTGG GCGCACCATT GTGTTTTTAA CGGCAATTAC AACCGTTTTT 
CAGGCCGCGT TGGTTTATTT TATAGGTTAT TATATGGACG TGTTTAAAGT TACCGACGGA 
TATCTGATTT TAACAATAGT GATTTTGGCG GGATTTGCGG GGGTTTATAT TTTAAAACCG 
GAACAAAAAA AAAGAGAGCC TTAA

Protein sequence

MKIKQYYNNI LGENLGSFLK ANIMAFIGLN IGIIGVNWFI INVTGQNRIL GVYGAVSLIA 
SFCALLFFGS LADKYNKIKI LKFCLLIEAF IFIAAAGLNY LNFPVIFLIY GLAVLSMPVM 
MLYAAVSRAA LAQVAPAQKL IKGNSVFEIA IQCGAVLAAL ATGFIYHGFG FNVLMLTASF 
TLLLSYIMLD EDLAGTDLNS KSHAGKTYFE NLKEGLRYFR ENKVLLLFGL IVFFPGIVIA 
ASNTVIPGYV EQFLKQDSRV YGAGEMFFAS GALLSGFLTA WVSSFIKKEL LQFVLFVLSA 
AVLFSFSLNR FVAGFYIAIF LSGLFIASLR IILNAKFMEL TGKEFLGRTI VFLTAITTVF 
QAALVYFIGY YMDVFKVTDG YLILTIVILA GFAGVYILKP EQKKREP