Gene Emin_0169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0169
Symbol
ID	6264020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	183751
End bp	184773
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	34%
IMG OID	642610632
Product	squalene/phytoene synthase
Protein accession	YP_001875070
Protein GI	187250588
COG category	[I] Lipid transport and metabolism
COG ID	[COG1562] Phytoene/squalene synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000509815
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.0348824
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGAAC AAGAACAAAA GCTGTTAAAT GATTTGTTGA AAAAAACGGC AAGAACGCTT 
GAGTTAAGCG CTAAAGTTTT ACCCTCAGGA TTTAGGGAAA CGTTTAGTAT CGCTTACCTT 
GTATGCCGCT GCGCGGATAC TGTTGCCGAT ACTGATTTAA TAGATTTTGA AAGAAGGCTT 
TTTTGGATAG AACGTTTTCC TGATATTATT AACAAAAATA AATCCGGGGA AATAGAAAAA 
ATAATTAAAG AAGTTTCTTC AGATTCTTTA AAGCAAAACG AAAGATTTCT TTTGCAAAAA 
ATACCGTTTG TAGCCAAAAT ATACGGCATG CTTAATAAAG AAGATAAGGA ACTTGTTTTT 
GATATATTAA AAAAGGTGTG CGAAGGCATG TCTTTTGATT TAAAAACATT CAAGAAAGGC 
GGTCTTACCT GTTTAAAAAC TAAGGAAGAA CTTGAATATT ACTGTGATAC CATGGGCGGC 
GCGCCCGGTG TTTTTTGGAG CAAGCTTATT TTAAAATATA CGCCTGTGGC TTTAGATAAA 
GACTCTTTTA TTAATATGGG GCGCAATGTC GGCCGGGCTT TACAAATAGT AAATGTTTTG 
AGAGATATTA AAGAAGACCT AAATAACGGC AGGTGTTATT TTCCCGAAGA TGAATTAAGA 
ACTGCCGGTG TTAAGCGGGA AGATTTGAAA AATAAAATAC TATCCGAAGA ATTGCTGGAT 
GTTTTAAAAA AATGGATTGT TTGGGGCAGG GATAACATAG GTTCCGGCAG TGCTTTTTAT 
AAAGCCATAC CCGTAAAACA ATGGCAAATA AGAATATCCG TAGCGTGGCC TATGCTGTGG 
AGCCTTGATA GTTTTATCTT GCTTCTTAAA GCACGAAATA CTTTTGGAAA TGAAAAAGCA 
AGAATATCCA AATTTAAAAT TTATATTACT ATTTTGTTAA GCCTCGGGTA TATTATTTCA 
AACAACTTTT TTGATTTTAT GTTTTTCAGA CGGGTTAAAA AAATAGATAG CTTGATTAAA 
TAA

Protein sequence

MNEQEQKLLN DLLKKTARTL ELSAKVLPSG FRETFSIAYL VCRCADTVAD TDLIDFERRL 
FWIERFPDII NKNKSGEIEK IIKEVSSDSL KQNERFLLQK IPFVAKIYGM LNKEDKELVF 
DILKKVCEGM SFDLKTFKKG GLTCLKTKEE LEYYCDTMGG APGVFWSKLI LKYTPVALDK 
DSFINMGRNV GRALQIVNVL RDIKEDLNNG RCYFPEDELR TAGVKREDLK NKILSEELLD 
VLKKWIVWGR DNIGSGSAFY KAIPVKQWQI RISVAWPMLW SLDSFILLLK ARNTFGNEKA 
RISKFKIYIT ILLSLGYIIS NNFFDFMFFR RVKKIDSLIK