Gene Emin_1522 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1522
Symbol
ID	6263570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1613492
End bp	1614946
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	47%
IMG OID	642612009
Product	F0F1 ATP synthase subunit beta
Protein accession	YP_001876406
Protein GI	187251924
COG category	[C] Energy production and conversion
COG ID	[COG0055] F0F1-type ATP synthase, beta subunit
TIGRFAM ID	[TIGR01039] ATP synthase, F1 beta subunit

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000415981
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	2.83591e-17
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATACGG GTATAGTTAC ACAGGTTATC GGCCCTGTTA TTGATATTGA GTTTAAAGAC 
GGCGCGTTGC CTAAGATTAA TAACGCCGTG GAAATCAAAT TCGGCGAACA AAAAATCGTG 
GCTGAAGTTG CCCAGCAGCT TGGAGACAAT ACTGTAAGAG CAGTGGCTCT TTCCCCGACA 
GACGGTCTTG CTCGCGGCGT AGAAGCCGTT GACACAGAGG ACGTATTGAG AGTCCCCGTC 
GGTGAAGGCT GCAGAGGCAG ACTTATGAAC GTATTGGGCG CCCCCATAGA TTACGCGGGT 
GAAATAAAAA CCGATAAAAA GATGCCTATT CACCGCGAGC CGCCTACTCT TGAAGAACAG 
AAAACCACGC CCGAAATTTT TGAAACTGGT ATTAAAGTAG TTGACCTTTT GGCCCCTTAC 
ATGAAAGGCG GCAAAGTAGG TTTATTCGGC GGCGCCGGCG TAGGAAAAAC AGTTCTTATT 
ATGGAGCTTA TTAACAACGT TGCCCGCGAG CACAGCGGCA GCTCAGTGTT TGGCGGCGTG 
GGGGAAAGAA GCCGTGAAGG CAACGACCTG TGGTTAGACA TGAAAGGAGC GGAACTTGCC 
GACGGCAGCA CCGTTTTAGA TAAAACAGTT TTAGTTTTCG GACAGATGAA CGAACCCCCG 
GGCGCGAGAG CGAAAGTAGC TTTAACAGCC TTAACACAGG CCGAATACTT CAGAGATGAA 
AAAGGACAGG ACGTGCTGTT GTTTTTAGAT AATATTTTCC GCTATGTTTT GGCCAACTCC 
GAAGTTTCCG CCCTTCTCGG GCGTATGCCT TCGGCCGTAG GTTACCAGCC CACTCTTAAT 
ACGGAAATCG GACAGTTGCA GGAACGTATT ACATCAACAA ACAAGGGTTC TATTACCTCA 
ATTCAAGCCG TTTACGTGCC CGCTGACGAC TTGACTGACC CTGGCGTAGC CTCCACATTT 
ACCCACTTGG ATGCCACTAC CGTTTTGTCC CGCTCTTTAG TTGAGCTAGG CATTTATCCC 
GCTGTTGATC CTTTGGAATC AACTTCCAGA ATTTTAGACC CCAGAGTATT GGGTGAAGAA 
CATTACCAAG TGGCGCAAGG CGTACGCAAA ATTTTACAAA GATATAAAGA TTTGCAAGAT 
TTAATCGCTA TTTTAGGTAT TGACGAACTT GGCGACGAAG ATAAAAAGAT TGTAGCTAGA 
GCAAGAAGAA TACAGCGCTT TTTATCGCAG CCTTTCTTCG TGGGCGAAAA GTTTACCGGC 
AGGCCGGGCA AGTATGTTAA ACTTGAGGAC ACCATTAAAG CTTTTAAAGG TTTAATAAAC 
GGCGATTATG ACAATATTCC CGAACAGGCA TTCTTTATGT GCGGCGGTAT AGAGGACGTT 
TTGGCTAAAG TAAGCAAAGG CGAAAACGAA GAGAAATCTG AGCCCGCCAA ACCCGCTAAA 
GAAGAAAAAA GATAA

Protein sequence

MNTGIVTQVI GPVIDIEFKD GALPKINNAV EIKFGEQKIV AEVAQQLGDN TVRAVALSPT 
DGLARGVEAV DTEDVLRVPV GEGCRGRLMN VLGAPIDYAG EIKTDKKMPI HREPPTLEEQ 
KTTPEIFETG IKVVDLLAPY MKGGKVGLFG GAGVGKTVLI MELINNVARE HSGSSVFGGV 
GERSREGNDL WLDMKGAELA DGSTVLDKTV LVFGQMNEPP GARAKVALTA LTQAEYFRDE 
KGQDVLLFLD NIFRYVLANS EVSALLGRMP SAVGYQPTLN TEIGQLQERI TSTNKGSITS 
IQAVYVPADD LTDPGVASTF THLDATTVLS RSLVELGIYP AVDPLESTSR ILDPRVLGEE 
HYQVAQGVRK ILQRYKDLQD LIAILGIDEL GDEDKKIVAR ARRIQRFLSQ PFFVGEKFTG 
RPGKYVKLED TIKAFKGLIN GDYDNIPEQA FFMCGGIEDV LAKVSKGENE EKSEPAKPAK 
EEKR