Gene GWCH70_3147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_3147
Symbol
ID	7977002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	3175150
End bp	3176775
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	47%
IMG OID	644799933
Product	drug resistance transporter, EmrB/QacA subfamily
Protein accession	YP_002951072
Protein GI	239828448
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAAG TAAATGAGTT TGAAATGCAA TCGAACACCG TTCGGCATCG AAAGATATTA 
ATTACTGGCC TTATGATTGC CATGCTTTTT GGAGCATTGG AAGGAACGAT CGTCGGAACG 
GCGATGCCGC GCATCGTTGG AGAGCTTGGA GGATTAAGTT TAATGATATG GCTGACGACC 
GCTTATATGT TGACATCGAC CACGATCGTG CCGATTGCCG GAAAACTTGC GGATTTATTA 
GGCAGACGAG TCATTTATGT GACAGGACTC GTCATTTTTA TGGTTGGCTC CGCTCTTTGC 
GGCATGGCGG ATAATATGAC AGAGCTCATT ATTTACCGCG GACTGCAAGG AATCGGCGGG 
GGAATTATGA TGCCGATGGC AATGATCGTC ATCGGAGATG TGTTTACGGG AAAAGAACGT 
GCGAAATGGC AAGGGGTTTT CGGTGGATTA TACGGCCTTG CCTCCGTCAT CGGCCCGCAA 
GTTGGCGGTT TTATCGTCGA CCATTTAAAT TGGCGCTGGG TATTTTACAT TAATCTTCCT 
GTCGGGATTT TAGCAACCAT TTTTATTGCG ATGGGATTGA GCAAATATAA AGCCGAGGGG 
CCAGTGAAAT TTGATCTTGC CGGGATGTTT ACGATGGTTG TCGGCGTGGT TAGCCTGCTT 
TTAGCGTTAA CGTTTGGCGG GGATAAGTAT GAATGGACAT CATGGCAGAT CTTCACGTTA 
TTTGCCGTGG CACTCGTCTT TTTAACGCTG TTTGTATTTG TAGAGAGAAA AGCGGAAGAA 
CCGATTTTGC CGATGCATTT ATTTAAACAC CGCACGTTTA CCGTGCTCAA TGGCATCGGG 
TTTTTAATGA GCATCGGCAT GTTTGGCGCG ATTATGTTCG TTCCGTTTTT TATGCAAGGA 
GTGGTCGGAG TAAGCGCAAC CCAGTCCGGC ACAATTATGA CGCCGATGAT GATTACGATG 
ATTATCGGAA GCGTCATTGG CGGCCGAATC GTTTATAAAA TCGGCGTAAA ACCGCAGCTG 
ATGATCGGTA TGGCTATTAT GGCGGCAGGG TTCGGTTTAT TAAGCACGAT GGATGTGGAT 
ACGTCCAAAT GGACGGCCAC GTTGTATATG ATCATTTTAG GGCTTGGAAT GGGGTTAGTG 
ATGCCGATTT TAACGCTCGC TTTGCAAGAG AGTTTTCCAA AGTCGGAGCT TGGCGTCGTC 
ACTTCCTCAA GCCAATTTTT TCGTTCGATC GGCGGGACGT TCGGAATGAC GATTTTAGGG 
GCGATTATGA ACCATCGATC GAGCCAGCTG CTTGACGACC GCCTCATGCC AATGCTTCAG 
TCGCTTCCGG TGCAAGCAAA AGGAATGGTG GACCGGTTTG CCCATATGAT TCATGATGAT 
CCGCAAGGGC TTTATTCGAT TTTGCTTAGC CCGGAGGCCT TAGAGAAAAT ACCGCCGCAA 
ATGAGAGAGA CGTTTGTGCC GATTTTAAAA CAGTCGCTCG TGGATTCGCT TCATTCGGTT 
TTCCTATTTG GACTTATTTT TGTCATTGGT GGAACAGTGC TCGTATTTGG GTTGAAGAAT 
ATCAAGCTAT CTGATAGACA ACAGTTGCAA GAAATGGCCG AAAAGGAAAA ACTGCCGCAG 
AGCTAA

Protein sequence

MEQVNEFEMQ SNTVRHRKIL ITGLMIAMLF GALEGTIVGT AMPRIVGELG GLSLMIWLTT 
AYMLTSTTIV PIAGKLADLL GRRVIYVTGL VIFMVGSALC GMADNMTELI IYRGLQGIGG 
GIMMPMAMIV IGDVFTGKER AKWQGVFGGL YGLASVIGPQ VGGFIVDHLN WRWVFYINLP 
VGILATIFIA MGLSKYKAEG PVKFDLAGMF TMVVGVVSLL LALTFGGDKY EWTSWQIFTL 
FAVALVFLTL FVFVERKAEE PILPMHLFKH RTFTVLNGIG FLMSIGMFGA IMFVPFFMQG 
VVGVSATQSG TIMTPMMITM IIGSVIGGRI VYKIGVKPQL MIGMAIMAAG FGLLSTMDVD 
TSKWTATLYM IILGLGMGLV MPILTLALQE SFPKSELGVV TSSSQFFRSI GGTFGMTILG 
AIMNHRSSQL LDDRLMPMLQ SLPVQAKGMV DRFAHMIHDD PQGLYSILLS PEALEKIPPQ 
MRETFVPILK QSLVDSLHSV FLFGLIFVIG GTVLVFGLKN IKLSDRQQLQ EMAEKEKLPQ 
S