Gene Athe_1933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1933
Symbol
ID	7407347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2041453
End bp	2042499
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	36%
IMG OID	643716305
Product	arsenical-resistance protein
Protein accession	YP_002573793
Protein GI	222529911
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCAGA AAAAAGGTTT GTCATTTCTG GACAGATTTT TGACAGTTTG GATTTTGCTT 
GCTATGATTG TAGGTGTTCT GATAGGGTAC TTTTTCCCAA ACTTTGCAAA TGTGTTAAAT 
AGACTTAGCA TTGGAACAAC GTCAATTCCA ATTGCTATTG GGTTAATTTT GATGATGTAT 
CCTCCTCTTG CAAAAGTAAG ATATGAAGAG ATAGGAAAGA CAAAAGCAGG TAAAAAACCT 
TTTGGAATAG CAATCTTATA TAACTGGTTT ATAGGACCTA TTGTCATGTT TTTGCTTGCC 
ATCTTGCTTT TGAGAGATTA TCCACATTAT ATGATAGGAG TAATATTGGT AGGCTTGGCT 
CGATGCATTG CAATGGTCCT TGTGTGGAAT GACCTTGCAG ATGGTGACAG GGATTTTGTT 
GCAGGGCTTG TTGCTCTCAA TGCAATCTGG CAGGTTCTGA CCTATTCAGT ACTTGCATAT 
GTGTTTATAA AGATACTTCC TCCACTTTTT GGAATAAGCA CATCTGCAAT TGCTTTGCAT 
ATTTCAATGA AAGAAATAGC AATTTCGGTG TTTATTTATC TTGGTATTCC TTTTATAGCT 
GGAGTATTGA CAAGAATTTT TTTGGTCAGA AAAAACGGCA GAGAATGGTA CGAAAAGAAT 
TTTGTGCCCA AGATAAGTCC AATAACCTTG GTAGCACTGC TTTTTACAGT CATTGTGATG 
TTCTCATTAA AAGGAAAGTA TATTGTTACA CTTCCACTTC ATGTATTGAG AATAGCAATA 
CCACTTTCGC TGTATTTTGT TATAATGTTT TTGATAACAT TCTTTACATC ATATAAAAGA 
AAATATCCTT ATCCTGAGAG TGCAACTGTT GGTCTGACAG CAGCAAGCAA TGACTTTGAA 
CTTGCAATTG CAGTTGCTGT TGCAACCTTT GGTTTAGGGT CTGGTGAAGC CTTTGCAACA 
GTTATTGGTC CTCTGATTGA AGTTCCTGTT ATGCTTCTTT TGGTAAATGT TGCTCTATTT 
TTGAAAAAGA AACTTTATGC TAAATAA

Protein sequence

MEQKKGLSFL DRFLTVWILL AMIVGVLIGY FFPNFANVLN RLSIGTTSIP IAIGLILMMY 
PPLAKVRYEE IGKTKAGKKP FGIAILYNWF IGPIVMFLLA ILLLRDYPHY MIGVILVGLA 
RCIAMVLVWN DLADGDRDFV AGLVALNAIW QVLTYSVLAY VFIKILPPLF GISTSAIALH 
ISMKEIAISV FIYLGIPFIA GVLTRIFLVR KNGREWYEKN FVPKISPITL VALLFTVIVM 
FSLKGKYIVT LPLHVLRIAI PLSLYFVIMF LITFFTSYKR KYPYPESATV GLTAASNDFE 
LAIAVAVATF GLGSGEAFAT VIGPLIEVPV MLLLVNVALF LKKKLYAK