Gene Arth_0212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0212
Symbol
ID	4447337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	221689
End bp	222786
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	65%
IMG OID	639688008
Product	arsenical-resistance protein
Protein accession	YP_829713
Protein GI	116668780
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCACCC AGACCGTCTC TTCGCCCACT CGTGAAGGCG AGGCTGCCGT CGTTGGCAAA 
CTCTCCACCC TGGACCGGTT CCTGCCGGTG TGGATCATCG CTGCCATGGT CCTGGGCCTG 
TTCCTCGGCA GTTTCGTTCC CGGCCTGAAC ACTGCACTTG AAGCAGTCAA GGTGGGCGAA 
GTTTCGCTGC CGATCGCCAT CGGGCTGCTG GTGATGATGT ACCCGGTGCT CGCGAAAGTC 
CGCTACGACC AGGCGCACCG CGTGGTCGGT GACCGGAAGC TGATGATCAC CTCGCTGGTG 
CTGAACTGGC TTCTCGCCCC GGCGTTCATG TTTGCCCTGG CCTGGATCTT CATCCCGGAT 
CTGCCCGACT ACCGTACCGG CCTGATCATC GTGGGCCTGG CCCGCTGCAT CGCCATGGTG 
ATGATCTGGA ACGACCTCGC CTGCGGGGAC CGCGAAGCCG CCGCCGTGCT GGTGGCCATC 
AATTCCGTCT TCCAGGTCAT CGCGTTCGGC GCGCTGGGCT GGTTCTACCT GCAGTTGCTG 
CCGGGCTGGC TGGGCCTGCC CACCACCAGC GCGGACTTCT CCTTCTGGGC CATCACCGCT 
TCCGTCCTGG TCTTCCTGGG GATCCCGCTG CTGGCCGGCT TCCTCACCCG CACAATCGGC 
GAAAAGGCCA AAGGCCGCGC CTGGTACGAA GGAACCTTCC TGCCGAAGCT CGGACCGTGG 
GCGCTGTACG GGCTGCTGTT CACCATCACG CTGCTCTTCG CCCTGCAGGG CGGGACCATC 
ACCTCCCGCC CGCTGGACGT CGTCCGGATC GCCCTGCCCC TGCTGGTCTA CTTCCTGGTG 
GTCTTCGGCG CCGGCATGCT GATCGGAAGG TGGCTGGACC TGGGCTACGC CAAAACCACC 
ACACTGGCCT TCACTGCCGC GGGCAACAAC TTCGAGCTCG CCATCGCAGT GGCGATCGGC 
ACTTTCGGTG TCACGTCGGG GCAGGCGCTG GCCGGCGTCG TCGGACCCTT GATCGAAGTC 
CCCGTCCTTG TTGCACTGGT TTACGTGGCC CTCTGGGCCC GGAAACGCCA CTTCATCACC 
AGCCCCCTTT CCATCTGA

Protein sequence

MSTQTVSSPT REGEAAVVGK LSTLDRFLPV WIIAAMVLGL FLGSFVPGLN TALEAVKVGE 
VSLPIAIGLL VMMYPVLAKV RYDQAHRVVG DRKLMITSLV LNWLLAPAFM FALAWIFIPD 
LPDYRTGLII VGLARCIAMV MIWNDLACGD REAAAVLVAI NSVFQVIAFG ALGWFYLQLL 
PGWLGLPTTS ADFSFWAITA SVLVFLGIPL LAGFLTRTIG EKAKGRAWYE GTFLPKLGPW 
ALYGLLFTIT LLFALQGGTI TSRPLDVVRI ALPLLVYFLV VFGAGMLIGR WLDLGYAKTT 
TLAFTAAGNN FELAIAVAIG TFGVTSGQAL AGVVGPLIEV PVLVALVYVA LWARKRHFIT 
SPLSI