Gene Arth_0104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0104
Symbol
ID	4447437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	105694
End bp	107196
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	65%
IMG OID	639687899
Product	sulphate transporter
Protein accession	YP_829605
Protein GI	116668672
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCCCG AACAACTCCA ATCCGTCCGG GCTACGCTCC GTTCCCCGCG CCGGCTCAAG 
ACGGAAGCCC TCGCCGGACT GGTGGTGGCG CTGGCGCTCA TCCCGGAGGC GATTGCGTTC 
TCCGTCATTG CAGGCGTTGA TCCCCGGATC GGGCTGTTCG CGTCCTTCAC CATGGCCGTC 
ACGATTTCCT TCGTGGGCGG CCGGCCCGCC ATGATCTCCG CGGCCACCGG CGCGGTGGCC 
CTGGTGATCG CACCGCTGAT GCGGAGCCAC GGCCTGGACT ACCTGATCGC CGCAGTGATC 
CTGGCGGGGG CCTTCCAGAT CCTCCTGGCG CTCCTGGGCG TCACCAGGCT CATGCGCTTC 
ATTCCGCGGT CAGTGATGGT GGGGTTCGTT AACGCGCTGG CCATCCTGGT GTTCATGGCT 
CAGCTGCCCG AGCTGATCAA CGTGCCGTGG CTGGTCTACC CGCTCGTGGC CGTTGGCCTG 
GTGATCGTGA TTGGACTCCC GCGGCTCACG TCAGCAGTAC CGTCCCCGCT CGTGGCGATC 
GTGGCCCTGA CGCTGTTTGC GGTGCTCGCC AAGATCGACG TTCCCGCCGT CCAGGACAAG 
GGCCAGCTTC CGGAAAGCCT GCCCACCCTT TTCATTCCCA ACGTGCCGCT GACGCTGGAA 
ACCTTCCAGA TCCTCGCCCC CTTCGCGCTG TCCATGGCGC TTGTGGGCCT GCTCGAATCC 
CTGATGACGG CGAAGCTTGT CGACGACATC ACGGACACCC GCTCGAACAA GACCCGCGAG 
TCCTGGGGCC AGGGCGTGGC GAACATCGTC ACCGGCTTCC TGGGCGGCAT GGGCGGCTGC 
GCCGTGATCG GCCAGACCAT GATCAACGTC AAGGGATCCG GCGCCCGGAG CAGGGTCTCT 
ACGTTCCTGG CCGGCGTCTT CCTGCTGGTC CTGGTGGTGG CGCTGGGCGA CGTTGTGGGC 
CTGATACCCA TGGCAGCGCT CGTGGCCGTG ATGATCTTCG TCTCCGCCAT CACGTTCGAC 
TGGCACTCCA TCGCCCTGAA GACGCTCAGG CGGATGCCCA AATCCGAAAC AGCCGTCATG 
TTGATCACGG TGGGCACCGT GGTGGCCACC CACAACCTGG CCATCGGAGT AGGCGTCGGC 
GTCCTGGCGG CCATGGCCAT GTTTGCCCGG CGGGTGGCGC ATTTCGCCAC GGTTGAACGG 
ACGGAGATCG AGCTCAATGG CGAGACCGTG GCAACGTACA CCGTGGACGG AGAGCTCTTC 
TTCGCCTCCT CCAACGACCT CTACACCCAG TTCGAGTACG CCCGCGATGC CGCACCCACG 
GTGGACCGCG TCATCATCGA TTTGCATGCC TCGCACCTGT GGGACGCATC CACGATCGCC 
GTCCTGGACG CTGTCACCGA GAAGTACCGC AGGCACGGCC GTGAAGTGGA GCTGATCGGC 
CTGAACTCCG CGAGCACCCA GATGCGTGAG CGGCTCGCCG GAAAGCTCAA CGCCGGGCAC 
TGA

Protein sequence

MKPEQLQSVR ATLRSPRRLK TEALAGLVVA LALIPEAIAF SVIAGVDPRI GLFASFTMAV 
TISFVGGRPA MISAATGAVA LVIAPLMRSH GLDYLIAAVI LAGAFQILLA LLGVTRLMRF 
IPRSVMVGFV NALAILVFMA QLPELINVPW LVYPLVAVGL VIVIGLPRLT SAVPSPLVAI 
VALTLFAVLA KIDVPAVQDK GQLPESLPTL FIPNVPLTLE TFQILAPFAL SMALVGLLES 
LMTAKLVDDI TDTRSNKTRE SWGQGVANIV TGFLGGMGGC AVIGQTMINV KGSGARSRVS 
TFLAGVFLLV LVVALGDVVG LIPMAALVAV MIFVSAITFD WHSIALKTLR RMPKSETAVM 
LITVGTVVAT HNLAIGVGVG VLAAMAMFAR RVAHFATVER TEIELNGETV ATYTVDGELF 
FASSNDLYTQ FEYARDAAPT VDRVIIDLHA SHLWDASTIA VLDAVTEKYR RHGREVELIG 
LNSASTQMRE RLAGKLNAGH