Gene Arth_3540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3540
Symbol
ID	4443763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3978445
End bp	3979836
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	67%
IMG OID	639691364
Product	major facilitator transporter
Protein accession	YP_833015
Protein GI	116672082
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAACG TCCCAGTTCA GGCTTCCGGC GCAGCGCCGC GCCCGGGCAA GCCGATGCAC 
CCGAAGGGCC TGTATAAGGC CTTTGCCGCA AGCCTTACCG GCACCGCACT CGAGTGGTAC 
GACTTCGCCG TCTACTCAGC CGCAGCCGCC GTCGTATTCC CCATCGTCTT CTTCCCGTCA 
TCCGATCCCC TGACCGGCAC CATCCTGGCG TTTTCAACCT ACGCTGTGGG CTACGTTTCC 
CGCCCCGTGG GCGGCATCAT CTTCGGCCGG CTCGGCGACC GGATCGGCCG CAAGAAGGTC 
CTGGTCACCA CCCTCATGAT CATCGGCGTG GCCACCGTGC TGATCGGCGT GCTTCCCGGG 
TACGGCAGCA TCGGCATCAC CGCCCCGATC ATCCTGGTGC TGCTGCGCTT CGCCCAGGGC 
GTGGGCGTAG GCGGCGAATG GGGCGGCGCC GTGCTGCTCT CCAGCGAATA CGGGGATCCC 
CACCGGCGCG GCTTCTGGGC ATCCGCCGCC CAGGTGGGCC CTCCCGCCGG CAACCTCATG 
GCGAACGGCG CGCTGGCCGT CCTGACCCTC ACCCTGACCG AAGAGCAGTT CATCAGCTTC 
GGGTGGCGCA TCGCCTTCCT GGTCTCGGCC GTGCTGGTCG GATTCGGGCT CTGGATCCGG 
CTCAAGCTGG AAGACACTCC GATCTTCAAG GCCATTGAGG CCCACGGCGA ACAGCCCAAC 
GCCCCGGTCC GGGAGGTCTT CAGCAAGGAA CTCCGGCCGC TCATCGCCGC CACGCTGTGC 
CGGGTTGGTC CTGACGTGCT CTACGCCCTG TTCACCGTCT TCACCCTTAC CTATGGCATC 
CAGGCCCTCG GCTACGAGCG CAGCCAGGTC CTCACCGCTG TGCTGATCGG CTCCGCATTC 
CAGCTGTTCA TGATCCCGCT GGCCGGCGCC GTATCGGACC GCTTCAACCG CCGCCTGGTC 
TACGGCACGG CCGCGGTGCT GGGCGCCGTC TGGACATTCA TCTTCTTCGG CATCCTCGGC 
GGAGACAATG AGCCGATGCT GATCGCGGGC ATCGTCCTGG GCCTCATGGC ACACTCATTC 
ATGTACGGAC CGCAGGCCGC CTTCATTGTG GAGCAGTTCT CCCCCAGGCT CCGGTCCACC 
GGAAGTTCGC TGGCATACAC CTTCGCCGGC GTGATCGGCG GCGCGATTGC CCCGCTGATG 
TTCACGCTGC TGCTGTCCCA GTTCGGCACC TGGATTCCGG TGGCCATCTA TGTTGCCGTG 
GCCGCCGCCG TCACCGCAGT AGGCCTGGCG CTCGGCCGGG ATTCCAACAC AGTGGAGGAC 
GAGGACTACC GCCTGCTGCT CGAAGGATCC GCAGCAGCGC GCCAGCCGTC CGCCGTCGCG 
GAATCCCGCT GA

Protein sequence

MANVPVQASG AAPRPGKPMH PKGLYKAFAA SLTGTALEWY DFAVYSAAAA VVFPIVFFPS 
SDPLTGTILA FSTYAVGYVS RPVGGIIFGR LGDRIGRKKV LVTTLMIIGV ATVLIGVLPG 
YGSIGITAPI ILVLLRFAQG VGVGGEWGGA VLLSSEYGDP HRRGFWASAA QVGPPAGNLM 
ANGALAVLTL TLTEEQFISF GWRIAFLVSA VLVGFGLWIR LKLEDTPIFK AIEAHGEQPN 
APVREVFSKE LRPLIAATLC RVGPDVLYAL FTVFTLTYGI QALGYERSQV LTAVLIGSAF 
QLFMIPLAGA VSDRFNRRLV YGTAAVLGAV WTFIFFGILG GDNEPMLIAG IVLGLMAHSF 
MYGPQAAFIV EQFSPRLRST GSSLAYTFAG VIGGAIAPLM FTLLLSQFGT WIPVAIYVAV 
AAAVTAVGLA LGRDSNTVED EDYRLLLEGS AAARQPSAVA ESR