Gene Achl_3304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_3304
Symbol
ID	7294785
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	3662296
End bp	3663666
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	64%
IMG OID	643591714
Product	General substrate transporter
Protein accession	YP_002489353
Protein GI	220914044
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCACG AAACAACACC GCCCCAGGCG GGAGTCATCG CCAAGGATGC CGATGGTTCC 
GCCCTGGCAG GCGGCGGCGT TAGTCCCCTA ACGCCCAGCA AGGACGTACG ACGCCGGGTG 
GTTACCGCAA GCTTTATCGG CAACTTCGTC GAATGGTTCG ATTACGCCGT CTACGGCTAC 
CTCGCCGCCG TCATCTCATC GGTCTTCTTC CCGGAAGCGG AACGGCAGAC AGCGCTGCTG 
GCCACCTTTG GCGTCTTCGC AGTCTCGTTC TTCGTCCGGC CGCTGGGCGG ATTTGTCTGG 
GGCCACATCG GCGACAAGCT CGGCCGGCGG AAGGCCCTGT CCTTGTCCAT CGTCATCATG 
TCCGTCTCAA CGTTCTGCAT CGCGCTGATT CCCGGCTACG CATCCATCGG GCTGATGGCT 
CCGGTCCTGC TCCTCCTCGT CCGCATCGTC CAGGGCTTCT CAGCAGCCGG CGAGTATGCG 
GGCGCCTCGG CCTTCCTGGT GGAGTACGCC CCGGCGAACC GGCGCGGCCT CTATGCAGCA 
GTGGTTCCGG CCAGCACCGC AGCCGGCCTG CTCCTGGGCT CCCTTATCGC AGCGCTCCTG 
AGCTCGGTAC TCACCGCGGA CCAGCTGCAC GAGTGGGGAT GGCGGCTGCC GTTCCTGCTG 
GCTGCCCCCA TGGGCCTCAT CGGACGCTAC ATCCGCACCA AACTCGAGGA CACCCCGGCC 
TTCCGGGAAT TGGCTGCGAA GGAAGGCACC GAAGAGAAGG CCCCCGCGCT GGCCATGTTC 
AAGACCTACC GGAAGCAGCT CGTCATCGCC TGCGGCGCGG TGATGCTCAA CGCCGTTGGC 
TTCTACGTCA TCCTCAGCTA CATGCCCACC TACCTTTCCG AGGAACTGGG CTTCGGCCCC 
ACCGAGTCCT TCCTGGCCAC CACCATTGCC CTGGCCAGCT ACATCGGGTT CATCTTCCTT 
ACCGGCATGG CCTCGGACGT CTTTGGCCGC AAGCGGATGC TCATCACGGC ATCCATCCTT 
TTCATGGTCC TTACCGTTCC GGCGTTCATG CTGCTGGAAA CCGGTGATTT CCTGGTCATC 
GTCCTGGTCC AGATCCTCCT GGGCGGCATG CTCACACTGA ACGACGGAAC ACTGCCGAGC 
TTCTTGGCCG AGCTGTTCCC CACCAAGGTC CGCTACAGCG GGTTCGCCGT CAGCTTCAAC 
CTCTCCAACG CCCTCTTCGG CGGGACCGCG CCGTTCATGG CCACCCTGCT GATCGCCATG 
ACCCAGAGCA AGATCGCCCC GGGCTGGTAC CTGGTGGCGG CTTCAGCGGT GTCCCTGGCG 
GCAGTCCTGT TCGCCACTGA GACGTCGCGA AAGCCCCTGA AGCACCTCTA A

Protein sequence

MSHETTPPQA GVIAKDADGS ALAGGGVSPL TPSKDVRRRV VTASFIGNFV EWFDYAVYGY 
LAAVISSVFF PEAERQTALL ATFGVFAVSF FVRPLGGFVW GHIGDKLGRR KALSLSIVIM 
SVSTFCIALI PGYASIGLMA PVLLLLVRIV QGFSAAGEYA GASAFLVEYA PANRRGLYAA 
VVPASTAAGL LLGSLIAALL SSVLTADQLH EWGWRLPFLL AAPMGLIGRY IRTKLEDTPA 
FRELAAKEGT EEKAPALAMF KTYRKQLVIA CGAVMLNAVG FYVILSYMPT YLSEELGFGP 
TESFLATTIA LASYIGFIFL TGMASDVFGR KRMLITASIL FMVLTVPAFM LLETGDFLVI 
VLVQILLGGM LTLNDGTLPS FLAELFPTKV RYSGFAVSFN LSNALFGGTA PFMATLLIAM 
TQSKIAPGWY LVAASAVSLA AVLFATETSR KPLKHL