Gene Achl_3124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_3124
Symbol
ID	7294604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	3470594
End bp	3471883
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	62%
IMG OID	643591534
Product	extracellular solute-binding protein family 1
Protein accession	YP_002489174
Protein GI	220913865
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0621948
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCAACA GAAGGCATTT CCTTACAACC GTAGCCGTCG GCACCGCATC TGCCGGCGTA 
CTGGCGGCCT GCGGAACCGG ATCCAGCACC TCAGGACAGA CCGGTTCGGC GGACAACCCC 
GTCACCATCA ACTACACCTG GTGGGGCAAC GACGACCGCG CCGAGCGCAC CCGCAAGGCC 
ATTGCATTGT TCGAATCCAA GAACCCGGAC ATCAAGGTCA ACGGCAACTT CACCGACTTC 
GCCGGGTACT GGCAGAAGCG TGCCACCGAA GCTGCCGGCG GTGGCCTGCC CGACGTGATG 
CAGTGGGACC TGTCCTACCT GCGCGACTAC GGCCAGCGCA ACCAGCTGCT GGACCTGGGT 
ACGGTCAAGA TCAATACGGA TGCCTTCGAA AAGTCCCTGC TGCCTTCCGG CCAGATCAAG 
GGCAAGACCT ACGGAATCCC CACCAGCACC AATGCCTTCG CCGTCTACTA CGACCCCGCC 
AAGCTGGCCT CCCTGGGTAT CGCCGAGCCG GACGGAAGCT GGACCTACAA GGAATTCAAC 
GCCTTCCTCA CCGAGGTGGG CAGCAAGAGC AACGGCGCCC TCTTCGGCGG CACCGACTAC 
ACGGGCGTCT GGTGGATGTT CAACGTCTGG CTGCGGCAGA ACAACATCGA AGCCTTCACC 
TCCGAGGGCA AGCTCGGCTT CAGCAAGGAC GACCTGAAGA AGTGGTGGAA CCTCACGGCT 
GATCTCCGCG GCACCCCGGC GATCGTCTCC GAGGAACGCG TCACCCAGCT GGCCCCGAAG 
TCGCCGTTCG GCTCGAATGT CACCGCAACC GAAGTCACCT GGGACAACTT CATGGCCGGC 
TACCTCGGCG ACAGCGGCGC GAAGGAACTC AAGCTCGTGC CGGTCCCCTC CGACGACGCG 
GACAACCTCG GCCTGTTCCT GAAGCCGTCA ATGCTGATGG TGGCCAGCGC CAAGACCAAG 
TTCAAGGACG CCGCAGCCCG CTTCATCGAC TTCATGGTCA ACGACCCCGA GGTAGGCCAG 
ATCTTCAAGA CCTCCCGTGG CGTGCCCGCA TCGAAGACCC AGCGCGACGG CACCACCTTC 
GAAGGCACGG ACAAGATCGT TGTCGATTAC GAAACGTCCA TCTCCCAGTA CCTCAAGGAC 
GCCCCGGAGC CACCGATCGT CGGCTTCGGC ACGCTGGAGA CCTCCTTCAA GCGCATTGCT 
TCGGACCTGA ACTACGGCAA GCTGGACATC AACGGTGCCA CCGACGCCTG GTTCAAGGAA 
GCCGAAGACC TTATCAAGCA GAACGCCTGA

Protein sequence

MINRRHFLTT VAVGTASAGV LAACGTGSST SGQTGSADNP VTINYTWWGN DDRAERTRKA 
IALFESKNPD IKVNGNFTDF AGYWQKRATE AAGGGLPDVM QWDLSYLRDY GQRNQLLDLG 
TVKINTDAFE KSLLPSGQIK GKTYGIPTST NAFAVYYDPA KLASLGIAEP DGSWTYKEFN 
AFLTEVGSKS NGALFGGTDY TGVWWMFNVW LRQNNIEAFT SEGKLGFSKD DLKKWWNLTA 
DLRGTPAIVS EERVTQLAPK SPFGSNVTAT EVTWDNFMAG YLGDSGAKEL KLVPVPSDDA 
DNLGLFLKPS MLMVASAKTK FKDAAARFID FMVNDPEVGQ IFKTSRGVPA SKTQRDGTTF 
EGTDKIVVDY ETSISQYLKD APEPPIVGFG TLETSFKRIA SDLNYGKLDI NGATDAWFKE 
AEDLIKQNA