Gene Achl_0623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_0623
Symbol
ID	7292053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	669799
End bp	671085
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	62%
IMG OID	643589021
Product	extracellular solute-binding protein family 1
Protein accession	YP_002486710
Protein GI	220911401
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.58509
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCC CTAGATTCCT TTTGCCGGTT GCCACTGCCG GCGTTCTGGC CCTTTCCCTG 
TCCGCCTGTG CCGGCGGAGG AGGTGGCGGA ACCTCGGGCG GCGGCAGCGA CGCTGAAGCC 
AATCTCGACA GCCGTGGCCC CATCACCTAC GTGCAGGGCA AGGACAACAG CAACGTTGTC 
CGTCCGCTGA TCGAAAAATG GAACGCTGCG CACCCCGACG AAAAGGTCAC TTTCAAGGAG 
CAGACGGACA ACGCCGACCA GCAGCACGAT GACCTGGTCC AGAACTTCCA GGCAAAGAAC 
GCGGACTATG ACGTAGCCAG CGTGGACGTC GTCTGGACGG CCGAGTTCGC CGCCAAGGGC 
TGGCTCCAGC CGCTCAAGGA CAAGATGGCC ATCGACACCA AGGGCATGCT GGAGCCCACC 
ATCGAGGCCG GCTCCTACAA GGGCACCCTC TATGCGGCTC CCGTTTCCTC CGACGGCGGC 
ATCCTGTACT ACCGCAAGGA TCTGGTGCCC ACACCGCCCA AGACCTGGGA CGAGATGATG 
GGCATGTGCT CCATCGCCAA GCAGAACAAC ATGGGCTGCT ACGCCGGCCA GTTCAAGCAG 
TATGAGGGCC TCACCGTCAA CGCCTCGGAA GCAATCAACT CCGCCGGCGG ATCCGTCCTC 
GACAAGGACG GCAAGCCGAG CCTGAACACC CCCGAGGCCG AAGCAGGCCT GGACAACCTG 
GTGAAGGCTT TCAAGGACGG CAACATCCCG GCTGAAGCCA TCACCTACCA GGAAGAGGAA 
AGCCGCCGTG CGTTCCAGGA CGGCAAGCTC CTGTTCCTCC GCAACTGGCC TTACGTCTAC 
AACCTGGCAA CCACTGAAGG TTCCTCCAAG GTCAAGGACG TTCTGGGCAT GGCGGCACTT 
CCGGGCAAGG ACGGCCCCGG TGCTTCTTCC CTCGGTGGCC ACAGCGCAGC CGTCAGCGTC 
TACTCCGACC ACAAGGCCAC GTCCCTGGAC TTCGTGAAGT TCCTGGTTGA AGAAGAGCAG 
CAGAAGTTCT TCGCAACCCA GGGTTCGCTT GCCCCGGTCC TCGGTGACCT GTACGAGGAC 
CAGGAACTGG TTGCAAAGCT GCCTTACCTG CCGGTCCTCA AGACCTCCAT CGAAAATGCT 
GTTCCCCGGC CGGTAACCCC CTTCTACCCT GCAGTCACCA AGGCCATCCA GGACAACGCC 
TACGCGGCGC TGAAGGGTGA AAAGCCTGCC AAGGATGCGC TCTCCGACAT GCAGAAGTCC 
ATCGAGACCG CCGGCGCAGG ATCGTAA

Protein sequence

MKTPRFLLPV ATAGVLALSL SACAGGGGGG TSGGGSDAEA NLDSRGPITY VQGKDNSNVV 
RPLIEKWNAA HPDEKVTFKE QTDNADQQHD DLVQNFQAKN ADYDVASVDV VWTAEFAAKG 
WLQPLKDKMA IDTKGMLEPT IEAGSYKGTL YAAPVSSDGG ILYYRKDLVP TPPKTWDEMM 
GMCSIAKQNN MGCYAGQFKQ YEGLTVNASE AINSAGGSVL DKDGKPSLNT PEAEAGLDNL 
VKAFKDGNIP AEAITYQEEE SRRAFQDGKL LFLRNWPYVY NLATTEGSSK VKDVLGMAAL 
PGKDGPGASS LGGHSAAVSV YSDHKATSLD FVKFLVEEEQ QKFFATQGSL APVLGDLYED 
QELVAKLPYL PVLKTSIENA VPRPVTPFYP AVTKAIQDNA YAALKGEKPA KDALSDMQKS 
IETAGAGS