Gene Achl_2663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_2663
Symbol
ID	7294139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	2990860
End bp	2992266
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	66%
IMG OID	643591073
Product	extracellular solute-binding protein family 1
Protein accession	YP_002488717
Protein GI	220913408
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTGCG CCCGCAGTAC CCCACCGGCA CCACAGAAAG GCACAACCTT GGCACGAAAT 
ATCCTCACCT CCCCGGTGGG CCGGCGGCTC TTCCTCTCCC TGGCCGGCGC CGGGGCGGGC 
GCGGCGGCCC TCACCGCGTG CGGCGGTCCC TCCACGTCGG CGGGCTCCGA ACAGACCACC 
GCGGCGCTTG ACTTCGACGG CGTGAAGCCC GCCGCATCAT TCGACTTCTG GTCCAACCAC 
CCCGGCAAGT CGCAGGACGT GGAGAAGAGC ATCATCGCGA AGTTTGAGGC CAAAAACCCT 
GGCATCAAGG TCAACCTGGT CACGGCCGGT GCGAACTATG AGGAGATTGC CCAGAAGTTC 
CAGACCGCAC AGGCCGCCAA ATCGGGCCTT CCCGCGCTGG TGGTCCTCTC CGACGTGTGG 
TGGTTCCGCT ACTACCTGAA CGAAAGCATC ATTCCGCTGG ACGCCCTCAT CAAGCAGCTG 
GACGTCAAGC TGGACGATTT CCGTACGTCG CTGGTGGACG ACTACAAATA CGACGGCCAG 
CAGTGGGCGC TCCCCTATGG CCGTTCCACC CCGCTGTTCT ACTACAACAA AGACCACTTC 
GCGGCCGCCG GCCTTCCGGA CCGCGCGCCC GCCACCTGGC AGGAATTCGC CGAGTGGGCG 
CCGAAGCTCA AGGCAGCCAC CGGCGCCCAG TACGCCTTCA TGCACCCGGC CCTGGCCGGC 
TACGCTGGCT GGACCCTGCA GAACAACCTG TGGGGCGAGG GCGGCGGCTG GTCCAAGGAC 
TGGGACATCA CGTGCGACTC GCCCGAGTCG GTAGCCGCGC TCCAGGCGGT GCAGGACTCG 
GTCTACAAGG ACAGCTGGGC CGGGGTGTCC TCGAAGGAGT CTGCTGACGA CTTCGCTGCG 
GGCCTCGCAT CGGCCACTCT GTCCTCCACG GGCTCGCTCA TCGGCATTCT GAAATCTGCC 
TCTTTCAACG TGGGCGTCGG ATTCCTGCCG GGCGGCTCCA AAGCCAAGAC AGGCGTGTGC 
CCCACCGGCG GGGCGGGCCT GGGCATCCCC AGCGGCGTGA CCCGCGAAGA ACAGCTCGCA 
GCCGCAATGT TCCTCCAGTT CGTCACCGAA CCGGAGAACA CCGCTGAGTT CTCCGCTGCC 
ACCGGCTACA TGCCCACGCG CACGTCAGCG GACATGACCG CGGTGCTTGC CAAGACACCA 
CAGATCAAGA CTGCCATGGA CCAGCTGGCC GTCACCCGCG TCCAGGACAA CGCCCGCGCG 
TTCCTGCCCG GCGCCGACCA GGAAATGGCC AAGGCCGCCG CGAAGATCCT CACCCAGCAG 
GCCGATGTCA AAGCCACCAT GACGGAGCTG AAGGCCACCC TTGAGGGCCT GTACACCAAG 
GATGTGAAGC CCAAGCTGAA GGCATAG

Protein sequence

MGCARSTPPA PQKGTTLARN ILTSPVGRRL FLSLAGAGAG AAALTACGGP STSAGSEQTT 
AALDFDGVKP AASFDFWSNH PGKSQDVEKS IIAKFEAKNP GIKVNLVTAG ANYEEIAQKF 
QTAQAAKSGL PALVVLSDVW WFRYYLNESI IPLDALIKQL DVKLDDFRTS LVDDYKYDGQ 
QWALPYGRST PLFYYNKDHF AAAGLPDRAP ATWQEFAEWA PKLKAATGAQ YAFMHPALAG 
YAGWTLQNNL WGEGGGWSKD WDITCDSPES VAALQAVQDS VYKDSWAGVS SKESADDFAA 
GLASATLSST GSLIGILKSA SFNVGVGFLP GGSKAKTGVC PTGGAGLGIP SGVTREEQLA 
AAMFLQFVTE PENTAEFSAA TGYMPTRTSA DMTAVLAKTP QIKTAMDQLA VTRVQDNARA 
FLPGADQEMA KAAAKILTQQ ADVKATMTEL KATLEGLYTK DVKPKLKA