Gene Achl_3169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_3169
Symbol
ID	7294649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	3524828
End bp	3526165
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	63%
IMG OID	643591579
Product	extracellular solute-binding protein family 1
Protein accession	YP_002489219
Protein GI	220913910
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.187022
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTAT TACTCAAGGG AGAGAACATG GCTTCACCGT TTGATGCGTC CGCAACTGCC 
TTCCCGAGCA GGCGGAGCAT CCTCAAGACC GCCGGCGTTG GCGCTGCCAG CCTGGCCGGC 
ATCCCGTTCC TCGCAGCCTG CACAGGCGGC AGCGCACCGT CCGCAACAGG TACCGATTCC 
GGCGGACTGA CCTTCGGCTC CGGCTCCTCC GACGATGTTC CCAAGCGGGC CTACCAGGCC 
GTCACCGATG CGTTTACGGC CAAGACCGGC AAGAAGGTCA CCACCAACAC GGTCCCCCAC 
AACGACTTCC AGAACAAGAT CAACTCCTAC CTCCAGGGCT CCCCGGATGA CACCTTCACC 
TGGTTTGCCG GCTACCGGAT GCAGTACTAC GCCGGCAAGG GACTCCTTGC TCCCATCGAC 
GACGTCTGGG AAACCATCGG CGCCAACTAC TCCGACGCGC TGAAGAAGGC CTCCACCGGA 
CCCGACGGCA AGCTGTACTT CGTGCCCAAC TACAACTACC CGTGGGGTTT CTTCTACCGG 
AAGAGCCTGT GGGCCGAGAA GGGGTACGAG GTTCCGGAAA CCTTTGACGC CCTCAAGACC 
CTCGCCGCGA AGATGCAGGG AGACGGCATC ATCCCCATCG GCTTCGCGGA CAAGGACGGC 
TGGCCCGCCA TGGGCACCTT CGACTACATC AACATGCGGC TGAACGGCTA CCAGTTCCAC 
GTGGACCTGT GCGCCCACAA GGAATCCTGG GACCAGCAGA AGGTCAGCGC CGTCTTTGAC 
ACCTGGTCCG CGCTGCTGCC GTTCCAGGAT CCCGGAGCCC TCGGCCAGAC CTGGCAGGAT 
GCTGCCAAGT CGCTTGAAGC CAAGAAGACC GGCATGTACC TGCTGGGCTC GTTCGTCACC 
CAGCAGTTCA CCGACGCTGC GGTGCTGGCC GACATCGACT TCTTCGCCTT CCCGGAGATC 
GCCATGGAAG GCCGGGACGC CGTCGAAGCC CCCATCGACG GCCTCCTGCT GTCCAAGAAG 
GGCGGCGAGA ACAAGGCTGC GCGGGACTTC ATGGCGTACC TGGGCACGCC CGAGGCGCAG 
GACGCCTACG CCGCGGTGGA TGCCTCCAAC ATCGCCACCG CCAAGGGCAC CGACACCTCC 
AAGTTCAGTC CGCTGAACAA GAAGTGCGCC GAGACCATCG CTGACGCCAA ATACATCAGC 
CAGTTCTTCG ACCGTGACGC GTTGCCCGCC ATGGCCAACA ACGTGATGAT CCCTGCCCTG 
CAGAGCTTCA TCAAGGACGG CAAGATGGAC GTCAAAAACC TTGAGGCGCA GGCCAAAACC 
CTCTACGCGG CGCAGTAG

Protein sequence

MLLLLKGENM ASPFDASATA FPSRRSILKT AGVGAASLAG IPFLAACTGG SAPSATGTDS 
GGLTFGSGSS DDVPKRAYQA VTDAFTAKTG KKVTTNTVPH NDFQNKINSY LQGSPDDTFT 
WFAGYRMQYY AGKGLLAPID DVWETIGANY SDALKKASTG PDGKLYFVPN YNYPWGFFYR 
KSLWAEKGYE VPETFDALKT LAAKMQGDGI IPIGFADKDG WPAMGTFDYI NMRLNGYQFH 
VDLCAHKESW DQQKVSAVFD TWSALLPFQD PGALGQTWQD AAKSLEAKKT GMYLLGSFVT 
QQFTDAAVLA DIDFFAFPEI AMEGRDAVEA PIDGLLLSKK GGENKAARDF MAYLGTPEAQ 
DAYAAVDASN IATAKGTDTS KFSPLNKKCA ETIADAKYIS QFFDRDALPA MANNVMIPAL 
QSFIKDGKMD VKNLEAQAKT LYAAQ