Gene Achl_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_1047
Symbol
ID	7292489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	1142773
End bp	1144656
Gene Length	1884 bp
Protein Length	627 aa
Translation table	11
GC content	65%
IMG OID	643589452
Product	PTS system, beta-glucoside-specific IIABC subunit
Protein accession	YP_002487130
Protein GI	220911821
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific [COG2190] Phosphotransferase system IIA components
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR00830] PTS system, glucose subfamily, IIA component [TIGR01995] PTS system, beta-glucoside-specific IIABC component

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACTC AGGAGGCCGC GAAGGCGATC CTGGAACACG TCGGCGGTGC CGGTAACGTG 
TCAAAGCTTC AGCACTGCTC AACCCGGCTG CGGTTCGCCT TGGCGGACGA CAGCAAGGCC 
GACGAGGCAG CCCTGAAGGC AATTCCGGGC GTAATCGGCG TCGTCAAGGG CCCGCAGACA 
CAGGTGATCG TGGGCAGTAA AGTCGCCGAC ATGTACGCCG CCGTGGAGAA GCTCCGCAGT 
GGCACCGCTG CCCAGGACGG CGCCCCGGTG GAACGCCGAC CGCTTTCGTG GAAGCACGCC 
GGATCAACGG TGATGGACTT CATCGTTAGC GTCTTCACTC CGATCATTCC GGCCATCGCC 
GGTGCCGGCA TTTTCAAATC CCTGCTGGTG CTCGCTTCCG CCGTCGGGTG GCTCAGCTCC 
AGCAGCGACA ACTTCAAGGT CCTCTCGTCC ATCCCGGACG CTGTCTTCGG GTTCCTCCCA 
CTGCTGGTGG CCTACACCAC CGCCAAGAAG CTCGATGTGA ACCGGCCGTT GGCCCTCGGC 
ATCGTGGGCG TCCTGGTCTA CCCCGCCTTC ACGGCACTCG CCACTCGCGA AGGCGGCGTG 
GACCTGTTCG GTCTCGACGT GCCGTCGGTG CCGTACAACG CCCAGGTTTT CCCGTCCATC 
CTCGCCATCC TCCTGCTGAG CGTCGTGGAG CGGTTCTTCA CCAAAATTAC GCCGGGCCCC 
ATCCGGGTAT TCTTCGTCCC CCTGATGTGC ATCGTCATCG TGGTTCCGGC CACCATCTTC 
CTGCTGGGCC CGCTGGGCTA CCAGCTCGGC GTCCTGCTGA CCGCCGCCCT GATCGCCCTG 
TACGGCACCT TCGGCTGGGT TGCCGTCATG CTGCTGGCCG GTGTCCTGCC GCTCATCATT 
TCCGTCGGCA TGCACAAGGC CTTCATCCCG CCCACCATCG CCACCATGGC CAGCGCCGGC 
CGGGAATCCT TCTACCTCGT GGCGTCCCTG GCCCACAACC TCAGCGAAGC AGGCGCTACG 
TTCGCCGTCG CCCTGAGGAC CAAGAGCACG ACGCTGCGCG CTACCTCGCT CTCCGCCGGC 
GTCTCCGCGC TCTTCGGCAT CACCGAGCCC GCACTCTACG GCGTCACCCT GCAGAACCGC 
CGGGTCCTGG TCTCCGTCAT CATCGGCAGC ATGTCCGCCG GTGCCTACCT GGGCCTGGTC 
CAGACCACCG CCTTCGCCGT TGTGGGTCCC GGCGTCGGCA GCATCTCCAT GTACGTTGAC 
GCCGCCAACC CGTGGAACTT CATCAACGCC CTGATCGGCC TCGGCATTGC ACTGGTGGTG 
TCCTTCACCC TCGCGCTGTT TCTGTGGCGC GACTCCGACT CCGCCACGCT CCGCGTGATG 
GGCGGAACCG GGACCGCCGT GGAGCCCGCC AACGGCGCCG GCCACCTGGC CAGCCCGATG 
ACCGGCGTCA TCGTGCCCCT CGACGACGTG GACGATTCGG TGTTCTCGGC ACGCATCATC 
GGCGACGGCG TCGCGATCCG CCCCACCGAT GGCGCCGTCC GGTCTCCGCT TGCTGGCGAG 
GTGACGGTAC TGATGGATTC CAAGCATGCC ATCGGCATCC GCGGAGATGA CGGCGTCGAA 
ATCCTGATCC ACGTCGGCAT CGACACCGTC CAGCTGGACG GTGCCCCGTT CACTACGCAT 
GTCGCCGTAG GCGACCGTGT GGTTGTTGGC CAGCTGCTTG TCGAGGCAGA CCTCGCCGTG 
ATCAGCGCCG CTGGCTACGA CACCACCACT CCTGTCCTGA TCGTGAACTC GAAGAACTAC 
GACGTCACGG TGGAAGAGGC CGGCAGTGTG ACCTCCGGCC AGGCACTCCT GGCCACCAAG 
GCAAAAGAGA AGGAGCTCGT CTGA

Protein sequence

MSTQEAAKAI LEHVGGAGNV SKLQHCSTRL RFALADDSKA DEAALKAIPG VIGVVKGPQT 
QVIVGSKVAD MYAAVEKLRS GTAAQDGAPV ERRPLSWKHA GSTVMDFIVS VFTPIIPAIA 
GAGIFKSLLV LASAVGWLSS SSDNFKVLSS IPDAVFGFLP LLVAYTTAKK LDVNRPLALG 
IVGVLVYPAF TALATREGGV DLFGLDVPSV PYNAQVFPSI LAILLLSVVE RFFTKITPGP 
IRVFFVPLMC IVIVVPATIF LLGPLGYQLG VLLTAALIAL YGTFGWVAVM LLAGVLPLII 
SVGMHKAFIP PTIATMASAG RESFYLVASL AHNLSEAGAT FAVALRTKST TLRATSLSAG 
VSALFGITEP ALYGVTLQNR RVLVSVIIGS MSAGAYLGLV QTTAFAVVGP GVGSISMYVD 
AANPWNFINA LIGLGIALVV SFTLALFLWR DSDSATLRVM GGTGTAVEPA NGAGHLASPM 
TGVIVPLDDV DDSVFSARII GDGVAIRPTD GAVRSPLAGE VTVLMDSKHA IGIRGDDGVE 
ILIHVGIDTV QLDGAPFTTH VAVGDRVVVG QLLVEADLAV ISAAGYDTTT PVLIVNSKNY 
DVTVEEAGSV TSGQALLATK AKEKELV