Gene Achl_2094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_2094
Symbol
ID	7293555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	2359037
End bp	2360362
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	63%
IMG OID	643590493
Product	extracellular solute-binding protein family 1
Protein accession	YP_002488152
Protein GI	220912843
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.00000152964
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGATTCGA AATTGATGAC GCGCTCCCGC ACTGCCGTGG CCCTGACGGT GGCGTCCGCA 
GCGCTACTGA CGGGATGCGC CAGTGGCAGC GCAACGCCGG CGGCAAAGGA CGACGGGCAG 
CCCATTGAAG TCTGGGCACG TGCCGGGACC GACGCCGCCA CCACCTACGC GGCGATGTTC 
AAGGAGTTCA CGGACAAGAC CGGCGTGCAG GTCAACTTCC AGGGCGTCCC CGACCTTGAC 
CAGCAGCTGC AGACCAGGGC CGCCTCGAAG AAGTTGCCGG ACATTGTCAT CAACGACTCC 
GCGGCTTTGG GCAACTACAC CTCGCAGGGC TACCTCCAGA AGATCGACAA ATCTTCGGTG 
ACCGGCAACG ACGCCATCGC CGACTCCCTG TGGAACGAAA CCACAGGCCT GGACGGCGCC 
ACCTACGGGG TGCCGTTCTC CCGCCAGACC ATGGTGACCA TGATCCGCAA GGACTGGCGC 
GAGAAACTCG GCCTGCCCAT CCCCACCACA CAGGAGGAAC TCGCGAAGCT CGCCACTGCC 
TTCGCCACCC AGGATCCGGA TGGCAACGGC CAAGCCGACA CCTACGGCAT GACCGTTCCC 
GGCTCCACCG AACGCGGCTA CCTCGGCTGG TGGGCCTCTT CCTACCTGTG GCAGGACGGC 
GGCTCCTACC TCAAGGACGA GGGCAGCGGA AAGTTCTCCG CTTCCGCATC TTCGGCGAAG 
GACGGCGTCA CCTGGATCAA GCAGCAGTTC TGCACCCCCG GAAACACCCA GCCAGGCGCA 
CTGACCGCGG CCACCAGCGT CGCCTCCCCC TTCTTCCAGA CAGGCAAGAC CGGGATCATC 
CTCACCGGCC CCTACAACTT CTCCTCGTTC GACACCGCGC TTGGGAAAGA CGCCTACGAA 
GTCATCGAAA GCCCCAAGGG CACCGAAGAC AACACCGTCC TCGCGGAAGG TGAAAACATC 
TACGTCACGG CCAGCAACGG CAAACCGGAC CAGACCAAAA AGGTCATCGA CTTCCTGGTA 
TCTGCCGACG GCCAGAAGGC AGGCATGACA GCCGGCAAGC AGCCGGTGGT CCGGGTCCCG 
GTGAACTCCG GTGTCGACGC CGCCGCCGTC TACAACGATC CGCGTTGGGC CGTTGTCCAA 
GACGCCCTCA AGAATTCCTC CAAGGCATTC CCCTCCGCCA TCAACTTCGT GCCCATCAAA 
CAGGCTGCCG CCGAAGCCCT GAACAAGATC GTCTCAGACT GCGGAGCGGA CAACATTGCG 
TCCGGACTCA AGGATCTTGA CGCGGCCATC GACAACGAGC TCGAAAGCCA GAACGCCAAG 
TCATGA

Protein sequence

MDSKLMTRSR TAVALTVASA ALLTGCASGS ATPAAKDDGQ PIEVWARAGT DAATTYAAMF 
KEFTDKTGVQ VNFQGVPDLD QQLQTRAASK KLPDIVINDS AALGNYTSQG YLQKIDKSSV 
TGNDAIADSL WNETTGLDGA TYGVPFSRQT MVTMIRKDWR EKLGLPIPTT QEELAKLATA 
FATQDPDGNG QADTYGMTVP GSTERGYLGW WASSYLWQDG GSYLKDEGSG KFSASASSAK 
DGVTWIKQQF CTPGNTQPGA LTAATSVASP FFQTGKTGII LTGPYNFSSF DTALGKDAYE 
VIESPKGTED NTVLAEGENI YVTASNGKPD QTKKVIDFLV SADGQKAGMT AGKQPVVRVP 
VNSGVDAAAV YNDPRWAVVQ DALKNSSKAF PSAINFVPIK QAAAEALNKI VSDCGADNIA 
SGLKDLDAAI DNELESQNAK S