Gene Caci_3157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3157
Symbol
ID	8334510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	3471478
End bp	3472767
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	66%
IMG OID	644956304
Product	extracellular solute-binding protein family 1
Protein accession	YP_003113907
Protein GI	256392343
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0206164
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.300299
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGAT TGCGCACGTT CACCGCCGCC GTCGCGGCGC TGGCCTGCAC GGCCCTCACG 
CTGGCGGGAT GCAGCTCCGG AGGCTCCGGC GGCGGAAAGC TCAGCAGCGG GCCGATCAAG 
ATCTGGTACT CCAACAACGC CCAGGAAGTC TCCTGGGGCA AAGCCACCGT CGCCCTGTGG 
AACAAGGCGC ACCCGGACCA ACAGGTCACC GGCGAGGAGA TCCCCGCGGG CAGCAGCTCC 
GAGGAGGTCA TCACCGCCGC GATCGCCGCC GGGAACGCGC CGTGCCTGGT GTTCAACGGC 
TCGCCGTCGG CGATATCGGG CTGGGTGAAG CAGGGCGGAC TGGTGCCCTT GAACGACTTC 
GCCGATGGCG TGTCCTACGT CGAGGGACGC AGCGGTGCGA CTGTCGCGGC CGAGTACAAG 
AGCACTGATG GCAAGTACTA CCAGCTGCCG TGGAAGAGCA ACCCGGTCAT GATCTTCTAC 
AACAAGGACA TGTTCAAGGC CGCCGGACTG GATCCGGACC ATCCGGTGCT GTCCACGTAC 
GCCGATTTCG AGGCCGCGGC ACAGAAACTC CTCAGCTCCG GCGCCGCGCA GTACGCCATC 
GCACCGGCGG CGACCAACGA GTTCTACCAG AACTGGTTCG ACTACTACCC GCTCTACATC 
GCCCAGAGCG GCGGGCAGCC GCTGGTGGCG AACGGCAAGG CGACCTTCGA CGACGCCGCC 
GGGAAGGCCG TCGCGGACTT CTGGTCCGGT GTCTACGCCA AGAACCAGGC GCCGAAGGAG 
AAGTACAACG GCGACGCGTT CGCGGACAAG AAGTCGGCGA TGGCGATCGT CGGACCGTGG 
GCCATCGCGT CCTACGCCGG CAAGGTGAAC TGGGGCGCGG TACCGGTCCC GACGTCCGCC 
GGGATGCCGG CCGACCAGAT CCACACCTTC GCCGACTCCA AGACCGTCTC GGTGTTCACC 
GCGTGCAAGA ACCGGCAGAC CGCCTGGGAC TTCCTGAAGT TCGCCACCGA CCAGGACAAC 
GACGGCACGC TGCTGAGTAT GACCGGCCAG ATGCCGCTGC GCAGCGACCT GCCGAGTACC 
TACGCGTCCT ACTTCACCGC GCACCCCGAA TACACGCTGT TCGCGCAGCA GGCGGCCCGC 
ACCGTCGAGG TCCCGAACGT CGCCAACGGC GTGACCATGT GGCAGGACTT CCGCAACGGC 
TACCTGAAGT CCGTGGTCTT CGGTCAGCAG CCGACAAGCC AGTGGTTGCA TGACGCGGCC 
GGTACCGTCG CCTCCGACAT CGCCAAGTAG

Protein sequence

MARLRTFTAA VAALACTALT LAGCSSGGSG GGKLSSGPIK IWYSNNAQEV SWGKATVALW 
NKAHPDQQVT GEEIPAGSSS EEVITAAIAA GNAPCLVFNG SPSAISGWVK QGGLVPLNDF 
ADGVSYVEGR SGATVAAEYK STDGKYYQLP WKSNPVMIFY NKDMFKAAGL DPDHPVLSTY 
ADFEAAAQKL LSSGAAQYAI APAATNEFYQ NWFDYYPLYI AQSGGQPLVA NGKATFDDAA 
GKAVADFWSG VYAKNQAPKE KYNGDAFADK KSAMAIVGPW AIASYAGKVN WGAVPVPTSA 
GMPADQIHTF ADSKTVSVFT ACKNRQTAWD FLKFATDQDN DGTLLSMTGQ MPLRSDLPST 
YASYFTAHPE YTLFAQQAAR TVEVPNVANG VTMWQDFRNG YLKSVVFGQQ PTSQWLHDAA 
GTVASDIAK