Gene Caci_8075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_8075
Symbol
ID	8339453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	9368438
End bp	9369643
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	70%
IMG OID	644961160
Product	Carbohydrate binding family 6
Protein accession	YP_003118739
Protein GI	256397175
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTCGA GCCGTAAGCG CCTCGCCGTG GCAGCCGCCG CGGCGATCGC GATCGCCACC 
CAGCTCGCCA TCACGCACAC CGCCCAAGCG GCCACGGCGC ACCCCGCCGC CAAGGCCGGC 
TCGGCGGCGG CGCCGGCCGC CGCCGCGGCC GACTACACCG CCGCCCAGGT TCTGGCCGGC 
GTGCAGAAGA ACTCCACGTC CTCGACCCAG GTCAACAGCA AGCCCCACAT CAACACCATG 
ACGCGGTCGA TGAACGTGAA CGTGTACCAG CCCGCTCCGG GCGTGTACTC CTACACCTCC 
AGCATGGCCA TCGACGACGA CGGCAGCGAC CCGGACCCGG ATCCCGACCA CCAGGGCGAG 
ACCACCTTCC AGGACAGCAA CGGGGCGCAG CTGGCCGCGC ACCACGTGCC GTTCTTCGTC 
CTGGGCGACG ACTGCTGGGA CAAGAAGACG CCGTGCCCGC ACTTCTTCTA CAAGGAACAC 
GGCATGTCCG GCCGTCAGTT CGCGCTGATG TTCTACAAGG GCAAGGTCAT CGGCTCGATC 
TTCGGTGACA CCCAGACCGG GAACAGCCAG ACCACCTCGG ACAACGACTC GCGCGAGCTC 
GGCGAGGCGT CCGTGAAGGC CGCCTCCCTG CTCGGCATCC CGAGCAGCGG CACCACCGGC 
GGCGTGGACA ACGGCGTGAC CGTGGTCATG TTCTCCGGCC CGTCCTGGGT CGTGAACGGC 
AGCAACGCCA ACCTGAGCAA CAACGCCCAG GCCCTGGTGC AGAAGGCGCT GAACACCCTC 
GGCGCGGCCA TGGACGGGGG CGGCACGACC CCGCCGCCGC CGACCGGCAC GCTCTTCGAG 
GCCGAGACCG GCTCGATGTC CTCCGGCGGC ACATTCGACT CCAACCACAC CGGCTTCACC 
GGCTCCGGGT TCGCCAACCC GGCCAACGCG GCCGGCTCCT ACCTGGACAT CCCGGTCACC 
GCGGACTCCG CGGGCACCAA GACCCTGACG TTCCGGTACT CGGACGGCAC CAGCTCGGCG 
CGCCCGGCGA CCATCTCGGT CAACGGCACC TCGCACGGCA CGCTGAACTT CCCGGTCACC 
TCGGACTGGA ACACCTGGTC CACCGCGACC ATCTCGGTGC CCCTGACCGC CGGCGCCAAC 
ACCATCCGGG TCACCGGCAC GGTCGCGGAC GGCCCGGCCA ACATCGACTC GGTGACCGTC 
TCCTAG

Protein sequence

MSSSRKRLAV AAAAAIAIAT QLAITHTAQA ATAHPAAKAG SAAAPAAAAA DYTAAQVLAG 
VQKNSTSSTQ VNSKPHINTM TRSMNVNVYQ PAPGVYSYTS SMAIDDDGSD PDPDPDHQGE 
TTFQDSNGAQ LAAHHVPFFV LGDDCWDKKT PCPHFFYKEH GMSGRQFALM FYKGKVIGSI 
FGDTQTGNSQ TTSDNDSREL GEASVKAASL LGIPSSGTTG GVDNGVTVVM FSGPSWVVNG 
SNANLSNNAQ ALVQKALNTL GAAMDGGGTT PPPPTGTLFE AETGSMSSGG TFDSNHTGFT 
GSGFANPANA AGSYLDIPVT ADSAGTKTLT FRYSDGTSSA RPATISVNGT SHGTLNFPVT 
SDWNTWSTAT ISVPLTAGAN TIRVTGTVAD GPANIDSVTV S