Gene Caci_0689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_0689
Symbol
ID	8332019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	800060
End bp	801301
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	73%
IMG OID	644953841
Product	major facilitator superfamily MFS_1
Protein accession	YP_003111465
Protein GI	256389901
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.549457
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCCTCGA CCATCGAAGC GGGTGTCGGC ACCGAAGACA TCCGCAAGGA CACTGTGTTC 
GGCCGCATCG GCGGCGCGCT ACGCGAACGC GAATTCCGGT GGTGGTTCGC CGGGCAGATC 
ACGTCGGCGT CCGGGGTGAT GGCGCAGGGG GTGGCGCTGT CGTGGTGGAT GCTGCAGCGG 
ACCGGCGACG CGGTGTGGCT CAGCGTACTG ACGGTGTGCA CGATGGGCCC GACGCTGATC 
GGCGGCGCGT GGGCCGGGGC GGTGGTGGAC CACGCGGATC GCCGGCGGCT GCTGATCGGC 
ACGCAGACGG TCCTGATGGG CATCGCCGCG GCGCTGACCG TCCTGGCCGC GACCGACACG 
CTCGCGGTGT GGAACGTGCT GGTCGCCTCG GTGCTGGCCG GGACGACCAT GGCCGTGGAC 
TCGCCCGCGC GGCAGGTGTA CGTCGTGGAC CTGGTCGGCG CCGACGGCGT CGCGAGCGCG 
GTCGGGCTGT GGGAGGTGGC GCTGAACACC TCACGGGTCG TGGGTCCGGG CTTGGGCGGC 
GCGCTGCTCG CAGGTCCCGG CGCCACCGCG TGCTTCGGCG TGAACGCGTT TTCTTATCTG 
GCGCCGCTGA TCGTGCTGCT CCGGATGAAG CCCCGGACGA CCGCGCAGGT TCGGACGCGC 
GGACGTGCCC GGGGCGCCGC GCGTGACGGC ATCCGCTACG CGTTCCGCTC GCCGGTCATC 
AGGGCTCTGC TTCCGATGTC GACGGCTTCC GGCTTGATCT TCGGCATGGG TATCGCGCTG 
CCGCCGCTGG TCCAGCGTGC TCTGCACCAG GGCGGCGGCG GGTACGGCGC GATGATGGCG 
GCGTTCGGCG TCGGCGGGCT GCCCGGGGCG CTGCTGGCCG CCGCCCAACC CGAGCCGACC 
GGCCGCCGCG TGCGCTGGCT CGCGCTGGCG ACCGCGGCGG CGGTGATCGG GACCGCGGTG 
GCGCCGGTGA TGGCGGTCGC GTTGGTGGGG ATGGTGGCCC TCGGCCTGAC GTCGATCTGG 
TTCATCGCCT CGGCCAACAC CCTGGCGCAG TTGCGGTGCG CGCCGGACAT GCGCGGCCGG 
GTGATGAGCC TGTGGGGCGT GGCGATGATG GGGACCGCGC CGATCACCGG GTTCGGCGTC 
GCGGCGGTGG TGCAGTACGT CGGACCGCGC GAGGGGTTCT CCATCTCGGG CATCGCGCTC 
GGGCTGGCCG CCGTCGTCGG CTGGCGGGCG TTGCGCGACT AG

Protein sequence

MSSTIEAGVG TEDIRKDTVF GRIGGALRER EFRWWFAGQI TSASGVMAQG VALSWWMLQR 
TGDAVWLSVL TVCTMGPTLI GGAWAGAVVD HADRRRLLIG TQTVLMGIAA ALTVLAATDT 
LAVWNVLVAS VLAGTTMAVD SPARQVYVVD LVGADGVASA VGLWEVALNT SRVVGPGLGG 
ALLAGPGATA CFGVNAFSYL APLIVLLRMK PRTTAQVRTR GRARGAARDG IRYAFRSPVI 
RALLPMSTAS GLIFGMGIAL PPLVQRALHQ GGGGYGAMMA AFGVGGLPGA LLAAAQPEPT 
GRRVRWLALA TAAAVIGTAV APVMAVALVG MVALGLTSIW FIASANTLAQ LRCAPDMRGR 
VMSLWGVAMM GTAPITGFGV AAVVQYVGPR EGFSISGIAL GLAAVVGWRA LRD