Gene Caci_2303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_2303
Symbol
ID	8333652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	2608602
End bp	2610158
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	68%
IMG OID	644955456
Product	major facilitator superfamily MFS_1
Protein accession	YP_003113062
Protein GI	256391498
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGG CGGTGAGCGG TACCGAGGAC CTGGTCCTCC CGGTGGCCGA AGCGGTACCC 
GAGGACGAGC GACCGTCTAA GGGCAAGAAG AAGGATCCGA GCCAGTCGGC GATTCCGAAG 
GGCGCGTGGG CGGTGATGTT CACCGTGCTC GGCGCCTCGA TGATGGACCT GCTGGACGCG 
ACGGTGATGA ACGTCGCCGC GCCGTCCATC CGCAACGGTC TCGGTGCCTC GAACACCGAG 
TACCAGTGGA TCAGCACCGG CTACGTGCTC TCCTTCTCCG TGCTGCTGAT CGCCGGCGGG 
CGCCTGGGCG ACATAGCCGG GCGGCGCCGG ATGTTCCTGA TCGGCCTGAC CGGCTTCACG 
ATCATGTCCG CGGTCTGTGC CATCGCGCAG AACCCCGGCG AGCTGATCGC GGCCCGCCTG 
CTGCAGGGCG GCGCCTCGGC GATGATGATC CCGCAGGGCA TCGGCATGAT CCGGGAGAAG 
TTCGGCCGGG AGAACAGCCA GAAGGCCTTC GCGATCTTCG GACCCTTCAT GGGTCTGTCC 
GCCGCCCTGG GCCCGGTGCT CGGCGGCGCG CTGATCACCT ACTCCTCCTG GCGCTGGGTC 
TTCGTCATCA ACCTGCCGGT CGGCGTGATC GCGCTGTACT TCGCCGCCAA GGTGCTGCCG 
AAGGTGCACC ACAGCGCGGG CACCCGGCCG AAGCTGGACG TCATCGGCCT GATCTTCTGC 
TCGGCCGCGG TCGGTCTGCT GGTCTACCCG GTCATCCAGG GCCGCGAGCA CCACTGGGAC 
GCCGGCATCT GGCTGATGCT CGCCGGGTCG GCCGTGGTGA TGGCGCTGTT CGCGGTCTAC 
GCGCGGGCCC GGCACAAGCG GAACCTGGAT CCGTTCCTGG AGACCAGCTT GTTCCGTAAG 
CGCGCCTTCA CCACCGGGAC CATGACCATC TTCCTGTTCT TCGGCGCGTG CGCGGCGGCC 
TTCACCGTCA GCCCGCTGCT GCTGCAGGTC TCCCTGGGCT GGTCGCCGCT GCGGGCCGGG 
CTCACCGGCG CGTGGTGGTC GCTGGGCACG ATCATCTCGA TGGGCGCCGG GCAGGCCTTT 
GTGAAGAAGA CGCCGCGCCG GGTGCTGCAC GCCGGCCTGC TGACGCTGGC CGCGGGCATG 
GCGCTGAGCG CGTACATCAT CAAGCACTAC GCGGGCACCA CCTTCACGCT GAACGCCGAG 
CACCAGCCGA TCTGGCACAG CGGGGTGACC AGCTGGAACC TGGCGCCGGC GCTGCTGGTG 
TCCGGGATCG GCATGGGCCT GGTGTTCGCG CCGTTCTTCG GTCTGGTGCT GGCCGCCGTG 
GACGACCACG AACTGGGCTC GGCCAACGGC GTGATCAGCT CCTTCAACCA GCTGGGCAAC 
GCGGTCGCGG CGGCGCTGTT CAGCACGCTG TTCTTCAACA AGGTCGAGAG CGGCGGCTCG 
CCGTTCCCCG CCGCCGAGCT GGTGTACTGG CTGGCTGCCG GAATCCTGGT GCTGACCTGG 
TTGCTGGCGT TCACGGTGCC GAAGACGGCG CGCAGTGAGG ACGAGATCAT GGTGTGA

Protein sequence

MSEAVSGTED LVLPVAEAVP EDERPSKGKK KDPSQSAIPK GAWAVMFTVL GASMMDLLDA 
TVMNVAAPSI RNGLGASNTE YQWISTGYVL SFSVLLIAGG RLGDIAGRRR MFLIGLTGFT 
IMSAVCAIAQ NPGELIAARL LQGGASAMMI PQGIGMIREK FGRENSQKAF AIFGPFMGLS 
AALGPVLGGA LITYSSWRWV FVINLPVGVI ALYFAAKVLP KVHHSAGTRP KLDVIGLIFC 
SAAVGLLVYP VIQGREHHWD AGIWLMLAGS AVVMALFAVY ARARHKRNLD PFLETSLFRK 
RAFTTGTMTI FLFFGACAAA FTVSPLLLQV SLGWSPLRAG LTGAWWSLGT IISMGAGQAF 
VKKTPRRVLH AGLLTLAAGM ALSAYIIKHY AGTTFTLNAE HQPIWHSGVT SWNLAPALLV 
SGIGMGLVFA PFFGLVLAAV DDHELGSANG VISSFNQLGN AVAAALFSTL FFNKVESGGS 
PFPAAELVYW LAAGILVLTW LLAFTVPKTA RSEDEIMV