Gene Caci_4127 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4127
Symbol
ID	8335481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	4667296
End bp	4668753
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	71%
IMG OID	644957230
Product	major facilitator superfamily MFS_1
Protein accession	YP_003114832
Protein GI	256393268
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.773525
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAGAC GCCCGGCGGA GACTTCGCGT CCCCACTACA ACGTCATCTT CGCGGTCCTG 
CTCATCGGCA TCTCCGCCTA CGCGGTCCTG CAGTCGCTCG TCGCCCCGGT CCTGGCGACC 
TTCATCACCG CCCTGCACAC GACGCAGGAC ACGGCGACGT GGCTGATGAC GGCCTACCTG 
CTGTCCGCCT CGGTCGCCAC CCCGATCCTC GGCCGCATCG GCGACAAGGT CGGCAAGGAG 
CGGATGCTGG TCCTCACGCT GCTCGCGCTG ACCCTCGGCT CGGGGCTGGC GGCGCTGTCG 
CACTCCGTCG CCCTGATGAT CATCGCGCGC GCGATCCAGG GCCTCGGCGG CGGACTGCTG 
CCGCTGTCCT TCGGCATCAT CCGCGACGAG TTCCCGCCGG AGAAGGTGAA CTCCGCGATC 
GGTCTCGGCT CGGCGACGGT CGCCGTCGGC GGCGGTCTCG GACTGCTGAT CGCGGGCCCG 
ATCGTCACGC ACCTGAACTA CCACTGGCTG TTCTGGATAC CGATGGTGCT GACCGCGATC 
GCCACCGTCG CTTGCTGGCG CTTCGTGCCG GAATCCCCGG TGCGCACGCC CGGGAAGATC 
AGCTGGGGCG CGGCGGTCCT GCTCTCGGCC TGGCTCGTGA TGCTGCTGCT GGCCGTCAGC 
GAGGGCCCGA CCTGGGGCTG GGGCTCGACG AAGGTGATCG GGCTGTTCCT CGGCGCGGTG 
GTCTGCCTGC CGCTGTGGAT CCTCACCGAG CTGAAGTCGA GCGCGCCGCT GATCGACATG 
CGGATGATGC GCCTGCCGGC GGTGTGGACG ACCAACGTCG TGGCGCTGCT GTTCGGCGTC 
GGGATGTACA CGGTGATGAC GTTCCTGCCG CAGCTCGTGC AGACCCCCCG CGCCACGGCC 
GGCTACGGGC TCAGCGCCAG CATCACGCAG TCCGGCGTCT ACCTGCTGCC CATGACGATC 
GGCATGTTCC TGCTCGGCAT CGCCGCCGCG CCGCTGGCCA AGCGCATCGG GCTGAAGGCC 
GTGCTGGTCC TCGGCTGCGC GGTCAGCATC CCCGGCTTCG CCGCCCTCGC CTTCGGGCAT 
TCGCAGGGCT GGGAGATCTA CCTGGCGTGC GGACTGCTCG GCATCGGCAT CGGCCTGGCG 
TTCGCCTCGA TGTCCGCGAT CGTGGTCCAG TCGGTCCCGG CCGCGCAGGT CGGCGTCGCC 
AGCGGCATGA ACGCCAACAT CCGCACCATC GGCGGCGCGT TCGGCAGCAG CGTGGCGGCG 
AGCGTCCTGG CCACCGGCGT CACCGCCGCC AACCCCCTGC CGAAGGACGC CGGCTACACG 
CACGTGTTCT GGCTCCTCGC CGCCGCGGCG GTCCTCGCGA CCCTCGCGGC CCTGATCATC 
CCGGCGGTCA AGGCGCGATC GGCGCCGACC ATCGACGAGC TGAGCGTGGA CGACGGCGCG 
GTTCCCGCCG CCGCTTAG

Protein sequence

MPRRPAETSR PHYNVIFAVL LIGISAYAVL QSLVAPVLAT FITALHTTQD TATWLMTAYL 
LSASVATPIL GRIGDKVGKE RMLVLTLLAL TLGSGLAALS HSVALMIIAR AIQGLGGGLL 
PLSFGIIRDE FPPEKVNSAI GLGSATVAVG GGLGLLIAGP IVTHLNYHWL FWIPMVLTAI 
ATVACWRFVP ESPVRTPGKI SWGAAVLLSA WLVMLLLAVS EGPTWGWGST KVIGLFLGAV 
VCLPLWILTE LKSSAPLIDM RMMRLPAVWT TNVVALLFGV GMYTVMTFLP QLVQTPRATA 
GYGLSASITQ SGVYLLPMTI GMFLLGIAAA PLAKRIGLKA VLVLGCAVSI PGFAALAFGH 
SQGWEIYLAC GLLGIGIGLA FASMSAIVVQ SVPAAQVGVA SGMNANIRTI GGAFGSSVAA 
SVLATGVTAA NPLPKDAGYT HVFWLLAAAA VLATLAALII PAVKARSAPT IDELSVDDGA 
VPAAA