Gene Caci_3297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3297
Symbol
ID	8334650
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	3637618
End bp	3639051
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	69%
IMG OID	644956442
Product	major facilitator superfamily MFS_1
Protein accession	YP_003114045
Protein GI	256392481
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.467563
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACTG AGGCTGCCAC TGCCGCGACC CCCGCACGGT TCGCGGGTTC GTGGAGCGAG 
CTGTTCCGAG GCGGGACCGG CTTGTTGGTG GTCGGTCTGC TGCTGATGGA GTTCGCCACG 
GCGATGCAGT ACTTCGCGGT GGCTGTGGTG ATGCCGTTGG TGGCGCACGA TCTGCACGCC 
GAACGTTCCT ACGGCTGGCT GCTCGGCTCC TACGGGATGG CGATGATCGC CGCCGCGCCG 
CTGACACCGG CGATCACGGC GCGGTTGGGG CGGTTGCGGA CGGCGGGGGT GGCCTCGGTC 
GTGTTCGTGG TCGGCGGGGT GTTGGCGGCG GTGGCCGGTT CCGCGGTGCT GTTCGTTGTC 
GCGCGGCTGT TCCAGGGGTT CGGGTCTGGC GTCCTGACCA CCTTCGGAGT GAGCGCCGTC 
GCGCACTCGA TTCCCGAGCG GCTGCGCAAG CGCGTGTACT CGCTGATCTC GGCGATGTGG 
CTGCTGCCGG CTTTCCTCGG GCCGGTGTAC GCCTCGACGG TGTCGGACTT GCTCGGCTGG 
CGCTGGACGC TGACGCTGAT TCTGCCGTTG GTGGTCGTCG GGCGCGCGCT GGTGGTGCGG 
CGGGCTGGGG CGATGCGGCA GGAGGCGGCG CAGGGGGTCG AGGGGGTCGA GAAGGACAGC 
GCGGTGCGGA CACCGCCGTT CATTCGGGTC CTGATACTCA TCGGCGGATG CTTGCTGCTG 
TTGGGCGGGA CCAGTGTGAA GAGTGGCGTC GGGCAGATCG TCGCAGTGTG CGGGCTCCTC 
GTGGTCGCGG TGGCGGCGCG GAAGCTGCTG CCGTCCGGCG AACGTGGTCC GCGGTTGGCG 
GTCCTGGCGA TGCTGACGCT GTCGCTGGGT TATTCAGGGC TGGACGCGAT GGCGACGGTC 
ATCGCGCGCA GCGGGTTCGG CTCGTCGATC GCGGCGGCGT CGGCGGTGCT CACGTGCGAC 
GCGGTCGCCT GGTCGACGGT GGCGTTCCTG CAGCCGAAGT TCCACGAGCG GTGGAATCTG 
AGCACCGGCG CGGCAGGCGT GGTCGGCGCG CTGTTGGTCG CCGTGCCGGT GGCGGGGATG 
CCGGTGATGC TGGCCGCGCA CCTGTCATCG GGTACTGCGA TGCCGCTGAT GTGGGTGGCG 
TTCCTCATCT CCGGATCGGG CATGGGCTTC ATCTACACGA ACCTGCCGGT GACGGCGGTG 
GACGTCCGGG ACAAGTCGAC GACCGACGCC TTCGCCGCCG GGCTCGTGCT CGCCGAATCC 
ATGGGAGCGA GTCTGGGCTC GATGATCGGT GGCGGTCTGT ACGCCTACGG TCTCCAGCGC 
GGACTGTCGG CGTGGCACTC CCTTTCCGTG GCGGTCGGGG CGCTGAGCGT CTCGCTGTTC 
GCGACTGTTT TCATCGCCGT CGCGATTCAG CGGCACCTAC GCCTCCGCGG CTGA

Protein sequence

MSTEAATAAT PARFAGSWSE LFRGGTGLLV VGLLLMEFAT AMQYFAVAVV MPLVAHDLHA 
ERSYGWLLGS YGMAMIAAAP LTPAITARLG RLRTAGVASV VFVVGGVLAA VAGSAVLFVV 
ARLFQGFGSG VLTTFGVSAV AHSIPERLRK RVYSLISAMW LLPAFLGPVY ASTVSDLLGW 
RWTLTLILPL VVVGRALVVR RAGAMRQEAA QGVEGVEKDS AVRTPPFIRV LILIGGCLLL 
LGGTSVKSGV GQIVAVCGLL VVAVAARKLL PSGERGPRLA VLAMLTLSLG YSGLDAMATV 
IARSGFGSSI AAASAVLTCD AVAWSTVAFL QPKFHERWNL STGAAGVVGA LLVAVPVAGM 
PVMLAAHLSS GTAMPLMWVA FLISGSGMGF IYTNLPVTAV DVRDKSTTDA FAAGLVLAES 
MGASLGSMIG GGLYAYGLQR GLSAWHSLSV AVGALSVSLF ATVFIAVAIQ RHLRLRG