Gene Caci_5208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5208
Symbol
ID	8336562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	5984758
End bp	5986056
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	72%
IMG OID	644958306
Product	major facilitator superfamily MFS_1
Protein accession	YP_003115908
Protein GI	256394344
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.377398
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.900425
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTCCG CGCTCGCGGA CAAAGATTTC CGCTGGTTCT TCACCGGCTA CCTGACCTCC 
AAGCTCGGCA GCGCTATGGC GCCGGTCGCC ATCGCTTTCG CCGTGCTGCA CACCGGCGTG 
GGGGCGGGCG GGCTGGGGTG GGTGATGGCG GCGCGGATCG TGCCGGTGGT GCTGCTTCTG 
CTGCTCGGCG GGGTGTTCGC CGACCGGCTC GGGGGGCGGC GGGTGATGAT CGCCTCCGAT 
CTGCTGCGCT GCGGGGCGCA GGCGGCGTTC GGGGCGCTGG TGCTGAGCGG GCATGCGACG 
CTCACGGCGA TGATCGCGGT AAGCGTGCTG TCGGGGGTCG GTGAGGGGAT CTTCAGCCCG 
TCGCTGCAGG CGCTGATCCC GCGGCTGATC CCGGACGGTC GGCGCAGCGA CGCCAACGCG 
CTGCTCAGCG TGGCCGTGTC CGGTGCCGGG GTGGCCGGGC CGGCGCTCGG CGGGCTGATC 
GCGGCGGTCT TCGGCGGGGC GGCGGGTCCG GCGTCGGTGC TGTTCGTCGA CAGCGCCAGC 
TACGCGGTGA GCATCGGGGT GCTGCTGCGG CTCTCGCACG TGCCGCAGCC GGAGGCCGGC 
GAGCGGTCGA CGATCATCAG GGACCTGCGG GAGGGCTGGG ACGAGTTCCG CTCCCGGACC 
TGGCTGTGGC TCACGACGCT GCAGTTCGGG TTCTTCAACG CGCTGGTCTG GGCGCCGTAC 
CTGGTGCTGG GTCCGGTGGT GGCCGAACAC CGGCTGGGCG GCGCCGGGGC GTGGGGACTG 
GTGCTCGCCG CGAACAGCGC GGGGTCGATC GTCGGCGGGC TGGCGCTGCT GGGGCGCCGA 
CCGAGGCGGC CGTTCCTGAT CTCGGTGATC GCCGCGTTCG GGTACGTGTT CACCCCGGCG 
CTGCTGGCCA GCAGCCTGCC GCTGCCGTTC GTGTGCGCCG CCGCGGCGGT CACCGGCGTC 
GGCGGCGCGG TCGGTTCGGC GCTGGACACC ACGGTGATGC AGCAGCGCGT GCCGGTCGAG 
GTACTGGGGC GGATCACGGC GTACCAGACG CTCGGCGCGT TCGCGCTCGG GCCGCTCGGG 
CTGGTCGTCG CGGGCCCGTT GGGGGCGGCG TTCGGGGTGG CGGCGTTCCT GGCGTTCGGG 
GCGGTGTTCC AGTTCGCGAC GGTGGTCCTG ATGCTCGCTT TGCCCGCTGT GAGGCGTCTT 
GACCTGGAAG ATCCGGACTT GTCGGAACCC TCGGCTACGG TGATCGAAAC AGTGATCGAA 
CAACCGCCGG TCACATCGCC CACCCCCTCA GGAGGTTGA

Protein sequence

MFSALADKDF RWFFTGYLTS KLGSAMAPVA IAFAVLHTGV GAGGLGWVMA ARIVPVVLLL 
LLGGVFADRL GGRRVMIASD LLRCGAQAAF GALVLSGHAT LTAMIAVSVL SGVGEGIFSP 
SLQALIPRLI PDGRRSDANA LLSVAVSGAG VAGPALGGLI AAVFGGAAGP ASVLFVDSAS 
YAVSIGVLLR LSHVPQPEAG ERSTIIRDLR EGWDEFRSRT WLWLTTLQFG FFNALVWAPY 
LVLGPVVAEH RLGGAGAWGL VLAANSAGSI VGGLALLGRR PRRPFLISVI AAFGYVFTPA 
LLASSLPLPF VCAAAAVTGV GGAVGSALDT TVMQQRVPVE VLGRITAYQT LGAFALGPLG 
LVVAGPLGAA FGVAAFLAFG AVFQFATVVL MLALPAVRRL DLEDPDLSEP SATVIETVIE 
QPPVTSPTPS GG