Gene Caci_2306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_2306
Symbol
ID	8333655
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	2611388
End bp	2613133
Gene Length	1746 bp
Protein Length	581 aa
Translation table	11
GC content	67%
IMG OID	644955459
Product	major facilitator superfamily MFS_1
Protein accession	YP_003113065
Protein GI	256391501
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.434674
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCGA CACAAGCTTC CAGCGCGACT GGGAAGGCCG TCCGCGGGCC CGACCATCCG 
CACTACAAGT GGGTGGCGCT GTCCAACACC ACGTTGGGCA TGCTGATCGC GACGATCAAC 
TCCTCCATCG TGTTGATCTC GCTGCCGGCG ATCTTCAACG GCATCAAGCT CGACCCGCTG 
CAGCCCTCCA ACGTCAGCTA CCTGCTGTGG ATGCTGATGG GCTACATGCT GGTCACCGCG 
GTGTTCGTGG TGGCGCTGGG GCGGCTCGGG GACATGTTCG GGCGCGTCAA GATCTACAAC 
TCCGGGTTCC TGGTCTTCAC CGTCTGCTCG ATCGCGCTGT CGCTGGACCC GTTCCACGGC 
GCGATGGGCG CGATGTGGCT GATCGGGTGG CGCGTGTTCC AGGCCATCGG CGGCGCCATG 
CTGATGGCGA ACTCCGCGGC GATCATCACC GACGCCTTCC CGGCCGCGCA GCGCGGCATG 
GCGCTGGGCA TCAACATCGT CGCGGCGATC GCCGGGTCGT TCATCGGGCT GGTGCTCGGC 
GGCGCGCTGT CCGAATGGAA CTGGCGCACC GTGTTCTGGG TGAACGTGCC CATCGGGTTG 
ATCGGCACGG TGTGGGCCTA CAAGTCGCTG CACGACACCG GGATCAGACA GAAGGCGCGC 
ATCGACTGGT GGGGCAACCT CACCTTCGCC GCCGGCCTGA CCTCGCTGCT CGCCGGCATC 
ACCTACGGCA TCCAGCCCTA CGGCGGGCAC ACGCAGGGAT GGACGAACCC CTGGGTCGAC 
GCCGGGCTGA TCGGCGGCAT CGTCCTGATC GTCGTCTTCT GCGTGATCGA GGCGAAGATC 
TCCGATCCCA TGCTGCCGAT GACGCTGTTC AAGAACCGCG ACTTCAGCAC CGGCAACCTC 
GCCAACCTGC TCGGCGCCAT CGCCCGCGGC GGCTTGCAGT TCATGCTGAT CATCTGGCTG 
CAGGGCATCT GGCTGCCGCT GCACGGCTAC GACTACAAGG ACACGCCGCT GTGGGCGGGC 
ATCTACATGA TCCCGCTGAC CCTCGGCTTC CTCGCGGCCG GACCGATCGC CGGGCACCTG 
TCCGACAAGT TCGGGCCGCG GGTGTTCGCC TCCGGCGGTC TGCTGGCGAT GGCGGCGTCG 
TTCGCGGGCT TGCTCCTGAT ACCCACGAAC TTCTCCTACT GGGTGTTCGC GCTGCTCATC 
TTCCTCAATG GCGTCGGCGG CGGGTTGTTC TCCGCGCCCA ACACGTCGCT GATCATGTCC 
AGCGTCCCGA CACGCATGCG CGGTGCCGCC TCCGGTGCGC GCGCCACGTT CATGAACGCC 
GGCATGGTGC TGTCGATGGG CATCTTCTTC TCGCTCATGG TCGCCGGGCT CTCCAGCTCG 
CTGCCGCACA CCTTGTCCAC CGGGCTGGCC GCGCAGGGGG TGCCCGCCGG GACCGCGACG 
CAGATCTCGC ATCTGCCGCC GGTGGCGACG CTGTTCGCCG CGTTCCTCGG CTACAACCCG 
ATGCAGCAGC TGCTCGGTCC CTCGACGCTG CACGCGCTGC CGGCCTCCAA CGCCCAGACG 
TTGACCGGCC GGGAGTTCTT CCCGCACCTG ATCTCAGGTC CCTTCCACGA CGGCCTCATG 
GTCGTGTTCT GCCTCGCCAT CGCGATGGCG GTGATCGGCG CGGTGGCCTC GGCGCTGCCC 
GGCGCGAAGA CCACGCCGGA GCAGGAGGAG ACGGCCGCCG GACAGAGCGC GGCGGCGACC 
GCCTGA

Protein sequence

MTATQASSAT GKAVRGPDHP HYKWVALSNT TLGMLIATIN SSIVLISLPA IFNGIKLDPL 
QPSNVSYLLW MLMGYMLVTA VFVVALGRLG DMFGRVKIYN SGFLVFTVCS IALSLDPFHG 
AMGAMWLIGW RVFQAIGGAM LMANSAAIIT DAFPAAQRGM ALGINIVAAI AGSFIGLVLG 
GALSEWNWRT VFWVNVPIGL IGTVWAYKSL HDTGIRQKAR IDWWGNLTFA AGLTSLLAGI 
TYGIQPYGGH TQGWTNPWVD AGLIGGIVLI VVFCVIEAKI SDPMLPMTLF KNRDFSTGNL 
ANLLGAIARG GLQFMLIIWL QGIWLPLHGY DYKDTPLWAG IYMIPLTLGF LAAGPIAGHL 
SDKFGPRVFA SGGLLAMAAS FAGLLLIPTN FSYWVFALLI FLNGVGGGLF SAPNTSLIMS 
SVPTRMRGAA SGARATFMNA GMVLSMGIFF SLMVAGLSSS LPHTLSTGLA AQGVPAGTAT 
QISHLPPVAT LFAAFLGYNP MQQLLGPSTL HALPASNAQT LTGREFFPHL ISGPFHDGLM 
VVFCLAIAMA VIGAVASALP GAKTTPEQEE TAAGQSAAAT A