Gene Caci_5903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_5903
Symbol
ID	8337265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	6810798
End bp	6812261
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	71%
IMG OID	644959007
Product	major facilitator superfamily MFS_1
Protein accession	YP_003116602
Protein GI	256395038
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.811375
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACC AGGCGCGGCG ATCGCGGGGA GTACTGCCCG CGCTCGTGTT GTCCGTACTG 
GCTTTCTCCC TCGTCCAGAC CTCCGTGGTC CCGATCCTGC CGACGCTGCA GAAGAACTTG 
CACGTCGCCG GCAGCGGCAT CACCTGGCTG ATGACCGCGA ACCTGCTGTC GGCGGCGGTG 
CTCACGCCGC TGCTGGCGCG CATCGGCGAC CTGCGCGGGC GCAAGCCGGT GCTGGTGGTG 
GCGATCGCCG GTGTGCTGGT TGGCGGCGTC CTCGGCGGGA TCGGCGGCTC GTTCGGGCTG 
CTGCTGATAG CCCGGGTCGT GGCCGGGACC GGGGGTGCGA TCCTGCCGCT GGCGGTGGCC 
GTAGTGCGCG ATGAGCTGCC GCGCAAGAAG GTCACCGGCG GTGTGGCGAT GGTCTCCGCG 
GCCCTCGGCG TCGGCTCGGG GCTGGGCCTG GTCGCCACCG GCGTGGTGAT GGAGCACTTC 
AGCTACGAGT CGGTGTTCTG GATGGGCGCC GTGCTGGCCG CCGTCGCTCT CGCATTGGTG 
GTCTGGCTGG TCCCGCACGA CCCGATCAAG GCCGAGGGCA AGGCCGACCC GCTGGGCGCG 
CTGCTGCTCG CCGGTTGGCT CTCGGCGCTG CTGATCGCGG TCAGCCAGGG CAACGACTGG 
GGCTGGGGCT CCGCCCGCAC GCTCGGACTG TTCGTGACGG CCGTGGTGGT CCTGGTGCTG 
TGGGTCGTGG TGGAACGCCG CGTGGCCTCC CCGCTGGTGG ACATCGCGAT GCTCGCCAAG 
CCCGCGGTCG CGGTCACCAA CACCGCCGGG GTCCTGGTCG GCTTCGCGAT GTATGGCTCT 
TTCCTGTTGA TGAGCGACTT CACGCAGACC CCGAAGGCGG TCGGCTACGG TTTCGGCGCC 
TCGGTTTTGG CCTCGGGCTG GATGCTGTTC CCCTCGGCGG TCGGCTCCTT CGCCGCAGCC 
CCGGTCGGCG CGGCCCTGAT CAAGCGCGGC GGTCCGCGCC TGCCCCTGGT GCTCGGCGGC 
GCGTTCGCCG CGGCGGGCCT GGGCCTGCTG GTCTTCGCGC ACAGCTCCAG CTGGCACGTC 
GTGGTCGCCT CCGGCGTCAT GGGCGTCGGC GTGGGCATGG CGTACGCGGC GATGCCGGCG 
TACATCAACG CCTCGGTCCC GGTGCAGCAG TCGGGCATCG CCAACGGCAT GAACGCGGTG 
CTGCGGACCG TCGGCGGCGC CGTCGGCACG GCGGTCATCG GCGCGGTGCT GACCGGCAAC 
ATGAAGCAGG TCGCCCCCGG CGTCCAGTTG CCGACCATCG ACGCCTACTC GCACGCCTTC 
CTGATCGCCT CGGCGCTGGC ACTGGTCGCC GCGGTGGTGC CGTTCCTGGT CAAGGCGCCG 
CAGATGACAG CGATGACGAC GCCGGACACC ATCGACGCCG GAGTCGACAG CGAGCCGAAG 
GCGATGGCTG CTGCGAACGT TTGA

Protein sequence

MSDQARRSRG VLPALVLSVL AFSLVQTSVV PILPTLQKNL HVAGSGITWL MTANLLSAAV 
LTPLLARIGD LRGRKPVLVV AIAGVLVGGV LGGIGGSFGL LLIARVVAGT GGAILPLAVA 
VVRDELPRKK VTGGVAMVSA ALGVGSGLGL VATGVVMEHF SYESVFWMGA VLAAVALALV 
VWLVPHDPIK AEGKADPLGA LLLAGWLSAL LIAVSQGNDW GWGSARTLGL FVTAVVVLVL 
WVVVERRVAS PLVDIAMLAK PAVAVTNTAG VLVGFAMYGS FLLMSDFTQT PKAVGYGFGA 
SVLASGWMLF PSAVGSFAAA PVGAALIKRG GPRLPLVLGG AFAAAGLGLL VFAHSSSWHV 
VVASGVMGVG VGMAYAAMPA YINASVPVQQ SGIANGMNAV LRTVGGAVGT AVIGAVLTGN 
MKQVAPGVQL PTIDAYSHAF LIASALALVA AVVPFLVKAP QMTAMTTPDT IDAGVDSEPK 
AMAAANV