Gene Caci_2549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_2549
Symbol
ID	8333898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	2883013
End bp	2884500
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	66%
IMG OID	644955702
Product	major facilitator superfamily MFS_1
Protein accession	YP_003113308
Protein GI	256391744
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTCG TCACGGACGA GCCCAAGGGA GCCGTCCACC GCAGCCTGGT GCCCGCGCGC 
ATGGACCGGC TGCCGTGGGC GAGGTTCCAC TGGCTGGTGG TCGTCGGGCT CGGGGTGTCG 
TGGATCCTGG ACGGTCTGGA GATCCAGATC GTCTCGCAGG CCGGCTACCA GGACTCCCTC 
GGATTGACCA CCGCCCAAGT CGGCGCGGTC GGGTCGGTGT ACCTAGCCGG CGAGGTGGCC 
GGGGCGCTGG TCTTCGGCCG CATCACCGAC CGGCTCGGCC GGCGCAAGCT CTTCATGGTC 
ACGCTCGGCA TCTACCTGGT CGCCAGCGGT CTGGCGGGCT TCTCCTGGGA TCTGTGGTCG 
CTGCTGGTCC TGCGGTTCAT CGCCGGGACC GGAATCGGCG GGGAGTACAC CGCGATCAAC 
TCCGCGATCG ACGAGCTGAT CCCGTCGCAC TACCGGGGAC GCGTCGACAT CGCCGTCAAC 
GGCACGTATT GGGGAGGCGC GGCGATCGGT GCCGCGGCGA ACCTGTATCT GCTCTCTGAC 
CAGGTCCCGC AGAACATCGG GTGGCGGATC GGGTTCCTGA TCGGTCCCAC GATCGGCGTC 
GCGATCATCG TTCTGCGGCG TCATATCCCC GAAAGTCCGC GCTGGCTGAT GACCCACGGC 
CGTCAAGCCG AGGCTGAGCA GGTCGTCGAC GACATCGAGG ACCGGGTGCG AGCCGACGGC 
GCGGAGCTGG AGGACGTGCC GGACAGCAAG GCGATCGAGA TCGTCCCCGA GAAGAGCATC 
ACCTACCGGC AGATGGCACG GGTGTTCTTC GGGCAGTATC CGCGGCGGTC GATCCTGGGC 
TTCTCGATGA TGGTGACCCA GGCCTTCCTC TACAACGCGA TCTTCTTCAC CTACGCCTTG 
GTGCTCGAGC ACTTCTATGG CGTCTCCAAG GCGCACACGA GCTACTACTT CTTCCCGTTC 
GCGCTGGGCA ACCTGGCCGG GCCGCTGCTG ATGGGGCATC TGTTCGACAC CATCGGACGG 
CGCAAGATGA TCCTGCTGAC GTACGGCCTT TCCGGGCTCC TGCTGCTGGT GTCTGCCTTC 
TTCTTCCACG CCGGCGTGCT GAACGCCACC ACGCAGACGG CGTTTTGGTG CGTGACCTTC 
TTCTTCGCCT CAGCTGGCGC GTCCTCGGCC TACCTGACGG TGAGCGAGAT CTTCCCGCTG 
GAGCTGCGGG CGCAGGCGAT CTCCTTCTTC TTCGCGATCT CCCAAGGCGC GGGCGGCGTT 
GTCGCGCCGT TCCTGTTCGG TCACCTGATC GGCGGTCAGA ACAACCCGCA TCCGGACCGG 
ACGCCGTTGT TCTGGGGCTA CGTCATCGGC GCGATCGTGA TGATGATCGG CGGGGCGGTC 
GGCTGGTTCC TTGGAGTGAA TGCCGAGCGC CAGTCGCTGG AGGACGTCGC CCGGCCGATC 
TCGGCTCGCG ACAATGGCGG CGGCGCCGTG TCCGCGGCTA CCACCTAG

Protein sequence

MSVVTDEPKG AVHRSLVPAR MDRLPWARFH WLVVVGLGVS WILDGLEIQI VSQAGYQDSL 
GLTTAQVGAV GSVYLAGEVA GALVFGRITD RLGRRKLFMV TLGIYLVASG LAGFSWDLWS 
LLVLRFIAGT GIGGEYTAIN SAIDELIPSH YRGRVDIAVN GTYWGGAAIG AAANLYLLSD 
QVPQNIGWRI GFLIGPTIGV AIIVLRRHIP ESPRWLMTHG RQAEAEQVVD DIEDRVRADG 
AELEDVPDSK AIEIVPEKSI TYRQMARVFF GQYPRRSILG FSMMVTQAFL YNAIFFTYAL 
VLEHFYGVSK AHTSYYFFPF ALGNLAGPLL MGHLFDTIGR RKMILLTYGL SGLLLLVSAF 
FFHAGVLNAT TQTAFWCVTF FFASAGASSA YLTVSEIFPL ELRAQAISFF FAISQGAGGV 
VAPFLFGHLI GGQNNPHPDR TPLFWGYVIG AIVMMIGGAV GWFLGVNAER QSLEDVARPI 
SARDNGGGAV SAATT