Gene Caci_4809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4809
Symbol
ID	8336163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	5478405
End bp	5479661
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	73%
IMG OID	644957909
Product	major facilitator superfamily MFS_1
Protein accession	YP_003115511
Protein GI	256393947
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.942167
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAGTG TCTCGATACG ATCGGCCGAG GACTCCAGTG CCTCTATCGC TTCCTCGGGA 
GGAGGCGGTG ACGGCGGGCT TGGTCGCACG CTCGTCCTCG CGCTCGGCAC GTTCGCGGTG 
GGCACCGATG CCTTCGTCCT GGCCGGTTTC CTTCCTGACG TCGCAGCCTC CTTGCACACC 
TCCACCGCGA GCGCGGGGCA GGCGGTGACC GTCTTCGCCG CCGCCTACGC GGTCGCCTCG 
CCGGTGGTCG CGACGCTCAC CGCGCGCTTC CCGCGCCGTC TGCTGCTGGT CGCGGCGCTG 
ATCGTGCTGG CCGCTGCCAA TGCGGCGTCC GCGCTCGCGC CGAACCTGCC GCTGCTGCTC 
GCCGCTCGGG TTCTCGCGGC GGCGGGAGCG GCGGGGTACA CGCCGACCGC CGGGGCGGTG 
ACGGCTGCGC TCGTGCGGCC CGAGATGCGC GGGCGGGCGC TGGCGGTCGT GGTCGGCGGG 
TTGACGGTGG CGACGGCGCT CGGCGTGCCG CTCGGGGATG CGGCCGGCGC GGTGATGGGC 
TGGCGCGCGG CGCTCGGGCT CGTCGCAGCG CTCTGTCTGC TCACTGCGAT CGCCGCGGCC 
GTCCTGATGC CGACGCTGCC CGGCTCGGCG CCGGTTCCGC TCGCGGCGCG GTTGGCTGCG 
CTGCGGCGGC CCGGGGTCGC GAGCGTGCTG CCGTTGACCG TTCTGGGCAT GGCGGCTGCG 
TACACCGTCT ACGCCTATGC CATTCCGGCG CTGCACGCGC TGGGCATCGC CGATGGCGCG 
ACGGCATGGA TCCTTGCGGC GTACGGCGCG GGGGCGATCC TCGGCAACCT GGCTGCCGGT 
ATCGCTGCGG ATCGTCTCGG GCCGACGCGG GTCCTCGTGG TCGGATACGC GCTGATGGCG 
ATGACGTTGG CGACTTTCGC GGTGCTCGCG GTGGCCAAGG TGCACGCTCC GGCGCTCGTC 
GCGGTGCTCG CGATCACATG GGGCGCCTCT ACGTGGTGTC AGACTCCGCC GCAGCAGCAT 
CGGTTGTTCA GCGCCGCGCC GAGCGAAGCC CCGCTGCTTA TGGCGCTGAA CGCCTCGGCG 
ATCTATGTCG GCATCGGTAT CGGGACTGCT GCGGGCGGGC TGCTGGTCGC CTCCGGTGCC 
GCGTGGATGT TCACGATCGC TGCGATCGTG GCGTGCCTCG CGCTCGGATG GCTCGCCGCG 
ACCGCAACCG CAACCGGTCA CAAGGCAACC CGCCGGTGGT CTACCCTCGC CAGGTGA

Protein sequence

MSSVSIRSAE DSSASIASSG GGGDGGLGRT LVLALGTFAV GTDAFVLAGF LPDVAASLHT 
STASAGQAVT VFAAAYAVAS PVVATLTARF PRRLLLVAAL IVLAAANAAS ALAPNLPLLL 
AARVLAAAGA AGYTPTAGAV TAALVRPEMR GRALAVVVGG LTVATALGVP LGDAAGAVMG 
WRAALGLVAA LCLLTAIAAA VLMPTLPGSA PVPLAARLAA LRRPGVASVL PLTVLGMAAA 
YTVYAYAIPA LHALGIADGA TAWILAAYGA GAILGNLAAG IAADRLGPTR VLVVGYALMA 
MTLATFAVLA VAKVHAPALV AVLAITWGAS TWCQTPPQQH RLFSAAPSEA PLLMALNASA 
IYVGIGIGTA AGGLLVASGA AWMFTIAAIV ACLALGWLAA TATATGHKAT RRWSTLAR