Gene Caci_3638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3638
Symbol
ID	8334991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	4071196
End bp	4072425
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	71%
IMG OID	644956779
Product	major facilitator superfamily MFS_1
Protein accession	YP_003114382
Protein GI	256392818
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0205021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.00774423
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGCGACGG AGTCGGCCAC CGCCGAGGGC GTCAGCACCC TGATCGGGGC GGACCGTCTG 
GCCCGCGGTC GCCGTGCGCT GGCTGCGGCG ACCTTGGCGA ACGCCGTTGG GAACGGCATG 
TACCTGGCCG TGATGGCCGT CTACTTCACC GGCTCGGCGG GGTTTTCCGC CGCTCGCGTC 
GGGCTCGGGC TGACGGCCGC CGGGCTGGTG GGTTTGGCGG CGGGAGTCCC GGTCGGCCGC 
TGGGCCGACC GCAACGGTCC GCGCGAGGTG TACCTGGGGC TCGGCCTGGT GTCGGCGGCG 
ACGATGGCGG CGTACGCGGG ACTGCGCTCG TTCTGGCTGT TCTGCGCGGT GGCGGTGGTC 
GACAACCTCG CGGCGTCGGG CACGCGGGCT GCGCGCGGGG CGTTGATCGC CCGGTTGGCC 
GGTCGCGATC CGCACCTGTA CCGGGCTCGT CTCCGGTCGG TCGCGAACCT CGGGCTGGCG 
GTCGGAGCCC TGATCGGCGC GGCGGGCCTG GCGATCGACA CGCGGGCCGG GTATACGGCG 
ATCCTGCTTC TCAATTCCCT GACGTTCCTG ATGAACACGT TGCTGTGCCT GAGGATCCCG 
CCGCTGCGGT CGATACCCGC ACCGCCCGGG CGCACCGCCT GGCCGGTGGT GCGGGACCTG 
CGCTTCCTGG CGTTCTCCTG TCTCGCGGCG GTGTTGGCCA TCCACGACGA GGTGCTGTTG 
TTCGCGGTGC CGTTGTGGAT CGCACGGGTC GGCCACGCGC CGCGCTGGAT CGTGGCTGTC 
CTGTTGTTCG TCAATACTCT GATGGTTGCC TCGCTCCAGG TGCGCATCGG GCGCGCGGTG 
GACACGATCG CGGGAGGCGT CCGGGCCTCC GTTCGAGCCG GCTGGATCCT TGCGGCGGCC 
GCGCTGCTGT TCGGCGTCAT CGGAACCGTG CCCGGCTGGA CCGCGATCGC CATCCTGCTC 
CTCGCCGCGG CCGCTCACTC CGTCGGCGAG ATCGTGCAGC AGGCAGGGTA TTCAGAACTC 
TCATTCGGTC TGGCCCCGGA TCACGCGCAG GGGCAATACC AGGGCATGTC GGCGACGTTC 
AGCGGCGCGG CGATCGCGCT GGCTCCCGGA TTACTGGCTT GGCTGTGCCT CGGCGTCGGT 
ACGAGAGGCT GGCTGGTGCT CGCGGGCGCG TTCGCGCTAG CCGGAGCGCT GACCCCGATC 
GCGGTCGGTG CTCCCGACGC AGCAGGCTGA

Protein sequence

MATESATAEG VSTLIGADRL ARGRRALAAA TLANAVGNGM YLAVMAVYFT GSAGFSAARV 
GLGLTAAGLV GLAAGVPVGR WADRNGPREV YLGLGLVSAA TMAAYAGLRS FWLFCAVAVV 
DNLAASGTRA ARGALIARLA GRDPHLYRAR LRSVANLGLA VGALIGAAGL AIDTRAGYTA 
ILLLNSLTFL MNTLLCLRIP PLRSIPAPPG RTAWPVVRDL RFLAFSCLAA VLAIHDEVLL 
FAVPLWIARV GHAPRWIVAV LLFVNTLMVA SLQVRIGRAV DTIAGGVRAS VRAGWILAAA 
ALLFGVIGTV PGWTAIAILL LAAAAHSVGE IVQQAGYSEL SFGLAPDHAQ GQYQGMSATF 
SGAAIALAPG LLAWLCLGVG TRGWLVLAGA FALAGALTPI AVGAPDAAG