Gene Cagg_1102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1102
Symbol
ID	7268555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1359320
End bp	1360858
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	59%
IMG OID	643565944
Product	major facilitator superfamily MFS_1
Protein accession	YP_002462448
Protein GI	219848015
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000316091
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAAGAATC CAGCTTTGAC CAACGTTGAA ACCCGTACCG TTGACCCGCG CTTGACACTG 
GCGCTGGTCT GTCTCGCGAT CTTTATCGGT GCGGTCGATC TCACCGTGAT CAGTGCAGCG 
TTGCCCAAAG TGATGATCGA CCTCCGCCTC GCTCTTGATA CCGAGCTGAA CCGTGCGTCG 
TGGGCGGTGA GTGGGTACTT GTTGGCGTAT ACCGTCAGTA TTACCTTCAT GGGGCGGTTG 
TCCGACCTAT TCGGACGGCG GAAGGTCTAT TTTCTCTGCC TCATTACCTT CTTGGTTGGA 
TCGGCGGTCG TGGCGGCGGC GCCCAACTTG ACGATATTGA TTGTTGGCCG GGTTATCCAG 
GCGCTTGGAG CCGGAGCGAT GGTACCGGTA TCGATGGCAC TGGTCGGCGA TCTCTTTTCG 
GTAGGGCAGC GGGCGGCTGC CCTCGGTGTG ATCGGGGCCG TCGATACTGC CGGCTGGATG 
GTTGGTCATC TCTACGGCGG CGTCTTGATG CGTCTGTTCG ACGACTGGCG GCTGCTCTTT 
TGGCTCAATC TCCCGATCGG TGCGGTGGCG CTTGGGCTGA CGTGGTACGC CCTGCGAAAT 
GTACCAACCC CGCCGCGCGT AGGTTCGTTC GATTGGCCGG GAACCGTGTT GTTGAGTGCC 
GGTCTGGTGG TATTGAACGT TGGTTTGGCG GCCGGGAGTG AGTTGGGGGC GACCGACTTC 
TACGGTGAGC GGTTGGGGCC TCCACCGTAT GCCGGGCCGC TGGTCGGATT AGCGTTGATG 
TTGTTCGCAC TGTTTGTCTG GGTCGAGCGA CGCAGCGCCG ATCCGTTGAT CGGCTTAGAA 
CTGTTTACGC GCCGTGATAC GGCGATGGCG TGTATCATCA ATGTGATGGT TGGTTTTGGC 
TTGGCCATCG CGATCACGAA TGTACCACTG TACATTAACA CTCGTCTGCT GCTTTACCAC 
CCAACCGATA GCGATATTCT GCGGATTGCA GCGTGGGATG CCGGTTGGAT GTTGTCGGCA 
TTGACCTTGA CGATGGCTGT CGCCGCATTG CCCGGTGGCC TATTGACGGC ACGCTTTGGG 
GCGCGCTTGC CGACCATCCT CGGCTTAGGC TTAGCGCTCG TTGGCTATCT CTTGATGACG 
TTCTGGGGGC CAGAGGCAAC CTATCTGCGG ATGGGGTTGG AATTGGCCCT AACCGGTATT 
GGTCTCGGCT TGGTGATCGC ACCGGTCGCC GATACCGTTG TAGCGGCTGC CGGCGGAGAC 
CAGCGTGGGG CAGCTTCGGC ATTGGTGATT GCTCTGCGTT TGGTTGGGAT GACGGTCGGT 
GTCGCGTTGC TCACATTGTG GGGCGTGCAT CGGCAAGATG TGTTACGGCG GGCCGGCGCC 
GATAACCCGC TGGCAATGAC CGACCCCGCC CGGTTTCTGA TGGAGATTGC CGCCAACGTG 
ATCGGCGAAA CCTTTCTCTT TGGCGCCGCA GCGTGTGTCA TCGGACTGGT GGCCGGTTGG 
TTAATGCGAA GATGGGTGGT AACACATCAC ACCGGATAA

Protein sequence

MKNPALTNVE TRTVDPRLTL ALVCLAIFIG AVDLTVISAA LPKVMIDLRL ALDTELNRAS 
WAVSGYLLAY TVSITFMGRL SDLFGRRKVY FLCLITFLVG SAVVAAAPNL TILIVGRVIQ 
ALGAGAMVPV SMALVGDLFS VGQRAAALGV IGAVDTAGWM VGHLYGGVLM RLFDDWRLLF 
WLNLPIGAVA LGLTWYALRN VPTPPRVGSF DWPGTVLLSA GLVVLNVGLA AGSELGATDF 
YGERLGPPPY AGPLVGLALM LFALFVWVER RSADPLIGLE LFTRRDTAMA CIINVMVGFG 
LAIAITNVPL YINTRLLLYH PTDSDILRIA AWDAGWMLSA LTLTMAVAAL PGGLLTARFG 
ARLPTILGLG LALVGYLLMT FWGPEATYLR MGLELALTGI GLGLVIAPVA DTVVAAAGGD 
QRGAASALVI ALRLVGMTVG VALLTLWGVH RQDVLRRAGA DNPLAMTDPA RFLMEIAANV 
IGETFLFGAA ACVIGLVAGW LMRRWVVTHH TG