Gene Cagg_1059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1059
Symbol
ID	7268511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1309214
End bp	1310476
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	59%
IMG OID	643565904
Product	major facilitator superfamily MFS_1
Protein accession	YP_002462409
Protein GI	219847976
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATCGC AACCTTCATC CGCACTGAGC GACATCCGGC TTGGGTTACG CGCCAATTGG 
GCGCAATTCA GCTTGCTTGT CTTCGTTAAT GCCTTCGTCG GCGGCATGGT CGGCATCGAG 
CGCACCGTCT TGCCATTGCT GGCCGAAGCT GATTTCGGCA TAGCTTCCAA AACCGCCATC 
CTGAGTTTCA TCTTCAGCTT TGGGATTGTC AAAGCGCTTG CTAACCTGTT TGCCGGCAGG 
CTCAGTGATC GCATTGGCCG TAAGAAGGTA CTGGTTACAG GTTGGATCAT CGGTTTGCCG 
GTGCCGGTGA TCATCATCTT CGCGCCAAGC TGGGAGTGGA TCATCTTTGC GAATGGGTTG 
CTCGGTATCA ATCAGGGCTT ATGCTGGTCA ACTACTGTCA TCATGAAGAT CGATCTGGTC 
GGCCCCCAAC AACGCGGTTT AGCCATGGGC ATCAACGAAG CCGCCGGCTA TCTGGCCGTC 
TCGGCAGCAG CGTTCGGCAC CGGCTACCTT GCTACCACAT ACAGCTTACG CCCGCAACCA 
TTTATCATTG GGATTATCAT CGCCCTTGCC GGCCTCATCA GCTCGATCTT CTTGGTGCGC 
GAAACGCAGG GCCATGCCGC CGTTGAAGCG CGCACCCACC ACAACGGTAT GCCGCCCGCC 
GCACGACTGT CGTTTGCACA CATTCTGCTG CTGACCAGTT GGAAAGATCG CTCGCTCTTC 
GCGATCAGCC AAGCCGGTAT GTTCAACAAT CTCAACGACG GCATGGCATG GGGTCTCTTT 
CCGCTCTACT TTGCCCTGCA CGGTCTGTCG ATCGGCGACA TCGGCATCTT GAGCGCAATC 
TACCCGGCGG TATGGGGGAT CGGCCAACTC GGCGCTGGCG CGCTCTCTGA CCGCGTGGGG 
CGCAAACCAT TGATCACACT CGGCATGATT GTGCAAGCCG GCGGCATCTT CCTCTTTATC 
CTGACCTCAG ACTTCTGGAT ATGGGCACTA GGCAGCACCT TGCTCGGCCT CGGCACTGCC 
CTCGTCTACC CCACCCTTCT CGCCGCCATC GGCGACGTGG CCCACTCCAC ATGGCGCGCT 
TCAGCAGTCG GGGTCTACCG GCTCTGGCGT GACGGCGGCT ACGCAATCGG CGCGTTGTTA 
GCCGGCAGTT TAGCCGATGC ACTGGGGATC AGGTGGGCCA TTGGCGCCAC CGGCGGCCTC 
ACCCTGTTAT CAGGAATCAT CGTCGCCACG GTGATGCGCG AGACTCTGCC GGGACGACGA 
TGA

Protein sequence

MPSQPSSALS DIRLGLRANW AQFSLLVFVN AFVGGMVGIE RTVLPLLAEA DFGIASKTAI 
LSFIFSFGIV KALANLFAGR LSDRIGRKKV LVTGWIIGLP VPVIIIFAPS WEWIIFANGL 
LGINQGLCWS TTVIMKIDLV GPQQRGLAMG INEAAGYLAV SAAAFGTGYL ATTYSLRPQP 
FIIGIIIALA GLISSIFLVR ETQGHAAVEA RTHHNGMPPA ARLSFAHILL LTSWKDRSLF 
AISQAGMFNN LNDGMAWGLF PLYFALHGLS IGDIGILSAI YPAVWGIGQL GAGALSDRVG 
RKPLITLGMI VQAGGIFLFI LTSDFWIWAL GSTLLGLGTA LVYPTLLAAI GDVAHSTWRA 
SAVGVYRLWR DGGYAIGALL AGSLADALGI RWAIGATGGL TLLSGIIVAT VMRETLPGRR