Gene Cagg_1664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1664
Symbol
ID	7268966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2031101
End bp	2032321
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	57%
IMG OID	643566506
Product	major facilitator superfamily MFS_1
Protein accession	YP_002463001
Protein GI	219848568
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTCA CCCAGCACGC TCGCTATCGG GGCTTAAGCA TCCTCATCGT GATTAACTTC 
ATGATGTACG CCGGCTTTTT CATGGTCATC CCGCTCGTAT CAGTCCACTA TGTCCAAACG 
ATGGGTTTTG CCGCAGTGAC GGTCGGGATG GCGCTCGCGT TGCGCCAACT CGTTCAGCAA 
GGGGTGAGTG TCGGCGGTGG GGTGCTCTCA GATCGCTTCG GCGGACGTAA CCTGATTACC 
GCCGGCGTCT TGATCCGCGC TCTTGGATTC GTCAGCCTTG CCTTTGCCAA CACACCATTG 
CTGCTCTTCG CCGCGATGCT ACTCTCGGCG CTTGGTGGAG CACTCTTTGA AGCACCGAGT 
CGAGCCGGGA TTGCTGTGTT GACAACCCCT GACGAACGCG CCCGTGCCTT TTCGATCAAC 
GGGGTGGGCG GTGGTTTAGG GATGGTAGTC GGGCCTTTCG TCGGTTCGCT CTTACTCGAT 
TTTGGCTTTA CTACGGTAGC CCTGGCAGCC GCCATCTGTT TTGCGCTGAT CGGCGTGCTC 
AGCTTACTCT TACCGCCGCT GGAGACGGCA AGTGATCGGA CACGGCTAGG GTTTGGTTTG 
AGGTTGGCAT TGCGCGACCG TCCGTTTCTG ATCTTTACCG CCTTACTGAT GGGCTACTGG 
TTTATGTGGG TACAATTGAC GATCAGCCTA CCACTGGCCG GCGAGCGATT GACCAATGCC 
GCCGATGCGG TGCGGTGGAT CTATGGTATC AATGCGGGGA TGACCGTCCT CTTGCAAATC 
CCGATCATGG GGCTGGTTGA ACGACGCCTC CGACCACCCA CCATCCTGAT CCTCGGTATC 
GCGTTGATGG CCGGTGGCCT GGGAATGGTT GCCATCGCCG AGACGTTTAC ATTGCTCATC 
GGTTGTATCG TTATCTTTAC CATCGGCACC TTGCTTGCCA CCCCATCCCA ACAGAGCGTC 
ACTGCCGCAC TCGCCGACCC ACGCGCGCTT GGCTCATACT TCGGGGTTAA TGCCCTAGCA 
CTCGCATTTG GTGGCGGATT AGGGAACCTA AGCGGTGGTC TGTTGATCGA TCTCGCTACC 
GTTCTCCATC TCCCGGCATT ACCATGGATT GTTTTTGCAA CGATTGGTCT TATCAGCGCT 
ACCGGCCTCG TCATCCTCGA TCGTCGGTTG CAACGACAAT CAAATATCGC CGTCAACGCT 
CAACAGCAAC CATCGCCGTA A

Protein sequence

MTLTQHARYR GLSILIVINF MMYAGFFMVI PLVSVHYVQT MGFAAVTVGM ALALRQLVQQ 
GVSVGGGVLS DRFGGRNLIT AGVLIRALGF VSLAFANTPL LLFAAMLLSA LGGALFEAPS 
RAGIAVLTTP DERARAFSIN GVGGGLGMVV GPFVGSLLLD FGFTTVALAA AICFALIGVL 
SLLLPPLETA SDRTRLGFGL RLALRDRPFL IFTALLMGYW FMWVQLTISL PLAGERLTNA 
ADAVRWIYGI NAGMTVLLQI PIMGLVERRL RPPTILILGI ALMAGGLGMV AIAETFTLLI 
GCIVIFTIGT LLATPSQQSV TAALADPRAL GSYFGVNALA LAFGGGLGNL SGGLLIDLAT 
VLHLPALPWI VFATIGLISA TGLVILDRRL QRQSNIAVNA QQQPSP