Gene Cagg_0769 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0769
Symbol
ID	7268088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	953611
End bp	954849
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	56%
IMG OID	643565620
Product	major facilitator superfamily MFS_1
Protein accession	YP_002462129
Protein GI	219847696
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCACA TCACATCCAA CCTGCGCGTA TCGATCCTCA AGATTCCGGC TGCGGTTTGG 
CGTATTTTGG CCCACAGTTT TATTTACGGT TTCGCCCTTA GTATTGCCGA TATTTTGTTC 
AATTTTTACC TCGTTAGTCA AGGTTATACC ATCAATGACG TGGGTTTGCT GTCGATGGTG 
AGCCGGGCTG CCGGTATGGT GATGGGGTTA CCGATCGGTT GGCTTATCGA CCGGTTCGGG 
TCACAACGCG CAATGATCGG TGGTGTGATA GGGTATGCGC TTGGCTGGGC GGCACTCTTA 
CAGGCGCCGG CATTGCCGTG GCTCATTGCT GCCCAATTTG TCGTTGGGGC TTGCTATCTG 
CTGGCTGCTA CTGCAGTTAC TCCGTTGCTG GCGTTGGTGA CTACCGAAGA GCTGCGTCCT 
CTCGTCTTCG GTATGAATGC TTCGGCGACA TTGATAGTCG GCTTGCTCGG AAGTGCTGTT 
GGTGGGGTGT TGCCGATGGG AGCAGCCTTG ATGATGGCCG TTGAGCCGCA ATCTACTGTG 
GCTTACCGGG TGGCTCTCAC GACGGTGATA GGGTTGAGTA TTGTGGCGTT ATGGCCGGTA 
CTGGTGCAGC TCCCGGCGGT GGCGGAGAGA CGTGCCGCCG GTGAGGAGGA ATCGGTTGGA 
TCGCGCCGGC TCTCGTGGTT CATGCTGCTC TGGATGGCTT TGCCCTCGTT TCTGCTCGGT 
GTTGGTGGTG GCGCAATTTT GCCGTTTCAG AATCTCTTTT TTCGCGATCA GTTTGGTTTG 
AGCGACGCCG GAGTCGGGTT GACTCTATCG CTGGCTTCGC TTGGCGCCGG CGTTGGGGCA 
TTGCTGGGTG CGCCGGTGGT CCGTCGTATC GGCTTGCAAC GCGGTGCCGC ATTGCTACGG 
TTAGGTGCGA CACCGGCAAT GTTGCTGATG TTAACACCAT GGTTGCCGCT CGCCATTATT 
GGGTTTTTTG CCCGTGGCTT TTTCATTGCT GCCAGTTATC CGATGAACGA TGCCTTGGTG 
ATGGGGGCTA CGCCCACCAC TCAGCGTGGG CTTGCTATGA GCTTGATGAG TTTGCTCTGG 
GCCGGTGGTT GGGCTATTTC GGCGGTGATT TGGGGGTGGG TAACACCGAT CTTTGGGTAT 
GGGCCGCAGA TTGTTGCTGC TGCTTTGGCC TATGCCCTCT CGGCGTTGGT GATTTGGAGT 
CTGCGTCTGC AACGATCGGC AGAGCAGACG GCTGCATAG

Protein sequence

MTHITSNLRV SILKIPAAVW RILAHSFIYG FALSIADILF NFYLVSQGYT INDVGLLSMV 
SRAAGMVMGL PIGWLIDRFG SQRAMIGGVI GYALGWAALL QAPALPWLIA AQFVVGACYL 
LAATAVTPLL ALVTTEELRP LVFGMNASAT LIVGLLGSAV GGVLPMGAAL MMAVEPQSTV 
AYRVALTTVI GLSIVALWPV LVQLPAVAER RAAGEEESVG SRRLSWFMLL WMALPSFLLG 
VGGGAILPFQ NLFFRDQFGL SDAGVGLTLS LASLGAGVGA LLGAPVVRRI GLQRGAALLR 
LGATPAMLLM LTPWLPLAII GFFARGFFIA ASYPMNDALV MGATPTTQRG LAMSLMSLLW 
AGGWAISAVI WGWVTPIFGY GPQIVAAALA YALSALVIWS LRLQRSAEQT AA