Gene Cagg_0710 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0710
Symbol
ID	7266962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	877244
End bp	878458
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	56%
IMG OID	643565561
Product	major facilitator superfamily MFS_1
Protein accession	YP_002462070
Protein GI	219847637
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAACAC GTTGGCAAAC AACCTTATGG ATCATGTTCG TTGCGCAATT TCTTTCGGCA 
ATCGGATTTT CAATTATTTT CCCTTTTTTA CCCCTCTACG TCGCCTATCT CGGTGTCGCT 
ACGGTCGGTG ATATTGCCTT GTGGTCTGGG TTAGTCTTCT CATTGCAAGC TCTCACCATG 
GCCATTGCTG CACCGATTTG GGGATCGTTG GCCGACCGGT TCGGCTACAA GTTGATGGTC 
GAACGGGCAA TGTACGGTGG TGCGATAATT CTGTTGCTGA TGGGATTTGC GCGGTCGGCT 
GAGGAGTTAA CGCTCCTACG GGCAATTCAG GGAATGATTA CCGGCACAAT TTCGGCGGCG 
AATGCACTGG TCGCAACTGT TACCCCGCGC GAACGAATGG GGTTTGCAAT GGGAACGTTG 
CAAATGGGAC TATGGAGCGG CACAGCTACC GGGCCACTCA TCGGCGGACT GATGGCCGAG 
ACGCTGGGAT TTCGGGCCAC ATTTATCACA ACTGCGGCGC TCTTACTTGT ATCAGGTATA 
CTGGTAACGA TAGGAGTGCG TGGTGGTCGG CCAGCACCGG TAAAGCCCAA ACAACAACCA 
AGCGGAATGC TACGCGGTTG GTTGACGATT CTGCGCACTC CCGGCATCGG GCCGACTTAC 
GGGATGCGCT TTCTGAGCAG CTTGGCGCAG ACGATCTTGT TACCGTTTGC GCCACTCTTC 
ATCGCCAGCC TGCTCAGTGC CGGCGATCCG GTCAACGCCT TCACCGGTCT CATCGTTGGC 
GTTTCGTCGG CAGCGGGCAC GGCCACTGCT ATCTGGCTTG GTCGCCTCGG TGACCGGATC 
GGACACCGGC AGGTGTTAAT GGGGAGCGCA CTCCTTGCCG GTCTGACCTT TGCACCACAG 
GGTTTGGCGA GCAATGTCTG GCAACTGCTC ATCTTACAGG CGCTCAGCGG AGCAGCAATC 
GGCGGGATTA CCCCTTCGTT AAGTGCATTG CTTGGCCGAT ACACGGCAAC CGGCAATGAA 
GGAGCCGTGT ATGGCCTTGA CAGCTCGATT GTATCGGCAG CACGAGCAGT TGCACCGTTG 
TTCGGCGCGT TGGTGGTGGG ACCGTTCGGC TACGGAGCAG CGTTTGCGGT GAGTAGTGTA 
GCATGTTTTG CTATCGGTAT CGGCGCAGCA CGGTTGCCTA CCGAAGAACG GCAGATTGTA 
TCAAAACCGA CATAG

Protein sequence

MQTRWQTTLW IMFVAQFLSA IGFSIIFPFL PLYVAYLGVA TVGDIALWSG LVFSLQALTM 
AIAAPIWGSL ADRFGYKLMV ERAMYGGAII LLLMGFARSA EELTLLRAIQ GMITGTISAA 
NALVATVTPR ERMGFAMGTL QMGLWSGTAT GPLIGGLMAE TLGFRATFIT TAALLLVSGI 
LVTIGVRGGR PAPVKPKQQP SGMLRGWLTI LRTPGIGPTY GMRFLSSLAQ TILLPFAPLF 
IASLLSAGDP VNAFTGLIVG VSSAAGTATA IWLGRLGDRI GHRQVLMGSA LLAGLTFAPQ 
GLASNVWQLL ILQALSGAAI GGITPSLSAL LGRYTATGNE GAVYGLDSSI VSAARAVAPL 
FGALVVGPFG YGAAFAVSSV ACFAIGIGAA RLPTEERQIV SKPT