Gene Cagg_0420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0420
Symbol
ID	7266588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	520153
End bp	521535
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	57%
IMG OID	643565287
Product	major facilitator superfamily MFS_1
Protein accession	YP_002461801
Protein GI	219847368
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCAACG AACGTCAGCG TAATCAGATC CTCGGCCTGT TGTTCTTCGG CGTATTAATG 
GCAGCGCTCG ATATTGCCAT TGTTGGGCCG GCATTGCCGG TGCTTCAGCG TGTATTTACG 
GTTAGCGAGC GACTGCTGTC GTGGGTTTTC TCGATCTATG TACTCGGCAA TCTAGTCGGG 
ACACCGATGA TCGCCGCGCT CTCGGATCGG TTTGGTCGGC GGGCGTTGTA TGTTCTGAGC 
TTAAGTAGCT TCGCGCTTGG TTCACTCATC GTTGCCCTTG CACCATCGTT TTCGGTACTT 
CTCGTCGGGC GGTTGCTACA AGGTCTTAGC GCCGGCGGTA TTTTCCCGGT AGCCAGCGCC 
GTCATCGGCG ACACATTTCC GCCAGAACGA CGTGGATCGG CTCTCGGCTT GATCGGGGCG 
GTCTTCGGGA TCGCGTTTCT GATCGGCCCG ATCATTGGTG GGCTGTTACT CTTGCTTGGT 
TGGCAATGGT TATTCTTGAT CAATTTGCCA ATTGCGGCAA TCCTCATCGC CTTCAGTGTG 
CGACTCTTAC CGGGACGCAC AGTAACAAGC AGTGCGCCCT TCGATCTCAC CGGCTTGCTG 
GTGTTGGGTA TCATGCTGAG CAGTCTCGCA TACGGCCTCA CCGAACTTGA TCCAGATGCG 
ATCCGTGCTG GGAATGTACC ATTCTTTGCG ATAGGTGCCT TAATTGTCGC CGCCTTGCTG 
GTACCGGCTT TTATCACGAT CGAGAAACGA GCCACCGAGC CAATTTTGCA GCCATCTATC 
TTTCGTTCAC GTCAAATCTG GCTGACAGCA GCCTTGGCCG TCGGCGCCGG TATCGCCGAG 
TCGTCGATTG TCTTCGTGCC GGCGTTGCTG ACGGCGGCGC ACGGTGTAAG CAGCTCAACT 
GCCAGCTTTA TGCTCTTACC GGTGGTATTA GCGATGGCGG TCGGATCACC GGTTTCGGGT 
CGGATGCTCG ATCAATTTGG GTCGCGGATT GTGGTGACTA TCGGTGTGAT TCTGAGCGGT 
GCAGGGCTGG TGTTGCTCGG TGCGCTACCG ATGAGCCTTG TCGCCTATTA TCTTTCCGCG 
ATCGTGTTCG GGATCGGCCT GGCGATCCTG CTCGGTGCAT CGTTACGGTA CGTTCTGCTG 
AATGAAGTTC CGGCCAACGA ACGCGCAGCA GCGCAAGGAT TACTTACCGT CACGATGGGC 
GTTGGGCAGT TGCTCGGCGC GGTGTTGGTT GGCTTGATCG CCGCCACCGG TGGCGGTGGA 
GCCGGTGGAT ATGGGGTGGC CTTTTTAGTC ATCGGTATCT TGATGCTCGC CCTAACCTTT 
GCCGGCTTGG GGTTGAAGAA TCGGACGGCC GAGAAAGCCA CAGCGCTGGC CCATGCTCAT 
TAG

Protein sequence

MVNERQRNQI LGLLFFGVLM AALDIAIVGP ALPVLQRVFT VSERLLSWVF SIYVLGNLVG 
TPMIAALSDR FGRRALYVLS LSSFALGSLI VALAPSFSVL LVGRLLQGLS AGGIFPVASA 
VIGDTFPPER RGSALGLIGA VFGIAFLIGP IIGGLLLLLG WQWLFLINLP IAAILIAFSV 
RLLPGRTVTS SAPFDLTGLL VLGIMLSSLA YGLTELDPDA IRAGNVPFFA IGALIVAALL 
VPAFITIEKR ATEPILQPSI FRSRQIWLTA ALAVGAGIAE SSIVFVPALL TAAHGVSSST 
ASFMLLPVVL AMAVGSPVSG RMLDQFGSRI VVTIGVILSG AGLVLLGALP MSLVAYYLSA 
IVFGIGLAIL LGASLRYVLL NEVPANERAA AQGLLTVTMG VGQLLGAVLV GLIAATGGGG 
AGGYGVAFLV IGILMLALTF AGLGLKNRTA EKATALAHAH