Gene Cagg_2342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2342
Symbol
ID	7268692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2848198
End bp	2849481
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	56%
IMG OID	643567171
Product	major facilitator superfamily MFS_1
Protein accession	YP_002463656
Protein GI	219849223
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000352958
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00223229
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAAACGCA ATTCTCCACT CTTGTTCATC TTCCTCACGA TCTTCATCGA CCTTCTCGGC 
ATCGGCATTG TGTTGCCGTT GCTGCCGGAA TATGTCAAAA TTATCGAACG CTCAAGCTGG 
CCGTGGTTGG CCGATAACCG TGCTTTGGTG GTCGGCGCGC TCACTGCTTC GTATGCGTTG 
ATGCAGTTTC TCTTCGCGCC TATCCTTGGT GCGTTAAGCG ATCGTTTCGG GCGCCGACCG 
ATATTGTTGC TGAGTCTGTT TGGGGTCGGT CTGAGTTATC TCGTTTTTGC CGTCGCCGAA 
AACCTGACGT TCCTCGGTGT CGAGACGGTT ATCGGGTTGC TGTTCCTTGC CCGTATTACG 
GCCGGTATCA CCGGCGCCAG CATCAGCACA GCGCAGGCAT ACATTGCCGA TGTCACACCT 
CCCAGTGAGC GCGCGCGTGG TCTGGGGATG ATCGGCGCTG CCTTTGGACT CGGTTTTATG 
CTTGGTCCGG CTATCGGTGG CCTCCTTTCT AACATTAGCT TGCAGGCACC GGCGCTGTTC 
GCTGCTGCAC TCAGCTTTGC TAACGTTATG TTTGGCTTCT TCCGCTTGCC CGAATCGTTG 
CCACCAGAGA AGCGGATGCG GTCGGTGTCA CGCAATCTGA ATCCAGTTAC TCGTCTAACG 
GCCGTCGCGC GCGATCCTCG AGTTCAACCT TTTATCTTCG GTAGTGTGTT ATTTAATCTT 
GCCTTTGCCG GCCTGCAAAG CAATTTTCCG GTCTACAGCG ACGTGCGCTT CGGGTTTAGC 
CCACAGCAGA ATGCGCTCGT TTTTGCCTTC ATCGGGTTGA TTGCGGTGTT GGTGCAGGGC 
TTTCTTATCC GCAAATTGGT GGCACGCTTC GGCGAGGCTC GCCTGGCTTT GGCCGGTCTG 
ACTCTGATGG CTCTTGGCTT TGCTGCGACC GGTCTCGCGC CTGCGAGTTG GATGCTCTTC 
CCGGCAATCG GGATCGTGGC GCTGGGTAGT GGTATGCTTA CTCCATCGCT GACCAGCCTG 
ATTTCGCAGT CGGTGTCGGC TACCGAGCAA GGCGCGATCC TCGGTGGAGT GCAGTCGTTT 
AATAGCCTCA CGATGGTGCT AGGGCCGCTG TTGGCCGGTA CCCTGTTTGA CCTGATTGCA 
TCAAATGCGC CATACCTGTT TGGGGCGGTC TTGCTCACCG GTGCGCTTAC CGTTCTGCTC 
TCTACCCTGC GTCGGCGCTT TGTTACGATA CTGCAGCCCG ATACCGCAGT GGTTACCATT 
GATACACCGG TTCGCGTTGA GTAG

Protein sequence

MKRNSPLLFI FLTIFIDLLG IGIVLPLLPE YVKIIERSSW PWLADNRALV VGALTASYAL 
MQFLFAPILG ALSDRFGRRP ILLLSLFGVG LSYLVFAVAE NLTFLGVETV IGLLFLARIT 
AGITGASIST AQAYIADVTP PSERARGLGM IGAAFGLGFM LGPAIGGLLS NISLQAPALF 
AAALSFANVM FGFFRLPESL PPEKRMRSVS RNLNPVTRLT AVARDPRVQP FIFGSVLFNL 
AFAGLQSNFP VYSDVRFGFS PQQNALVFAF IGLIAVLVQG FLIRKLVARF GEARLALAGL 
TLMALGFAAT GLAPASWMLF PAIGIVALGS GMLTPSLTSL ISQSVSATEQ GAILGGVQSF 
NSLTMVLGPL LAGTLFDLIA SNAPYLFGAV LLTGALTVLL STLRRRFVTI LQPDTAVVTI 
DTPVRVE