Gene Cagg_0052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0052
Symbol
ID	7269049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	74171
End bp	75355
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	54%
IMG OID	643564925
Product	major facilitator superfamily MFS_1
Protein accession	YP_002461441
Protein GI	219847008
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0533756
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.852382
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACAT TGCCTACCAC GATACCTCAC ACCCTGACGT GGCCGACGAT CATAATTCTG 
GTATGGGGAC GCTGGCTCAT CAGTGTGGCA TTTCGCCTCG TTTACCCACT GCTTACTTTG 
CTGGCAGCAA GCTTTACCGT CGATCTCAAT GTAGCAAGTT TGTTAATTAC TGTGCAAGTG 
GCAGCCTCGC TCCTCAGTCC GCTCGGTGGT TTCGTGAGCG ATCGGATTGG CGATCGGGCA 
ACAATGCTGT GGGGCGGTAT CATCTTCTGC ACCGGATCGT TGATTTGTGC CCTCAGCCGT 
AGCTTTGGTT GGTTTCTCTT GGGTTATGCT GTTATTGGTT TGGCCGTCGC CATAGCGATG 
CCGGCCTTGC AGAGCTATGT CAGTACGCGC AGTCACTATG AACATCGTGG GCGCATGCTC 
GGTGTTCTCG AATTGAGCTG GGCGCTATCG GCATTGCTCG GTATACCATT GGTGACGTGG 
ATCTCCGAAC GGTTTGGCAT CGCCACCGCC TTTGGTGTGC TGACCGTTGC TGCCATCGCG 
ACCGTTCTGT TGTTTTTGGT ATTACCAAAC GATCGACATG CTACGGGGCC ATCCACGCCG 
CCACCTTCCT TCCAGAGTAC ATTGCAAACC TTACGCCAAT CGAATGTCCT GGCAGCACTT 
GGCTTTGTCT TCATCCAACT CGCCGCCGTC GAACTGATAT TTGTCAGTTA TGCCGGCTGG 
TTGAGTAGTG CATTTGCCGC TACCACAACT CAGCTCGGTC TTGTGTTCGG TCTGCTCGGC 
GTGGTCGAAC TACTCGGTTC ATTGACTGCG ACACTGTTTA CCGATCGGAT CGGTAAGCGC 
CGATCGGTGT TAGGCGGCTT TACATTGGTC GGCATCTGGC TCCTGCTCTT GCCGCAAAGT 
CATTCGTGGC CGGTCTTTCT CTCGCTGCTG TTGGCATTTG ATCTCTGTTT CGAGTTTGCG 
ATTGTCTCTA CTTTTCCCTT GATCAGTGGC CTGAACGCTC AGAATCGTGG CGCCATTTTA 
GCGGCGATGA CCGCATGTAT CGGCGGTGGC CGCATTGTCG GATCGCTGGT CGGACCATGG 
CTCAGCACGA TCGCCGGCTA TACGATCAAT AGTACGTTGG CCGGGATTTG TGTATTGATC 
GGGGTTGGGA TGGGATGGTG GTTCATGCAT GAAGGTCGGG CATAA

Protein sequence

MTTLPTTIPH TLTWPTIIIL VWGRWLISVA FRLVYPLLTL LAASFTVDLN VASLLITVQV 
AASLLSPLGG FVSDRIGDRA TMLWGGIIFC TGSLICALSR SFGWFLLGYA VIGLAVAIAM 
PALQSYVSTR SHYEHRGRML GVLELSWALS ALLGIPLVTW ISERFGIATA FGVLTVAAIA 
TVLLFLVLPN DRHATGPSTP PPSFQSTLQT LRQSNVLAAL GFVFIQLAAV ELIFVSYAGW 
LSSAFAATTT QLGLVFGLLG VVELLGSLTA TLFTDRIGKR RSVLGGFTLV GIWLLLLPQS 
HSWPVFLSLL LAFDLCFEFA IVSTFPLISG LNAQNRGAIL AAMTACIGGG RIVGSLVGPW 
LSTIAGYTIN STLAGICVLI GVGMGWWFMH EGRA