Gene Cagg_1787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1787
Symbol
ID	7267699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2192734
End bp	2193996
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	58%
IMG OID	643566627
Product	major facilitator superfamily MFS_1
Protein accession	YP_002463122
Protein GI	219848689
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.406772
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTATAC CAACCACCTT CGACTATGAA GTTGCTACGC GCCGGATCAT CGGCGCTTTA 
TTCGTTACGC AGAGTTTAGC ATCAGCCGCA ATTATTGCCA ACATCGCCGT GAATGCGATT 
GCCGGTGCGC AACTGAGTGG CAATGACGCA CTCGCCGGCT TGCCGGCAAC CCTGATGCTG 
GCCGGGGCGG CGCTGTCAGC CTATCCCGCA GGGCGAGCGA TGCAGCGGTT TGGCCGCCGG 
CCCGGTCTCC TTGTGGGGAT GGTGTTGGGG CTGATGGGCA TGCTGATTGA CGGAGTAGCG 
GTACTTAGCC ACTCGTTTCT TCTCTTTTTA GGCGGCCTGT TTGTGGTTGG CATGGCGCGT 
GGGATTATCG ATCAGAGTCG TTACGCCGCT GCCGATGTCG TCTCGCCGGA ACGACGGGCC 
GGTGCGATCA GCACAGTGGT CTTTGCGAGC ACTATCGGCG CAGTGGGAGG GCCGTTGTTG 
GTAGGGCCGT TGGGTCAGGT GGCGGCAGCC GGTGGCTTAC CTGAGTTGAC CGGACCAATG 
TTTGGTGGGG TAGCCCTCTT CGCCATCGCC ACGTTGGTCA TGTTTGTCTT TATGCGACCC 
GATCCGCGCA CGTTGGCGCT GCGCTTGAAT GTTCAGACGA CCACAGCCGA TGCCACAACG 
GTGGTACCGG TGCGTTCAGT GGGTACGATT CTGCGGCTCC CGCTCGTTCG GGCCGGACTG 
GTGAGTATGG TGCTTGGTCA GGTGGTGATG GTGTTGGTGA TGAGTGTCAC CTCGCTTCAT 
ATGAGCCATC ACGCTCACGG TCTTGATAGC ATCTCGTTGG TGATCGGTAC CCATACCTTT 
GGCATGTTTG GCCTATCAAT GTTCACCGGT CGGATCGCCG ACCGCCTGGG TCGGCCCCTG 
ACGATTATAT TTGGCGCTCT GATGTTAATC GTCGGGACAT TGATTGCACC GGCATCGCTC 
TTGACGCCAT GGCTGGCTTT GGGATTGTTT CTTGTCGGGT TGGGGTGGAA CTTTTGTTAT 
ATTGCCGGCT CAGCACTGGT GGCAGACGCC ATTGTGCCGT CGGAGCGTGG TGCGGTGCAA 
GGCGCGAGCG ATCTGCTCGT CAATCTAGGT TCGGCATTTG GTAGCCTGAG CAGTGGGTTT 
ATTCTGGCCG GGTTAGGGTA TCTACTACTC TGCTTGATCG GAGCGGTTCT TAGTCTTATC 
CCTCTGAGCG CGGCGTTGTG GTGGGGACGT TCGGTGCGCC AGACAGTGGC TGCGGCTGAT 
TAA

Protein sequence

MSIPTTFDYE VATRRIIGAL FVTQSLASAA IIANIAVNAI AGAQLSGNDA LAGLPATLML 
AGAALSAYPA GRAMQRFGRR PGLLVGMVLG LMGMLIDGVA VLSHSFLLFL GGLFVVGMAR 
GIIDQSRYAA ADVVSPERRA GAISTVVFAS TIGAVGGPLL VGPLGQVAAA GGLPELTGPM 
FGGVALFAIA TLVMFVFMRP DPRTLALRLN VQTTTADATT VVPVRSVGTI LRLPLVRAGL 
VSMVLGQVVM VLVMSVTSLH MSHHAHGLDS ISLVIGTHTF GMFGLSMFTG RIADRLGRPL 
TIIFGALMLI VGTLIAPASL LTPWLALGLF LVGLGWNFCY IAGSALVADA IVPSERGAVQ 
GASDLLVNLG SAFGSLSSGF ILAGLGYLLL CLIGAVLSLI PLSAALWWGR SVRQTVAAAD