Gene Cagg_3716 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3716
Symbol
ID	7268252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4515824
End bp	4517146
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	57%
IMG OID	643568523
Product	extracellular solute-binding protein family 1
Protein accession	YP_002464988
Protein GI	219850555
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000472149
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCACGTT CGCGGATGAC TTTGTTGGTA ATTCTGATGA CCGTCTTCAG CTTTGTGCTG 
GCGGCGTGTG GTGGTGGATC GACGTCTCAA CCTTCTGGTG GTGAGCAGAC GGGACAGACG 
ACCGGCGAAA AGAAGCGGGT AACGATCCTC GGTGCGTTTG GTGGCGGTGA AGCCGATGCT 
TTCGAGGAGG TGATCAAGGT TTTCGAGGCA GCTAACCCAG ATATCGATGT GGTCTACACC 
GGCGTTAATG ACTTCGACAC CCAGATTGTC GTGCGGGTGC AAGCCGGTGA TCCGCCGGAT 
ATTGCCGGTT TCCCGCAGCC GGGTGGTGCC GCACGGTTGG CTGCTGAAGG TAATCTGGTA 
CCGCTGTGGC CGGAAGTTAT CTCGTTGATC GACAAGAACT ATGCCCCGTT CTGGAAGGAA 
TTGGGTACGT TCGACGGCAC GCCCTACGGA GTCTTCCATC GTGTCAATGC CAAGGGCTTT 
ATCTGGTATA ACAAACCGGC GTTTGAGGCT GCCGGCTATA AGGTTCCCAC CACGTGGGAA 
GAGTTGAAGG CCCTGACCGA GCAGATGAAA GCCAACGGTC ATACACCGTG GTGCGACGGG 
ATCGAATCGG GTGCAGCGAC CGGTTGGAAG GGCACCGACT GGATCGAAAA CATTATGCTG 
CGTACCCAAA CCACCGCTGT TTACGACAAA TGGATTTCGG GTGAAGTGCC CTTCAGCTCA 
CCAGAAGTTA AGCGCGCTTT CGAGATTTTG GGTGAGGTCT GGTTCACCGA TGGTAATGTC 
TTCGGTGGTC GCCAGTCGAT TGTGCTCACG AACTTCGGTG ATGCGGCGAC CTTCCTCTTC 
ACCGAGCCAC CGAACTGCTG GTTGCACTTG CAAGGTAGCT TCGTTACCAA CTTCTTCCAA 
GACTCGGTCA AGGCCGATCT TGATAACAAG GTTGGTTTGT TCGTGATGCC GCCGATTGAT 
CCTAACGTCA CCCCGGCGCT GGAGGTTGGT GGTGATGTGT TCGTGATGCT CAAGGGACGT 
GATCGGCCCG AAGTGCGGAA GTTCATGGAG TTTATGGCGA CCGGTGCATC GGCAACACCG 
TGGGCACGGC TCGGTGGTGG TATCTTCCCG CACAAGGATC AAGACCTGAC GGTCTATCCG 
ACCTCGATCG AGCGGCAGGT CGCCGAAGCG ATCCTCGCTG CGCAAGCCGC TCGCTTCGAT 
GCTTCGGATG CGATGCCGGC GGCGGTGAAT GCAGCGTTCT GGAAGGGCGT GACCGACTGG 
GCTAGTGGTA CGCGCGATCT TGATACCGTG TTGGCCGAGA TCGACGCGGC GCGTAATCAG 
TAG

Protein sequence

MSRSRMTLLV ILMTVFSFVL AACGGGSTSQ PSGGEQTGQT TGEKKRVTIL GAFGGGEADA 
FEEVIKVFEA ANPDIDVVYT GVNDFDTQIV VRVQAGDPPD IAGFPQPGGA ARLAAEGNLV 
PLWPEVISLI DKNYAPFWKE LGTFDGTPYG VFHRVNAKGF IWYNKPAFEA AGYKVPTTWE 
ELKALTEQMK ANGHTPWCDG IESGAATGWK GTDWIENIML RTQTTAVYDK WISGEVPFSS 
PEVKRAFEIL GEVWFTDGNV FGGRQSIVLT NFGDAATFLF TEPPNCWLHL QGSFVTNFFQ 
DSVKADLDNK VGLFVMPPID PNVTPALEVG GDVFVMLKGR DRPEVRKFME FMATGASATP 
WARLGGGIFP HKDQDLTVYP TSIERQVAEA ILAAQAARFD ASDAMPAAVN AAFWKGVTDW 
ASGTRDLDTV LAEIDAARNQ