Gene Cagg_3183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3183
Symbol
ID	7269932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3862409
End bp	3863644
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	58%
IMG OID	643568004
Product	extracellular solute-binding protein family 1
Protein accession	YP_002464477
Protein GI	219850044
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2182] Maltose-binding periplasmic proteins/domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.641192
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.908857
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGCGTT CGACGTTTTC ACTGCTTACC CTGCTCGCTC TGTTCGCTAC CTTCCTCGCT 
GCTTGCGGTT CAGCTCCCAC TCCCGCTCAG CCAACATCGG CCCCCGCTCA ACCGACTGCT 
GCTAGCCAAC CTGCTACCGG CGGAATGGCG ATTACCGGTA CTGTCACGCT CTGGCACGCC 
TACGGGACCG GCAGTGCCGA AGAGAAGGCC ATCAATATAC TGATCGACCG TGCCCGTGCC 
GCGTATCCGC AGGCTACCAT CAATGTGTTG CAAATCCCGT TCGACCAGAT TTTCAACAAG 
TTCAACAACG AAGTATCGTC CGGTGGTGGG CCTGATATGT TCATTGCCCC GAACGATAGT 
CTCGGTAGCC AGATTCGCGC CGGCGTCTTG GCCGATCTCA GCGAGTATCA GAGCATGCTG 
ACCGACGTCG CGCCGACCGG TGTGGCCGGT ATGTCGCTCA ATGGCAAGCT GTACGGTATT 
CCCGAGTCGT TCAAGGCGGT AGCACTCTAT TACAACAAGA GCAAGATTAC AAACCCGCCA 
ACAACGACCG ATGAGCTGTT GGCCATGGTC AAAGAGGGCA AGACGCTGGT GCTCAACCAG 
AATGCCTACC ACAATTTCGG CTGGTTGCAG GCATTTGGCG GCCAACTGAT GGATAATAAC 
GGCAAGTGCA TTGCCGATCA GGCCGGTGGT CCTGAGTGGT TCGCCTACCT CAAGGCGTTG 
AAGGAGGTGC CAACCGTCAC CTTCTCGACC GACGGTGGGC AGGCCGATTC GTTGTTCAAG 
GATGGCAAGG CCGACATGAT CATCAACGGC CCTTGGGTAC TCGGTGACTA CCGCGCCGTG 
TTAGGCGATA ACCTCGGTGT GGCACCGATG CCGGGCGCTA CCAAACCTGC CGGGCCGCTC 
ACCGGTGTTG ATGGCTTCTA CGTGAGCATC AACAGCCAGA ACATTGCCGG TGCCGTCGCA 
TTAGCAATGT TCCTGACCAG CCCTGAGTCG ATGAAGGTAT ATGTCGACGA GGCCGGTCAT 
GTGCCGGTAA GCACCAAAGT TCAGATTTCC GACCCACTGG TGCAAGCGTT TGCCCAGGCT 
TCGGCAACCG GTGTACCACG GCCACAGATT CCTGAACTCG ACAACTACTG GGGCCCCTTT 
GGCGACGCTA TGACGAAGGT GCTCGATGGT GGCGCCGATC CGGCTGCGGC TGTGGCCGAA 
GCCTGTGCGC TGATGAACAC CGCAAACGGT AAGTAA

Protein sequence

MKRSTFSLLT LLALFATFLA ACGSAPTPAQ PTSAPAQPTA ASQPATGGMA ITGTVTLWHA 
YGTGSAEEKA INILIDRARA AYPQATINVL QIPFDQIFNK FNNEVSSGGG PDMFIAPNDS 
LGSQIRAGVL ADLSEYQSML TDVAPTGVAG MSLNGKLYGI PESFKAVALY YNKSKITNPP 
TTTDELLAMV KEGKTLVLNQ NAYHNFGWLQ AFGGQLMDNN GKCIADQAGG PEWFAYLKAL 
KEVPTVTFST DGGQADSLFK DGKADMIING PWVLGDYRAV LGDNLGVAPM PGATKPAGPL 
TGVDGFYVSI NSQNIAGAVA LAMFLTSPES MKVYVDEAGH VPVSTKVQIS DPLVQAFAQA 
SATGVPRPQI PELDNYWGPF GDAMTKVLDG GADPAAAVAE ACALMNTANG K