Gene Cagg_0729 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0729
Symbol
ID	7268048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	907390
End bp	908721
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	57%
IMG OID	643565580
Product	extracellular solute-binding protein family 1
Protein accession	YP_002462089
Protein GI	219847656
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000254304
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCTTC GGAAACACAC TCTGTCGTGG ATTGCGCTGA TTGCCCTGTT TACCGTGATG 
CTAGCGGCGT GTGGCGGTGG TCAGCCTACC ACAGGGAGTG GCAGTGGTGG GCAAAGCGGC 
AGCAGTGCGA ATACCGGTGG CAGCGGCCAA GCGGTTACCA TTCGCTGGCG GACTCGCCCC 
GGTGATGCTG CCGAGCAGCG TGTCTATGAA GAGTTAAATA CCCTTGTCAA CGAAAAACTC 
AAGGATAAAG GGATCACCGC AGTATACGAT CCGGCGCCCA ATCAGGGCTA CTTCGAGAAG 
CTGAAGACCG AGTTGGCAGC CGGCAATGCC CCTGACATCT TCTGGATCGG TGGTGTCGAG 
TTAGCGGATT TTGTCAATAC CGGTCAGATT CTCGATCTGA AGCCACTGAT CGATGCCGAT 
AGCAGCTTCC AGTTGAGCAA CTTTTACCCG AACGTGATCG AGCAGTTGAC GCGCGATGGG 
AAGATCTACG GTCTGCCGCG CGACATCTCG ACGATGGTCG TGTATTACAA CGAAGACCTG 
TTCAAAGCCG CAGGCTTGAA GACGCCGAAA GAGTTGGCGG CTGAGGGTAA CTGGAATTGG 
GATACTATGC TCGAAGCGGC ACGCAAACTG ACCGATCCGG CGAAGCAGCA GTACGGCCTC 
GGGTTTGGTA ACTGGTGGGG ACCGGCTTGG GGTTACTTTG TTAACGCTGC GGGTGGTAGT 
CCCTTCACGC CTGACCGTCG CGGGTGTGCG TTGAATTCAC CAGAAGCGAT CAACGGCGCC 
AAGATGGTGC GGATGCTCTA CGATGAGAAG CTCCTGCCGG CCGGTGATGC GGATGGTGAG 
GCACTCTTCA ATGCCGGTAA GGTAGCGATG TATTTCAATG GCCGCTGGTT TACCCCCGGT 
GTCCGCACCA ATGCCCAGTT CAACTGGGAC GTGGCGGTGA TGCCGGAGGG CAAGGTGAAG 
AGTACATGGC TCTTCTGGGG GCCGTATCTG GTTAATGCAA AGACCGCTAA CGCGCAGGCA 
GCTTGGGAGG TGCTGAAGGT ACTGACCAGC GCCGAGGCCA CGGCTAAGGT CGCGGCGTTA 
GGGACAAACA TCCCGCCACG CAGCGATCAA GAGGCGGTCA ATGCATTCCT CGCCTCGACG 
CCACCGGCCA ATAATCAGGC TTTCCTTGAT GGGATCCCCT ATGCAGCACT GGAAGCACCG 
GTGTGGGATG GAAGCTGGGC AGATTTCAGT GGTATTGTCC AGAGCCTCTG GGACCAGATG 
ATCGCCGGAC AGATCACGCC TGAGCAATTT GGTCAGCAGG CATGTGAACA GGCGGCCAGC 
ACCTTTAAGT AG

Protein sequence

MMLRKHTLSW IALIALFTVM LAACGGGQPT TGSGSGGQSG SSANTGGSGQ AVTIRWRTRP 
GDAAEQRVYE ELNTLVNEKL KDKGITAVYD PAPNQGYFEK LKTELAAGNA PDIFWIGGVE 
LADFVNTGQI LDLKPLIDAD SSFQLSNFYP NVIEQLTRDG KIYGLPRDIS TMVVYYNEDL 
FKAAGLKTPK ELAAEGNWNW DTMLEAARKL TDPAKQQYGL GFGNWWGPAW GYFVNAAGGS 
PFTPDRRGCA LNSPEAINGA KMVRMLYDEK LLPAGDADGE ALFNAGKVAM YFNGRWFTPG 
VRTNAQFNWD VAVMPEGKVK STWLFWGPYL VNAKTANAQA AWEVLKVLTS AEATAKVAAL 
GTNIPPRSDQ EAVNAFLAST PPANNQAFLD GIPYAALEAP VWDGSWADFS GIVQSLWDQM 
IAGQITPEQF GQQACEQAAS TFK