Gene Cagg_1704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1704
Symbol
ID	7269410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2080940
End bp	2082004
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	53%
IMG OID	643566546
Product	extracellular solute-binding protein family 1
Protein accession	YP_002463041
Protein GI	219848608
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCGTG CTACCTTCAT TATCTTACCC ATCATACTCG CCGCATGTAG TGGTGGATCA 
TTCGTCTCGC CACCGGTTAC CCCAACTGCC ACCAAGCTGG TGATCGCCGG CTGGGCCGGA 
TATGTGCCGC AAACGATCCT CGATGCGTTT AGCGCCGAAA CAGGTATTGC TGTTGAGTAT 
GTGATCTACG AAGAACAATC CGCAGCTATT GCCCAACTTC GCGCCGGGGC CGATTACGAT 
CTCGTCGTTA TGGGAAGCTC TTTCGTACCG CGGTTGATCG GCGATGGCTT GCTCGCACCG 
CTCGATTACG GCCAAATTCC AAACCATCGC AATATTAGCA TCAATTTTCA CGATCTGAGT 
TATGATCCGG GTAACCGCTA TTCCGTCGTG TACCAGTGGG GTGTCGGTGG GTTGATCGTT 
CGCCCTGACC TGCTCGACCG GCCGATCACA CGTTGGGCCG ATCTGTGGGA TCCAGCGCTA 
GCCGGTAAAA TTGCGATGTG GGTGACGGAA GAAGACCTGT TTGCTATTAC CCTGAAAGCG 
ATGGGTCAGC CAGTGAACAC AACCGATCGC AGTGTTCTTG CGGAGGCAGC CGAGCGCATC 
AGCACGCTTT TACCTAACAT CGTTGCGCTC GATCCGATAA TGCCGAACGC TGCCGATCTC 
CTTGCCAACG GCACCTATCC AATCGTATAT GGATGGTCGT TTGACGCGAT AGCCGGTCAT 
GCTTTGAATC CGGCGGTAGC GTTCGTTTTT CCTGAAGAAG GGCCGATTTT CTGGATCGAC 
ACCTTGATCG TGCCTAAGGC TAGTACACGC CAAGCAGCCG CCTTTCAGTT TATCAATTTT 
GTCTTGCGTC CAGAGATAAG TGCGCAAATT ACCAATGAAA TCTACGTCGC AACAGCCAAT 
GAACGAGCAA TGTCGTTGAT CGATCCAGCC TTGCGAGACC ATCCGTGGAT CTTTCCTGGG 
CGTATAATGT TGAAAGCGGA GTATTTGAGT GAACCGCCGG TGGACATCAA GGCATACCGC 
CACCAGCTTT GGGAACAAAT CGCAACCACA CAACGTGTGA GGTGA

Protein sequence

MYRATFIILP IILAACSGGS FVSPPVTPTA TKLVIAGWAG YVPQTILDAF SAETGIAVEY 
VIYEEQSAAI AQLRAGADYD LVVMGSSFVP RLIGDGLLAP LDYGQIPNHR NISINFHDLS 
YDPGNRYSVV YQWGVGGLIV RPDLLDRPIT RWADLWDPAL AGKIAMWVTE EDLFAITLKA 
MGQPVNTTDR SVLAEAAERI STLLPNIVAL DPIMPNAADL LANGTYPIVY GWSFDAIAGH 
ALNPAVAFVF PEEGPIFWID TLIVPKASTR QAAAFQFINF VLRPEISAQI TNEIYVATAN 
ERAMSLIDPA LRDHPWIFPG RIMLKAEYLS EPPVDIKAYR HQLWEQIATT QRVR