Gene Cagg_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2043
Symbol
ID	7269202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2503160
End bp	2504221
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	56%
IMG OID	643566878
Product	periplasmic solute binding protein
Protein accession	YP_002463367
Protein GI	219848934
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0803] ABC-type metal ion transport system, periplasmic component/surface adhesin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000010108
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACATT TGCAGCGAAT CATCGGTATC CTATTGACAA CATTGCTAAT TGTCGCATGT 
GGTCAAACCC CGGTCGCCCA ACCGACCGGA ACACCGGGTA ACGAAACAGC CGCCCTGCCG 
ACCACTGCGC CAACAACAGC ACCAGCTCCG ACCGAAGTAC CAACTGCTCA ACCGACTGTA 
GCGCCCGAAC CGCTTGCCGT CATGGCCAGC ACGACCATCG TGGCCGACGT AGTACGTCAG 
ATCGGCGGTG AACGGGTGAA GGTGGAGACG ATCGTACCGC CCGGCGCCGA TGGTCACAAC 
TATGAGCCAA CACCACAAGA TTTAGCTCGG GTAAGCACGG CCAGGATAAT CTTTACCGTT 
GGCGCCGGAT ACGAAGAGTT TCTCGATCGG CTGATCGCCA GTTCGGGGAC GAAGGCCGAA 
GTCGTTAGCT TGTCCGAGAA CCTCGCCTTG CGCACACTAC GCGAGGAAGA GGTTGGCAAT 
GTTATGCATA GCCACGAGCA TGGTGATGAA CACGGTGATG AACACGGTGT TGGTGCAACC 
GATCCCCATA CATGGACCGA TCCGAGCAAC GTCAAGATTT GGGTCGATGT GATTGCCTCA 
AATCTAAGTC GGCTCGATCC GGCAAATGGA TCATTCTACA CCGAGCGTGC CGCCGCTTAT 
CAGCGCCAAC TCGATGAACT CGACCGTTGG ATTGCCGAGC AGTTTGCCGC AATCCCTGCC 
GAACGACGGT TGATCGTGGC GGATCATATT CTTTTCGGCT ACATGGCCGA TCGATACGGT 
TTGCAGCAGG TCGGTGCCAT TATTCCCGGT GTTAGCACCA GCGCAACACC TTCGGCCCAA 
GAACTTGCTG CCTTGCAAGA TCTGATCACC AAGCGGGGAA TCAAGGCGAT CTTTGTCGGT 
GAAATAGCCA ACTCGCAACT GGCCGAGCAG ATCGCACGCG ATACAGGAGC CAAGATCGTG 
ACGGTTCTTA CCGAAACCCT GACCGATGCC AACGGGCCGG GGGCAACGTA TATCGACTAT 
ATGCGCTTTA ACGTACAACA GATAGTTAAT GCGCTGCGCT AA

Protein sequence

MRHLQRIIGI LLTTLLIVAC GQTPVAQPTG TPGNETAALP TTAPTTAPAP TEVPTAQPTV 
APEPLAVMAS TTIVADVVRQ IGGERVKVET IVPPGADGHN YEPTPQDLAR VSTARIIFTV 
GAGYEEFLDR LIASSGTKAE VVSLSENLAL RTLREEEVGN VMHSHEHGDE HGDEHGVGAT 
DPHTWTDPSN VKIWVDVIAS NLSRLDPANG SFYTERAAAY QRQLDELDRW IAEQFAAIPA 
ERRLIVADHI LFGYMADRYG LQQVGAIIPG VSTSATPSAQ ELAALQDLIT KRGIKAIFVG 
EIANSQLAEQ IARDTGAKIV TVLTETLTDA NGPGATYIDY MRFNVQQIVN ALR