Gene Cagg_2416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2416
Symbol
ID	7266139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2934180
End bp	2935229
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	55%
IMG OID	643567242
Product	extracellular solute-binding protein family 1
Protein accession	YP_002463725
Protein GI	219849292
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000133122
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0884701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATCATG TGACTCGTAT CGGCGTGTTG ATCATCGCTG CGCTTATGAT CGCAGCATGT 
GGTAATCAGA CAGCATCTAC TCCGACGCAA GCACCGGCAG CACCTACTCC GACGCAAACA 
CTGGCGAAAC TGGTCGTTTA TTCTGGCCGC AGTGAGAGCC TCGTCGGCCC CTTCTTTACC 
CGATTCACCG AGGCTACCGG CATTCCGGTC GAAGTTCGTT ATGGTGATAC CGCCGAATTG 
GCGGCGACGA TCCTTGAAGA GGGAGCCAAT AGCCCGGCCG ATCTCTTCTT TGCCCAAGAT 
GCCGGCGCAT TGGGTGCATT AGCCGCAGCC GATGTGTTGA TCCCGCTCTC TACCGATATC 
CTCAATCAGG TTGAAGCACG TTTCCGCTCG TCGGATGGTC GGTGGGTTGG GATTAGTGGT 
CGCGCTCGTG TAGTCGTCTA CAACACCAAC AAGCTCACGG AGGCCGACCT GCCGCGTTCG 
ATTACCGGTT TTGTCGATCC GCAATGGCGG GGGCGAGTTG GTTGGGCGCC GACCAACGGT 
TCATTCCAAG CCTTTATTAC GGCAATGCGC GTACAGTTGG GAGAAGAGGC GACGCGCAAA 
TGGTTAGAGG GGATGATTGC CAATGAGGTA AAGACGTATG AACGTAATGC GGCAATCGTG 
CAGGCTGTAG CCGCCGGTGA GATTGATGTC GGGTTTGTGA ATCACTACTA CCTCTACCAA 
TTGCAGCGTC AAGCGGGTGA TACACTGCCT GCCGCTAATT ACTATCCGGC TGATGGTGAT 
GTAGGCGCGC TGATCAATAT TGCCGGTGTT GGCATTCTCA AGACGGCCAA GAACGTGGCT 
GGAGCACAGC GGCTGATCGA GTATATGCTG TCAACCGACG GTCAACGTTA TTTTGCCGAA 
CAGACCTTCG AGTATCCGCT GGCCGGTAAT GTACAACCCG ATCCACGATT AAAGCCCTTG 
TCCGAGATCC AGACGCCTAA TATCGATTTG AATCAGTTGC GTGATTTGCA GGGTACGCTG 
CAATTACTCC GCGAGGTGGG CGCTTTGTAA

Protein sequence

MNHVTRIGVL IIAALMIAAC GNQTASTPTQ APAAPTPTQT LAKLVVYSGR SESLVGPFFT 
RFTEATGIPV EVRYGDTAEL AATILEEGAN SPADLFFAQD AGALGALAAA DVLIPLSTDI 
LNQVEARFRS SDGRWVGISG RARVVVYNTN KLTEADLPRS ITGFVDPQWR GRVGWAPTNG 
SFQAFITAMR VQLGEEATRK WLEGMIANEV KTYERNAAIV QAVAAGEIDV GFVNHYYLYQ 
LQRQAGDTLP AANYYPADGD VGALINIAGV GILKTAKNVA GAQRLIEYML STDGQRYFAE 
QTFEYPLAGN VQPDPRLKPL SEIQTPNIDL NQLRDLQGTL QLLREVGAL