Gene Cagg_1437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1437
Symbol
ID	7269269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1768246
End bp	1769448
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	55%
IMG OID	643566280
Product	RNA binding S1 domain protein
Protein accession	YP_002462780
Protein GI	219848347
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.245145
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.159598
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGAGT TGAAGCATGC CGGTAATAAC ACAAACAATG AAGACGTTCG CCAACCTGAT 
CTAAACGATC TGATGGAGCG TGGCGATCAG GCGCTGATGG AACAGATACT GAGCGATCCG 
GCCCATACCT ACCGTAACCT CAAACACGGT GACACCGTTG ATGGGCGGAT CATGCGGATC 
GACCGAGATG AAATCTTGGT CGACATAGGC GCCAAAGCCG AAGGTGTTGT CCCTAGCCGG 
GAGATGCAGA CCCTCAGTGA AGAAGATCGA GCTGCGCTCA AAGTTGGTGA TACCATTCTT 
GTTTTCGTTG TCCAATCGGA AGACAAAGAA GGCCGTGCGA TTTTATCAAT CGATAAAGCT 
CGGCAAGAAA AAAGCTGGCG CGCATTGCAA GAGTATTACG AGCGGGGCGA AATTATCTAT 
GCCCGCGTCA AGAATTACAA CAAGGGCGGC CTGCTAGTCG ATCTCGATGG TGTGCGCGGG 
TTTGTCCCTG CGTCGCAGGT GTCGAGTGTT AGCCGTGCTT CGGAGGCGCA AAAGCAATCC 
GAAATGGCGC GGCTGGTAAA TGTTGAGCTG CCGCTAAAAG TGATTGAGAT CAACCGCAAC 
CGCAACCGCC TGATTCTGTC CGAACGGCAG GCGTTGGTCG AAACCCGTGA GACGAAGAAA 
GACGAGTTGC TCGCATCGTT ACAAGAGGGT GATGTGCGCG AAGGAGTGGT CTCGTCGGTC 
TGCGATTTCG GTGTCTTCGT CGATATTGGC GGCGCCGATG GGTTGGTGCA TCTGTCCGAG 
ATCTCGTGGT CGCGCGTCAA ACATCCGAGC GAAGTGCTCA AGGTGGGTGA TAAAGTCAAA 
GTGTCTATCC TGAACATTGA CCACGAGCGC AAACGGATCG CGCTATCGAT CAAGCGGACC 
CAAAGCGAGC CGTGGACACG GGTGGCCGAA CGCTATCAGT TGGGGCAAAT TGTCGAAGGA 
ACAGTGACGC AACTGGCCTC GTTTGGCGCC TTTGTACGGA TTGAAGATGG GGTGGAAGGG 
CTGATCCACG TCTCAGAAAT GGGTGATGAG CGTATTCAGC ACCCACGCGA CGTGCTAAGC 
GAGGGTCAAG TTGTGCAGGC ACGGATCATC CGTATCGATC CGGCACGGAA GCGGATGGGG 
TTGAGTTTAC GGCTCCAACA AGAGCCGTCG GAGGGCGGCA CCGCAACGGA GGAGGCTGGC 
TAA

Protein sequence

MEELKHAGNN TNNEDVRQPD LNDLMERGDQ ALMEQILSDP AHTYRNLKHG DTVDGRIMRI 
DRDEILVDIG AKAEGVVPSR EMQTLSEEDR AALKVGDTIL VFVVQSEDKE GRAILSIDKA 
RQEKSWRALQ EYYERGEIIY ARVKNYNKGG LLVDLDGVRG FVPASQVSSV SRASEAQKQS 
EMARLVNVEL PLKVIEINRN RNRLILSERQ ALVETRETKK DELLASLQEG DVREGVVSSV 
CDFGVFVDIG GADGLVHLSE ISWSRVKHPS EVLKVGDKVK VSILNIDHER KRIALSIKRT 
QSEPWTRVAE RYQLGQIVEG TVTQLASFGA FVRIEDGVEG LIHVSEMGDE RIQHPRDVLS 
EGQVVQARII RIDPARKRMG LSLRLQQEPS EGGTATEEAG