Gene Cagg_0230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0230
Symbol
ID	7269144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	287200
End bp	288570
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	60%
IMG OID	643565099
Product	putative transcriptional regulator
Protein accession	YP_002461614
Protein GI	219847181
COG category	[K] Transcription
COG ID	[COG2865] Predicted transcriptional regulator containing an HTH domain and an uncharacterized domain shared with the mammalian protein Schlafen
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATCGT CTCCCATTGC CGCTTTGCCC GGCCAGGCGC CAGGGCCGCG CCTAGCCTTT 
GCCGGTGATC GCCAACGCCC CGACGAAATC GCCGAGTCGC TGGCGGCGCT AGCTAATGCT 
CACGGCGGCG CGCTGGTGAT CAGCGGCGGA CGCGGCTCGC AACTCGCCCC CCTGCGCGAT 
CCGGCCGCCG CTATTGAGCT GGCGTTATCG GCAGCGCTGG CTTGCACGCC TCCACTGATT 
ATCCCACTGC CCCAAGTCGT TGTCTACCAT GATATGCCCG TTGTCGTCGT GGAAGTTCCT 
GCCGGATTAC CTTATGTCTA TTCTATCAAT GGCCGCTACT TACGCCGCGA AGGGGACAGC 
AACCAGCCGT TGTCACCGGC AGCACTCCAC CGCCTGTTTA GCGAGCGGGC AGAACTGGGC 
TGGGAACGGC AGGTGCCACT CGGCGCCTCC TTCGCCGAAC TCGATCCTGA CCTCATCACC 
GCCTACGCGC GCCGAGTCGG TCCACCTGCC GGCGACGACC CAATGACTCT GCTAACCCGT 
CGTGGCTGCC TCATCGATAA CCGGCCGACG AATGCCGGTC TTCTGCTCTT CGGACGCGAT 
GTGGCTGTTC GTTTTCCCCA AGCCGAAATT ACCCTTGTGC GCTACCGCGG TCGTGAGCCG 
GACGATGTCT TCGAGCGTGC CGATATTTGC GCGCCATTGC CTGACGCTAT CCGTCGTGCC 
GAGCGTTGGC TTAACGATCA TATGCGCAAA GGTTCGCGGA TGATCGGCCT TGAACGCGAA 
GACTGGACGC AATTCCCACC GGCGGCTGTG CGTGAGGCAT TGGTCAATGC GGTTGCCCAT 
CGCGATTATG CAGCACGTGG CGAAGGAATT CGTATTACCC TCTTCAGCAA CCGACTCGAA 
GTCTATTCAC CCGGTCGTCT CCCCGGGCAC GTCACTCTCG ATAATATTCG CGCCGAACGG 
TTTTCGCGCA ACCCGGCTAT CGTGCAAGTC CTCGCCGATC TCGGTCTGGT CGAACGACTC 
GGCTATGGTA TCGACCGCAT GCTGCGCCAC CTGGCTGCTG CCGGCTTACC ACCGGCTACT 
TTCCACGAGA CTGCTGCCGG TTTTTTAGTG ATCTTGCCCG GTCACCCATT CGCCGAGGAA 
CTCCCCGGTG GGATTGATAC GACGGCATGG CGACGAATGG GGTTGAATGA TCGTCAGATC 
AGCGCGCTCC TCTTCGTCGT TGAACAGCAA CGGATCACCA ATCGCGATCT GCAAGAGATG 
CATCCTGACG TTAGCCCAGA GACGATTCGC CGTGATCTAT CCGATCTTGT GGCCCGTGGG 
TTACTTTTAA AGGTGGGAGA TAAACGCGCA ACCTATTATA TTCTGAAGTA A

Protein sequence

MESSPIAALP GQAPGPRLAF AGDRQRPDEI AESLAALANA HGGALVISGG RGSQLAPLRD 
PAAAIELALS AALACTPPLI IPLPQVVVYH DMPVVVVEVP AGLPYVYSIN GRYLRREGDS 
NQPLSPAALH RLFSERAELG WERQVPLGAS FAELDPDLIT AYARRVGPPA GDDPMTLLTR 
RGCLIDNRPT NAGLLLFGRD VAVRFPQAEI TLVRYRGREP DDVFERADIC APLPDAIRRA 
ERWLNDHMRK GSRMIGLERE DWTQFPPAAV REALVNAVAH RDYAARGEGI RITLFSNRLE 
VYSPGRLPGH VTLDNIRAER FSRNPAIVQV LADLGLVERL GYGIDRMLRH LAAAGLPPAT 
FHETAAGFLV ILPGHPFAEE LPGGIDTTAW RRMGLNDRQI SALLFVVEQQ RITNRDLQEM 
HPDVSPETIR RDLSDLVARG LLLKVGDKRA TYYILK