Gene Cagg_2939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2939
Symbol
ID	7268812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	3602355
End bp	3603977
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	54%
IMG OID	643567761
Product	single-stranded nucleic acid binding R3H domain protein
Protein accession	YP_002464235
Protein GI	219849802
COG category	[S] Function unknown
COG ID	[COG3854] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.305311
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.269188
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTGA CGGACACTGT CAATGACATT CAGCTTCTAT TAGCAACATT GCCACCAGCG 
ATACGTGACG CGATCCAGAA AGCTAACGAT CAGGATAATT TGCTCGAGAT CGTGATGGAT 
CTGGGCCGTC TGCCTGAAGC ACGCTATCGT GGTCACGAAC TATTCTTGAG CGATCGGGAG 
GTGACCGCTG AAGATATCAA TTATGTCATT GCCCGCATCG GTGAATTTGG TGAAGATAAT 
CGCGCCGGTA TTCCTCGTAC ACTGCATCGT ATATCGGGCA TTCGTAATCG CCGTGGTGTG 
GTTATTGGCT TGACCTGCCG CGTTGGCCGG GCAGTCTACG GTACGGTTGA TATTATTCGC 
GATTTGGTTG AAACCGGTCA GAGTATTTTG CTGCTCGGTA AGCCGGGTAC CGGTAAGACG 
ACGCTGTTGC GTGAGACGGC GCGAGTGCTC GGTGATGAGT TGCGTAAGCG GGTGGTGATA 
GTCGATACCT CAAATGAGAT TGCCGGCGAT GGTGATATTC CCCATCCCGG TATCGGTCGT 
GCCCGCCGTA TGCAGGTACC GCGACCGTCC GAACAGCATA ATGTGATGAT CGAGGCGGTT 
GAGAATCACA TGCCTGAAGT GATTGTGATC GATGAGATCG GTACCGAATT GGAAGCTGCT 
GCCGCTCGTA CTATTGCCGA ACGTGGGGTA CAGTTGATCG GGACGGCGCA CGGTAATACC 
CTCGATAATC TGATGATTAA CCCCACGCTG TCGGATCTGG TGGGAGGGAT CCAGGCGGTG 
ACGCTTGGTG ATGAAGAGGC GCGTCGGCGT GGAACACAAA AGACGGTGCT CGAGCGCAAA 
GCGCCACCGA CGTTTAGCAT TCTGGTTGAG ATTCAGTCGT GGGATAGCGT GACCGTCTAC 
CCGGATGTAG CAGCGGCGGT TGATGCCATT TTGCGCGGTG AGGAGCCGCC ATGTGAGCAA 
CGCATCCGCG AGCCGGACGG TACGGTGCGG CGTGAGCCGG TACGGCGCGC GCTGATCGAT 
GCCCCGGCGT TTGGTTTCCG ACGTAGTCGG GGTGGGCGTG AACAGTCGCA GATGGGGACA 
AACGGTCCAC GTTTGCGTGA TCGGAATGGT AGTATGACCG GCTCGGTTAC TACCGTGCCA 
CCCCAGCGTA TCTTCCCGTT TGGTGTGAGT CGCAACCGAT TGCAAAATGC AATTGAACGA 
CTGCGGGTGC CCGCCGTTAT TGTGCGTGAC TTGAAAGATG CAACCTTAGT GATGACCCTG 
AAAAACTACT ACCGGCAGAG TTCACATCAG TTGCGGCAAG CTGAGGAACA GGGGGTGCCG 
GTGTATGTGT TGCGCAACAA TACGATCACG CAGATGGAAC GTCAATTAGC CCAAGTCTTT 
CAGTTGCGCG AGATGTTTGA TGATGAAGCA GAGTATTCGC GCAGCGATTC GGTGATCGAA 
GAGGCATTGC TCGAGACTGA ACAGGCGATT GCGCAAGTTA TCAACGGTGA ACGCAATGCG 
GTAGAATTGA CGCCACGTAG TAGTTATATT CGCCGCTTAC AACATCAGAT GGCCGATCGG 
TACAATCTAC GTTCAGAGAG CCGTGGCGAT GATCCAAACC GGCGGGTGAA GATCTTTCGG 
TAA

Protein sequence

MAVTDTVNDI QLLLATLPPA IRDAIQKAND QDNLLEIVMD LGRLPEARYR GHELFLSDRE 
VTAEDINYVI ARIGEFGEDN RAGIPRTLHR ISGIRNRRGV VIGLTCRVGR AVYGTVDIIR 
DLVETGQSIL LLGKPGTGKT TLLRETARVL GDELRKRVVI VDTSNEIAGD GDIPHPGIGR 
ARRMQVPRPS EQHNVMIEAV ENHMPEVIVI DEIGTELEAA AARTIAERGV QLIGTAHGNT 
LDNLMINPTL SDLVGGIQAV TLGDEEARRR GTQKTVLERK APPTFSILVE IQSWDSVTVY 
PDVAAAVDAI LRGEEPPCEQ RIREPDGTVR REPVRRALID APAFGFRRSR GGREQSQMGT 
NGPRLRDRNG SMTGSVTTVP PQRIFPFGVS RNRLQNAIER LRVPAVIVRD LKDATLVMTL 
KNYYRQSSHQ LRQAEEQGVP VYVLRNNTIT QMERQLAQVF QLREMFDDEA EYSRSDSVIE 
EALLETEQAI AQVINGERNA VELTPRSSYI RRLQHQMADR YNLRSESRGD DPNRRVKIFR