Gene Cagg_3659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3659
Symbol
ID	7268194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4448826
End bp	4450001
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	55%
IMG OID	643568465
Product	hypothetical protein
Protein accession	YP_002464931
Protein GI	219850498
COG category	[S] Function unknown
COG ID	[COG5282] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03624] putative hydrolase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000101981
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGTCGGTA ATCAGAATGA ATTACGTCGC TTCGGCGCCG CTCTGTTGAT CGGAATAGCG 
GCCGGTTTAG CGGCGCGCTA CTATTTCGAC TCTCGTGCTC GTAATGAAAG TCGGGTGCCC 
ACCGGCTTGA TCGACTGGGA GCAGGCCCGT CAGGCGGCAT TACGTTTGTC GCAGTGGGAG 
CAAGCCCCGG TTGACGATCG CCATTTTCGC CGCCAGCAGT ACGCCCAGAT GGTGGCGCAA 
AGTGAACCTC TCATCGCCGA GTATCTTGGC GTGCAATTAC CCGAACCGGT CAATCGAATT 
TTTGTCTTCG ACCGGCGGGA ATGGCTCGAA GCGAATATTG TCTCATTTAG CCAGCTCTTC 
CGCCCCCTCG AAGAGGTGTA TGAAAAGAAT GGTGGCGGGC GTGGTGCATT GGGGGTGATG 
GTTAACGACG TCAGCAGTAA GTTGCTGGGG ATGCAGATCG GTGGTCTCCT TGGGTATCTG 
GCTCAGCGTG TGCTCGGTCA GTACGACTTA AGTCTGCTCT CGGCCGAAGC GACCGGTGGT 
TCGCTGTACT TTGTCGAACC GAATATTGCC CGTGTCCAGC AGCAACTCGG CCTGAACGAT 
ACCGATTTTC GGCTCTGGAT TACGCTGCAC GAGATGACCC ACGCCTTTGA GTTTGAAGCG 
TATCCATGGG TGCGTCGCTA TTTCCGTGAA CTGATCGAGC AGAACTTTAC GCTCATCAGC 
GGCCAAATGC TGGGTAACGG CAATAATCTG ATCGATATTA TGATGCGGCT GGTGCAAGGG 
GTCGGGAGTG GTCAACATTG GATCGAATCG GTATTGACAC CCGATCAGCG GGTGGTGTTT 
GATCGGATTC AAGCACTGAT GTCAATTATT GAAGGTTACG GCAACCATGT GATGAACGCG 
GTTGGTCGGC GCTTGCTACC GAGTTTCAGC CAGATCGAAC ATCAGATCGC GCAGCGGCAG 
CGGCAGCGAA CGTTACTCGA TCAGATGGTC TTTCGCTTAA CCGGCCTCGA TCTCAAACTA 
GCCCAATATC AGCAAGGTGA GGCATTTGTC AATGCGGTAG TGGCCGCACG CGGGATCAGA 
TTTGCCGGTC GCGTCTGGGA ACGGCCCGAA CATCTGCCGT CAATGGAAGA GATCCGCAAT 
CCGGCGATGT GGATTGCCCG CATAGAACGT ATGTAG

Protein sequence

MVGNQNELRR FGAALLIGIA AGLAARYYFD SRARNESRVP TGLIDWEQAR QAALRLSQWE 
QAPVDDRHFR RQQYAQMVAQ SEPLIAEYLG VQLPEPVNRI FVFDRREWLE ANIVSFSQLF 
RPLEEVYEKN GGGRGALGVM VNDVSSKLLG MQIGGLLGYL AQRVLGQYDL SLLSAEATGG 
SLYFVEPNIA RVQQQLGLND TDFRLWITLH EMTHAFEFEA YPWVRRYFRE LIEQNFTLIS 
GQMLGNGNNL IDIMMRLVQG VGSGQHWIES VLTPDQRVVF DRIQALMSII EGYGNHVMNA 
VGRRLLPSFS QIEHQIAQRQ RQRTLLDQMV FRLTGLDLKL AQYQQGEAFV NAVVAARGIR 
FAGRVWERPE HLPSMEEIRN PAMWIARIER M