Gene Cagg_1116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1116
Symbol
ID	7268569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1373964
End bp	1375082
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	56%
IMG OID	643565958
Product	tRNA-guanine transglycosylase, various specificities
Protein accession	YP_002462462
Protein GI	219848029
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0343] Queuine/archaeosine tRNA-ribosyltransferase
TIGRFAM ID	[TIGR00430] tRNA-guanine transglycosylase, queuosine-34-forming [TIGR00449] tRNA-guanine transglycosylases, various specificities

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0035245
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000557306
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGGTAAAAA CACTACTCGT TCATCATGGT CAGCTCACAT TACCGGTATT TTTGCCCGAT 
GCTACCTTTG GTACTGTTCG TTCCGTTGAT AGTCGTGATG TCGCCGAGGC CGGGATTACT 
GCGCTGGTGA TGAATGTCTT TCATCTGATG CAGCGCCCTG GTAGTTCGAC GATCCATGCG 
CTTGGTGGGT TGCACCGGAT GGCGGCGTGG AATGGCCCAA TCGTGACCGA CAGTGGTGGT 
TTTCAGGCGT ATTCGTTAAT CCGAAGCAAT CCAAAACAGG GAAAAATCTC CGATCAGGGT 
TTGGTGTTTC AGCCAGAGGG TGCCGAACGG CCATTTCACC TGACGCCTGA GAAGAGTATT 
CAGCTTCAGT TGAGCTACGG AGCCGATATT GTCATCTGTC TCGATGATTG CACACACGTG 
GATGATCCGC CGGCCGAGCA GCGTCGTTCG GTTGAACGAA CGGTGCGCTG GGCGAAACGA 
TGTCGGGCCG AGTTTGATCG TCAATTGGCG CAACGGCGAC CGAGTGGGCC GCCGCCGTTG 
CTGTTTGCGG TGGTGCAGGG CGGTGGCGAC CTCCGGCTCC GGGCCGAATG CGCTGCTGCG 
TTGCTCGAAA TCGGCTTTGA TGGGTTTGGC TTTGGCGGGT GGCCGCTCGA TGCGCAGGGA 
AACCTGTTGC ACGAGATACT GGCATTTACC CGCGCCCAGA TTCCGTCTCA CTATCCGATG 
CATGCGCTCG GTGTCGGTCA TCCGGCGAAT GTGGTCGCTT GTGCGCGGAT GGGCTACGAG 
ATGTTCGACA GTGCGCTCCC AACCCGTGAT GCCCGCCAGG GCCGATTGTT GGCGTTTACC 
ACCGATCCAC ACCATCCCAG TTTTCGGTTA GAGGGCGAGT GGTTTACCTA CGTTTATCTG 
GCCGATCGGA AACATATCAA GGCAGATCAC CCGATTTCGC CGGGATGTAC CTGCTTTACG 
TGCCGTCACT ATAGCCTTGG CTATTTGCAC CATCTGCACA AAATCGGCGA GACGTTGGTA 
TTGCGGTTGG CGACGATCCA CAATTTGCAC TTTATGGCTC AATTAATGGC GTTGATCCGT 
CGTGAACGTT ATGAGGAAGA CGGCCATGGA GCAAACTGA

Protein sequence

MVKTLLVHHG QLTLPVFLPD ATFGTVRSVD SRDVAEAGIT ALVMNVFHLM QRPGSSTIHA 
LGGLHRMAAW NGPIVTDSGG FQAYSLIRSN PKQGKISDQG LVFQPEGAER PFHLTPEKSI 
QLQLSYGADI VICLDDCTHV DDPPAEQRRS VERTVRWAKR CRAEFDRQLA QRRPSGPPPL 
LFAVVQGGGD LRLRAECAAA LLEIGFDGFG FGGWPLDAQG NLLHEILAFT RAQIPSHYPM 
HALGVGHPAN VVACARMGYE MFDSALPTRD ARQGRLLAFT TDPHHPSFRL EGEWFTYVYL 
ADRKHIKADH PISPGCTCFT CRHYSLGYLH HLHKIGETLV LRLATIHNLH FMAQLMALIR 
RERYEEDGHG AN