Gene Cagg_0767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0767
Symbol
ID	7268086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	951939
End bp	953009
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	55%
IMG OID	643565618
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_002462127
Protein GI	219847694
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.762459
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCAAC CCTCGATACG TGAAATGCAC GAGGCGCTCG AAGCGCGCAT CCTCTCACCT 
TACGCCGCCA AAAGCGCTGC TGCCGTGCGC GACCAACCGG AACCGCCATG TCCGATCCGT 
ACCGCTTACC AGCGTGACCG TGACCGTATT TTGCACTCCA AACCGTTTCG TCGGCTTAAA 
CACAAAACAC AGGTATTTAT CGCACCCCTC GGTGACCACT ACCGTACTCG CCTGACCCAT 
ACCCTCGAAG TGACGCAAAT TGCTCGCACG GTGGCGCGTG CTCTGCGGCT TAATGAAGAC 
CTGACCGAAG CGATCGGTCT TGGGCACGAC ATTGGTCATG CTCCCTTCGG GCATGCCGGT 
GAGACGGCGC TGAGTCGGAT CTGCCCCGGT CACTTTCGCC ACAACGAACA ATCACTGCGC 
ATTGTGGAAG TCCTTGAAAA CGGGGGAGCC GGCCTGAATC TCACGTTTGC GGTGCGCGAG 
GGCATCTATA TGCACTCAAA GGTGCAGCGC GACATCACCG CTAAAGCCTG GGGGATAGCC 
AGCACACTTG AAGGTCAGAT CATTAAAATC TGCGATAGTA TCGCCTATAT CAACCACGAT 
ATTGACGATG CAATACGTGC CGGCATTCTA CGAACCGAAG ACTTACCTGC CGATTGCATT 
GCCATCCTCG GCGACACCCA TAGCAAACGA CTGGCCACGA TGGTTAGTGA CATGATCTAC 
CACAACTGGT GGGCAACCGG CGAGGGAACG GCTCCTGATA CCCTTACGCT ATCGATGAGT 
CCGACTATCT TAGCTGCCAC CAACAAACTG CGTCATTTTC TGTATGAGAC GGTCTACCAC 
CGGCCAGAAG CCAAAGCCGA GAATGAAAAG GTTCGTTTCA TTATCGAAAC GCTGTACGAC 
TATTTTGTGC GCCATCCCGA AGCGATCCCG GCTGAACTGA TGGCAGTCGT TGAACGGCGA 
GGCGAACCGG TTGAACAAGC GGTTGTCGAT TACATTGCCG GTATGACCGA CCGGTACGCA 
CTCACCGTCT TCAAACGTAT CTTCGTACCC CGCACGTGGG GTACGCTCTA G

Protein sequence

MSQPSIREMH EALEARILSP YAAKSAAAVR DQPEPPCPIR TAYQRDRDRI LHSKPFRRLK 
HKTQVFIAPL GDHYRTRLTH TLEVTQIART VARALRLNED LTEAIGLGHD IGHAPFGHAG 
ETALSRICPG HFRHNEQSLR IVEVLENGGA GLNLTFAVRE GIYMHSKVQR DITAKAWGIA 
STLEGQIIKI CDSIAYINHD IDDAIRAGIL RTEDLPADCI AILGDTHSKR LATMVSDMIY 
HNWWATGEGT APDTLTLSMS PTILAATNKL RHFLYETVYH RPEAKAENEK VRFIIETLYD 
YFVRHPEAIP AELMAVVERR GEPVEQAVVD YIAGMTDRYA LTVFKRIFVP RTWGTL