Gene Cagg_1667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1667
Symbol	guaA
ID	7268969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2033932
End bp	2035473
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	58%
IMG OID	643566509
Product	GMP synthase
Protein accession	YP_002463004
Protein GI	219848571
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0518] GMP synthase - Glutamine amidotransferase domain [COG0519] GMP synthase, PP-ATPase domain/subunit
TIGRFAM ID	[TIGR00884] GMP synthase (glutamine-hydrolyzing), C-terminal domain or B subunit [TIGR00888] GMP synthase (glutamine-hydrolyzing), N-terminal domain or A subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACTC ACAGTATTCC GGTGCTCGAT TTTGGTTCCC AGACGGCGCA GTTGATCGTG 
CGGCGGCTGC GCGAATTGGG CTATTATAGC GAGTTGCTTG CACACGATGC GCCGGAAGCG 
CAGATCCGTG CGCTGAACCC GGTTGGAATT GTCCTTAGTG GTGGTCCGGC CAGTGTGTAT 
GAGCCGGAGG CGCCAACTTT ACCGCCATGG CTCATCGAAA GCAAGCTGCC CGTACTTGGA 
ATTTGCTACG GTATGCAACT AATCAGCCAC ACCCTCGGTG GTGTGGTGCG TCGTCCATCT 
GGGCGTGAGT ACGGCCCGGC GATGATCACC GTCACCCAAC CCCACCCACT TTTTGCCGAT 
ACCCCCACCG AACAGCCGGT CTGGATGAGT CATGGCGACC GAATCGAGCA GTTGCCCACC 
GGCTTTACGG CAATCGCCGC CAGCCAGGCC ACGCCGTTTG CCGCCATTGC CGACGACCAC 
CGACGCTGGT ACGGTGTCCA GTTTCACCCG GAAGTGGTGC ATACCGTGTA TGGGCGAGCA 
CTTTTGACCA ACTTTGCCAA ACTATGCGGG GCAAAACCCG AATGGCAGCC GAGCAGTTTT 
GTCACCGAAG CGATTGAACG GGTTCGAGCA CAGGTCGGCC CACACGGGCG CGTCATCTGC 
GCCCTCTCCG GCGGGGTTGA TTCGGCAGTG GCGGCTCTGA TCATCCATCA CGCTATCGGT 
GACCGGTTGA CCTGCGTGTT CGTTGATAAC GGCCTCTTGC GCGCCGGCGA AGCTGAACAG 
GTCATCAACA CCTTTCGTGA ACATTTTCAC GTACCGCTGA TCGCAGTCGA TGCGCGTGAA 
GAGTTTCTCG CTGCCTTAGA GGGTGTGGTT GATCCTGAGC AGAAGCGCAA GATTATCGGC 
GAGAAGTTTA TTCGGATTTT CGAGCGCGAA GCGCGTTCGT TAGCAGACGT AGAGTTCCTC 
GCCCAAGGGA CGCTCTACCC CGATGTAATC GAATCGACTG CACCGGACCG ACCGAAGGCA 
GCAAAGATCA AAACGCATCA CAACGTTGGC GGGCTACCCG CCGACATGCA ACTGAAGCTG 
GTTGAGCCGC TCCGCTACCT ATTCAAAGAT GAAGTACGCG CAGCAGGGCT GCAACTCGGC 
TTGCCCGAAG AGTGGGTATG GCGACATCCT TTCCCCGGAC CCGGTCTCGC CGTGCGGATC 
ATCGGTACGG TAACGTGGGA ACGGCTAGAG ACATTGCGCA AAGCCGACAG CATCTTCCTT 
GAAGAGCTGC GGGCAAGCGG CTACTACCGT GCAACCCAAC AGGCATTCGC CGTTCTCCTG 
CCGGTGCAAA GCGTCGGTGT GATGGGGGAC GGGCGTAGTT ATGGTTTCAC TATCGCACTG 
CGCGCGATTA CCACCGAAGA CTACATGACA GCCGACTGGG CGCGCTTACC CTACGAATTA 
CTGGCACACG TCAGTAGCCG AATTGTGAAT GAGGTCGAAG GCGTCAATCG CGTCGTATAC 
GATATTTCGT CGAAGCCACC GGCCACTATC GAGTGGGAGT AG

Protein sequence

MTTHSIPVLD FGSQTAQLIV RRLRELGYYS ELLAHDAPEA QIRALNPVGI VLSGGPASVY 
EPEAPTLPPW LIESKLPVLG ICYGMQLISH TLGGVVRRPS GREYGPAMIT VTQPHPLFAD 
TPTEQPVWMS HGDRIEQLPT GFTAIAASQA TPFAAIADDH RRWYGVQFHP EVVHTVYGRA 
LLTNFAKLCG AKPEWQPSSF VTEAIERVRA QVGPHGRVIC ALSGGVDSAV AALIIHHAIG 
DRLTCVFVDN GLLRAGEAEQ VINTFREHFH VPLIAVDARE EFLAALEGVV DPEQKRKIIG 
EKFIRIFERE ARSLADVEFL AQGTLYPDVI ESTAPDRPKA AKIKTHHNVG GLPADMQLKL 
VEPLRYLFKD EVRAAGLQLG LPEEWVWRHP FPGPGLAVRI IGTVTWERLE TLRKADSIFL 
EELRASGYYR ATQQAFAVLL PVQSVGVMGD GRSYGFTIAL RAITTEDYMT ADWARLPYEL 
LAHVSSRIVN EVEGVNRVVY DISSKPPATI EWE