Gene Ccel_2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_2202
Symbol	guaA
ID	7310890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2574335
End bp	2575870
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	42%
IMG OID	643609134
Product	GMP synthase
Protein accession	YP_002506524
Protein GI	220929615
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0518] GMP synthase - Glutamine amidotransferase domain [COG0519] GMP synthase, PP-ATPase domain/subunit
TIGRFAM ID	[TIGR00884] GMP synthase (glutamine-hydrolyzing), C-terminal domain or B subunit [TIGR00888] GMP synthase (glutamine-hydrolyzing), N-terminal domain or A subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAACAATG AAATGATATT AGTTCTTGAT TTCGGCGGAC AGTACAATCA GCTGATAGCA 
CGCCGAGTGA GAGAAGCAAA TGTTTATTGC GAGGTAATTC CTTATAACGC ATCTTTAGAA 
CGTATAAAAT CATACAACGC AAAAGGAATA ATTTTTACTG GTGGGCCCAA TTCAGTTTTG 
GATGAGGGAG CACCAAAGTG TGACCCGGGT GTTTTTGAGC TGGGAATACC TGTTCTGGGC 
ATATGCTATG GTATGCAGCT CATGAGTGTT ATGCTGGGCG GAAGTGTAAC TGCTGCTAAT 
CAGCGTGAAT ATGGAAAGGT TGAAATTTGT GTAGATAAAT CACAGCCTTT GTTCAGGGAT 
GTGGACGAAA ATACAATATG CTGGATGAGT CATACCTACT ATGTTGATAC ACCTCCTAAG 
GGTTTTGAAG TAATAGCAAA GTCAGCAAAT TGTCCAACAG GTGCAATGCA GCATGTTGAA 
AAGAACCTCT ATGCGGTCCA GTTCCACCCG GAGGTAATGC ATACGCCTAA AGGAAAAGAA 
ATGCTTAAAA ACTTCCTATA CAATATTTGC GGCTGTAAAG GCGACTGGAA GATGTCATCA 
TTTGTTGAAA ACTCGATTAA TGCAATACGT GAGAAGGTTG GAGACAAAAA GGTATTGTGT 
GCACTGTCCG GCGGGGTTGA TTCATCTGTG GCGGCAGTAC TGATTCATAA GGCTATTGGA 
AAGCAGCTGA CTTGTATATT TGTTGACCAT GGACTTTTGA GAAAATATGA GGGAGACCAG 
GTTGAGCAGA TTTTCAGAAA GCAGTATGAT ATCAACCTGA TTCGTGTAAA TTGTGAAGAC 
AGATTTTTGC AGAGACTTAA AGGCGTTTCT GATCCCGAAA CCAAAAGAAA AATTATTGGT 
GAAGAATTTA TAAGAGTATT TGAAGATGAG GCAAAGAAAA TTGGAAAGGT TGATTTCCTT 
GTTCAGGGAA CAATTTATCC TGATGTCATT GAAAGCGGAA TCGGTGATGC AGCCGTTATA 
AAGAGCCATC ATAATGTTGG AGGTCTGCCA GAACATGTTG ATTTTAAGGA GATTATCGAA 
CCTCTCAGAA GCCTTTTCAA GGACGAAGTA AGAAGGGCGG GAGAGGAATT GGGTATTCCT 
GAAGACTTGG TTTGGAGACA GCCATTCCCG GGCCCCGGAC TTGCTATAAG GGTTATCGGT 
GATTTGACAA AAGAAAAGCT GGACACTCTA AGAGATACCG ACTACATTTT CCGTGAAGAA 
ATCAAGGCTG CCGGATTGGA CAAAGAGATT AACCAGTATT TCACAGTTTT GACAAATATG 
CGAAGTGTAG GCGTGATGGG TGACGAAAGA ACTTATGACT ACGCCTTGGC ACTGCGTGCG 
GTAACGACCA CCGACTTTAT GACAGCCGAC TGGGCAAGAA TCCCATACGA TATTCTGGAG 
AAGGTCTCCA CTCGTATTGT CAACGAAGTC AAGCAAATCA ACAGAATTGT GTATGATATC 
ACCTCGAAGC CACCAGCTAC GATTGAGTGG GAATAA

Protein sequence

MNNEMILVLD FGGQYNQLIA RRVREANVYC EVIPYNASLE RIKSYNAKGI IFTGGPNSVL 
DEGAPKCDPG VFELGIPVLG ICYGMQLMSV MLGGSVTAAN QREYGKVEIC VDKSQPLFRD 
VDENTICWMS HTYYVDTPPK GFEVIAKSAN CPTGAMQHVE KNLYAVQFHP EVMHTPKGKE 
MLKNFLYNIC GCKGDWKMSS FVENSINAIR EKVGDKKVLC ALSGGVDSSV AAVLIHKAIG 
KQLTCIFVDH GLLRKYEGDQ VEQIFRKQYD INLIRVNCED RFLQRLKGVS DPETKRKIIG 
EEFIRVFEDE AKKIGKVDFL VQGTIYPDVI ESGIGDAAVI KSHHNVGGLP EHVDFKEIIE 
PLRSLFKDEV RRAGEELGIP EDLVWRQPFP GPGLAIRVIG DLTKEKLDTL RDTDYIFREE 
IKAAGLDKEI NQYFTVLTNM RSVGVMGDER TYDYALALRA VTTTDFMTAD WARIPYDILE 
KVSTRIVNEV KQINRIVYDI TSKPPATIEW E