Gene Cmaq_0022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0022
Symbol
ID	5709871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	35642
End bp	36655
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	43%
IMG OID	641274525
Product	5-formaminoimidazole-4-carboxamide-1-(beta)-D- ribofuranosyl 5'-monophosphate synthetase-like protein
Protein accession	YP_001539866
Protein GI	159040614
COG category	[R] General function prediction only
COG ID	[COG1759] ATP-utilizing enzymes of ATP-grasp superfamily (probably carboligases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.653598
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATTG AGGCTACTTT AAAGAACTAT GACTTAAGTA AATTAAACGT AGTCACAATA 
GCCAGTCACT CATCGCTCCA AATATTGAGG GGGGCTAAGA GGCATGGGTT AGGTACCGTG 
GCTGTGGCTA AGCCTGGGTC GGGTTGGTTT TACAGGCGTT TTAACTTCAT AGATAATGTT 
ATTGAAATTG ATTTAGGCAG TATGGAGCAA CTTGCAGGTG ACTTGGTTAA GAATAATGCA 
ATACTCATAC CCCACGGTAG CTACGTGGAG TACGTTGGGT GGAGGAGGGC ATTAAGCATG 
CCTATTCCAA CCTTCGGTAA CAGGTACATT ATTGAATGGG AGGCTGATCA GAGGAAGAAG 
ATGAGGCTAC TGGAGTATGC TGGAATACCC ATACCTAGGT CATTTAATGA CCCGACCCAA 
GTCGATAGGC CTGTTATAGT TAAGTTATCT GGTGCAAAGG GTGGTAGGGG TTACTTCATA 
GCTAAGGATG CCGGTGAACT TGCAGGTAAA TTAAGCAGTA TTAATACGGA TGATTACATA 
ATACAGGAGT ACGTGATTGG TGTACCAGCC TACTACCACT ACTTCGACTC TAAGGTATAT 
GATCGTGTTG AATTGTTTGG AATGGATTTA AGGTATGAGA GTAACGTTGA CGGTAGATTA 
TTCAACCTAG CTGAACCAAC CTTCGTAGTT ACTGGTAATA TTCCACTGGT TCTAAGGGAG 
TCCCTACTAC CCACGGTTCA GAAGTATGGT GAAGACTTCT CAAGGGCTGT TGCGGAATTA 
GTGCCACCGG GTATGATAGG GCCGTATAGC TTAGAGTCAA TAATTAAGGA TGACTTATCA 
ATAGTGGTTT TCGAATTCTC AGGTAGGATT GTTGCAGGTA CGAACGTATA CATGGGTGTA 
GGTAGCCCAT ACTCAGTACT GTACTTTAAT GAACCAATGG ACATGGGGGA GAGGATAGCC 
CATGAGATAG TGAATGCTGT TAAAAGAGGT AAATTAATCA ATGTATTAAC ATAG

Protein sequence

MNIEATLKNY DLSKLNVVTI ASHSSLQILR GAKRHGLGTV AVAKPGSGWF YRRFNFIDNV 
IEIDLGSMEQ LAGDLVKNNA ILIPHGSYVE YVGWRRALSM PIPTFGNRYI IEWEADQRKK 
MRLLEYAGIP IPRSFNDPTQ VDRPVIVKLS GAKGGRGYFI AKDAGELAGK LSSINTDDYI 
IQEYVIGVPA YYHYFDSKVY DRVELFGMDL RYESNVDGRL FNLAEPTFVV TGNIPLVLRE 
SLLPTVQKYG EDFSRAVAEL VPPGMIGPYS LESIIKDDLS IVVFEFSGRI VAGTNVYMGV 
GSPYSVLYFN EPMDMGERIA HEIVNAVKRG KLINVLT