Gene Cag_2024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_2024
Symbol
ID	3747997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2563625
End bp	2564620
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	47%
IMG OID	637774561
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_380315
Protein GI	78189977
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGATGG ATTATAAAAA AGCGGGCGTT GATATTAGCG CAGGTGAAGA GTTTGTGCGC 
ATGATAAAAC CTCAAGTTCG CCAAACCTTT ACCCCAAACG TTATTACCGA TATTGGAGCG 
TTTGGCGGCT TTTTTATGCC CGATTTTTCT CGTTACCGTA AGCCTGTGTT GGTAAGCAGC 
ATTGATGGTG TTGGCACAAA GCTCAAAATT GCCATTGAGC TTGACCGTTA CAACACCGTT 
GGTTCCTGCC TTGTTAACCA TTGCGTAAAC GATATTTTAG TGTGTGGCGC ACGTCCACTT 
TTCTTTCTTG ACTATTACGC TTGCGGTAAA CTAACGCCTG CGATTGCCGC TTCGGTGGTA 
ACAGGTATGG TTGCCGCTTG TCGTGAAAAT GGCTGTGCGT TAATTGGTGG CGAAACGGCT 
GAAATGCCCG GCATGTACAA TGCTGAAGAT TTTGATCTTG CTGGCTCTAT TGTAGGAATG 
GTTGACCATG AGCGCATTAT TAACGGCTCA AAAATGCAAG CGGGCGACAT CATGCTTGGC 
TTAGCCTCAA ATGGGCTGCA CACCAACGGC TACTCGCTTG CTCGCAAAGT GCTTGCAGGG 
CGAATGCACG AAACCATTTC GGAAGCGAAC GAAACCATTG GCGAAGCTCT TTTAAAGGTA 
CATCGCACCT ATTTACCTAT TATTGAACCA TTACTTGAAT CCCCCGATAT TCATGGGTTA 
TCGCACATTA CGGGTGGCGG CTTAATGGGC AACACTATGC GCATTGTGCC TGAGGGCTTA 
AAGCTTGAGG TTGATTGGCA AAGTTGGCAG GAACCTCTTA TTTTTGATAT TATTCGCCGA 
GAGGGCAACG TGCCCGAAGA GGATATGCGC CGCACCTTTA ACCTTGGAAT TGGTTTAGTG 
ATGATTGTTG CAGCAGAAAG CGTTGAGCGC ATTCTTGCCA ACTTGCAATC ACGCGGCGAA 
AATGGCTACA TTATTGGGCA GGTAGCCAAA AGCTAA

Protein sequence

MQMDYKKAGV DISAGEEFVR MIKPQVRQTF TPNVITDIGA FGGFFMPDFS RYRKPVLVSS 
IDGVGTKLKI AIELDRYNTV GSCLVNHCVN DILVCGARPL FFLDYYACGK LTPAIAASVV 
TGMVAACREN GCALIGGETA EMPGMYNAED FDLAGSIVGM VDHERIINGS KMQAGDIMLG 
LASNGLHTNG YSLARKVLAG RMHETISEAN ETIGEALLKV HRTYLPIIEP LLESPDIHGL 
SHITGGGLMG NTMRIVPEGL KLEVDWQSWQ EPLIFDIIRR EGNVPEEDMR RTFNLGIGLV 
MIVAAESVER ILANLQSRGE NGYIIGQVAK S