Gene Jann_3353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3353
Symbol
ID	3935826
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	3405002
End bp	3406066
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	65%
IMG OID	637905726
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_511295
Protein GI	89055844
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.708465
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATC CGTTACCGGC TGGCAGCACC GTCGGCATTC TGGGTGGCGG TCAGTTGGGC 
CGCATGTTGG CTATGGCCGC TGCGAACCTC GGCTACCGGG CCCACATCTT TGAGCCCGGC 
CCCGCCCCCG CCGCCGATGT GGCCCATGCC TGGACGCAAG CCGGCTACGA TGACCTCGAC 
GCCCTGCGCA GCTTCGCGCA GGCCTGCGAT GTCATCACCT TCGAGTTTGA GAATATCCCC 
GCCGACGCCC TCCACGTCAT CGCCAGCACC ACACCCCTGT TCCCGGACCG CCGCGCGTTG 
GAAACCAGCC AGGACCGCCT GATTGAGAAG GCCTTTCTCC GCGATATCGG CCTGAAAACA 
GCGCCCTATG CGCCGGTCAG CGGTGACATT CACGATGTGC TGACCACGAC GGGCACCCCC 
GCGATCCTGA AGACCCGCAG GTTCGGCTAT GATGGCAAGG GACAGGCGCG CGTCATGGAC 
ATGGGCGAGG CCGGGGCCGC CTTGGCCGCA CTGGAAGGCG CGCCCGCGAT TGCAGAGGGG 
TTCGTCGATT TCTCCACAGA GATCAGCGTC ATCGCGGCGC GCGGTCAAGA TGGGTCCGTC 
GCGGCGTTTG ACCCCGGCGA GAACGTCCAT AAGGATGGCA TCCTCGATAC GACCACAGTG 
CCCGCCGCGA TTCCGGCGTC CCTGCGCACC GACGCGGTGC TGATCGCATC GCAGATCCTC 
ACTGCCCTCG ACTATGTGGG CGTTCTGGGG GTGGAGTTGT TCGTCACGCC CGCAGGTCTG 
ATCGTCAATG AAATCGCCCC GCGCGTGCAC AATTCCGGCC ATTGGACCCA AGCGGGCTGC 
GCCGTGGACC AGTTTGAGCA ACACATGCGG GCCGTCACCG GCTGGCCGCT CGGGGACGGC 
AGCCGTCATG CCAACGTTGT GATGGAAAAC CTCATCGGCG AGGACATCGC GCGCGCGTCA 
AACCTGGCCA GTGAACCCGG CGTGCAGATC CACCTTTACG GCAAGGCTGA GACGCGGCAG 
GGGCGCAAGA TGGGCCATAT CAACCGCGTG ACAGGTCCGG CGTAA

Protein sequence

MSDPLPAGST VGILGGGQLG RMLAMAAANL GYRAHIFEPG PAPAADVAHA WTQAGYDDLD 
ALRSFAQACD VITFEFENIP ADALHVIAST TPLFPDRRAL ETSQDRLIEK AFLRDIGLKT 
APYAPVSGDI HDVLTTTGTP AILKTRRFGY DGKGQARVMD MGEAGAALAA LEGAPAIAEG 
FVDFSTEISV IAARGQDGSV AAFDPGENVH KDGILDTTTV PAAIPASLRT DAVLIASQIL 
TALDYVGVLG VELFVTPAGL IVNEIAPRVH NSGHWTQAGC AVDQFEQHMR AVTGWPLGDG 
SRHANVVMEN LIGEDIARAS NLASEPGVQI HLYGKAETRQ GRKMGHINRV TGPA