Gene GM21_1817 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1817
Symbol
ID	8137148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2117103
End bp	2118149
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	61%
IMG OID	644869428
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_003021628
Protein GI	253700439
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	0.00980836
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGAAAGAGA CTAAGATTAC CTATAAAGAC GCAGGTGTAG ACATAGATGC CGGCAACACT 
TTCGTGCAGA TGATCAAGCC GCTGGTCAAG GCGACTTCGC GTCCGGAAGT GCTGGCGGAC 
ATCGGCGGTT TCGGCGGGTT GTTCTCCCTC AACATGGGCA AGTACAAGCA CCCGGTGCTT 
GTCTCCGGCA CAGACGGGGT CGGGACCAAA CTGAAGCTCG CCTTCCTCGC CGACCGCCAT 
GACACCATCG GCATCGACCT CGTCGCCATG TGCGTGAACG ACATCATCGT GCAGGGAGCC 
GAGCCGCTCT TCTTCCTCGA TTATCTTGCC ACCGCGAAGC TCGACCCGGT TAAGGCCGCC 
TCCATCATCA AAGGGGTGTC CGAGGGGTGC GTGCAGGCTG GGTGCGCCCT GATCGGCGGC 
GAAACCGCCG AGATGCCCGG CTTCTACACC GGCGACGAGT ACGACATGGC CGGTTTTGCC 
GTGGGGGTCG TCGAGCGCGA GAAAATCATC GACGGCTCCT CCATCACCGT CGGCAACCGC 
CTGATCGGGT TGGCCTCCTC CGGGCTGCAC AGCAACGGCT ACTCCCTGGC CAGGAAGGTC 
ATCCTCGAGC ACATGGGGCT CGGCATCGAC GACGAACTCC CCGGCCTCGG TAAAACCGTC 
GCCGAAGAGC TCCTCACCCC GACCCGCATC TACGTGCGCA GCGTGATGAA CCTTTTGCGC 
GACTTCAACA TCTCGGGCCT GGCCCACATC ACCGGCGGGG GTCTGCTGGA GAACATCCCC 
CGCGTGCTTC CCAACGGCTG CAAGGCCGTC ATCAAGAAGG AGAGCTGGGA GGTCCCCGAG 
ATATTCCGGA TCATGCAGAA GGCCGGCAAC ATCGAGGAAA ACGAGATGTT CAGGACCTTC 
AACTGCGGCA TCGGCATGGT GCTGGTCGTT CCCGAGAAAG AGGCCGAGGA GATCATGATC 
AGGCTCTCCG GGCTCAACGA GACCGCTTTC GTGATCGGCG AAGTGGCCAA GTGCGACGCC 
GGCAAGGAGT GCGTGGAACT CGTTTAG

Protein sequence

MKETKITYKD AGVDIDAGNT FVQMIKPLVK ATSRPEVLAD IGGFGGLFSL NMGKYKHPVL 
VSGTDGVGTK LKLAFLADRH DTIGIDLVAM CVNDIIVQGA EPLFFLDYLA TAKLDPVKAA 
SIIKGVSEGC VQAGCALIGG ETAEMPGFYT GDEYDMAGFA VGVVEREKII DGSSITVGNR 
LIGLASSGLH SNGYSLARKV ILEHMGLGID DELPGLGKTV AEELLTPTRI YVRSVMNLLR 
DFNISGLAHI TGGGLLENIP RVLPNGCKAV IKKESWEVPE IFRIMQKAGN IEENEMFRTF 
NCGIGMVLVV PEKEAEEIMI RLSGLNETAF VIGEVAKCDA GKECVELV