Gene Daud_1972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1972
Symbol
ID	6026811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	2075362
End bp	2076561
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	66%
IMG OID	641594790
Product	phosphoribosylaminoimidazole carboxylase, ATPase subunit
Protein accession	YP_001718095
Protein GI	169832113
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0002154
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAACGG TGTTTCCGGG AGGCCGCGTC GGGGTGCTGG GAGGCGGCCA ACTGGGCCGG 
ATGCTGGCCC TGGAGGCGAA ACGGATGGGA TACGGGGTGG GCGTGCTGGA CCCCGTGGCT 
GGTTGTCCGG CGGCTCAAGT TGCGGACTTT TTCCTGCAGG CCTCCCTGGA TGATGTCGAG 
GCCGCTCTGA GGCTGGCCGC CCAAGTGGAC GTGGTTACCG TAGAAAACGA GTTCGTGCCG 
GCCGCGCTTC TGGCTCGGCT CGAGAGAGCC GTGCCGGTCC ACCCAAGCGC GAGCGTGTTG 
CGTACCATCC AGGACCGCCT GCTGCAGAAG GAGTTTCTCA AGACGGCCGG TTTTCCCCAG 
GCACCCTTCG CGGCGGTTGA CGATCCCCGC TGTCTTGGCG AGGCCGTCCG TGCGGTTGAC 
TTTCCCGCCG TTCTCAAGAG CCGGCAGGGC GGTTACGATG GAAAAGGCCA GGTGGTGGTG 
ACTGAACCCG GTGCGCTGGA GAGCGCCTGG CGGGCCATCG GTGGCCGGCC GGCCGTACTG 
GAAACCCTCG TTCCTTTCAA GATGGAGATC GCGGTCATTC TGGCCCGCGG CGTGCAGGGC 
GAGACGCGGG TCTACCCGGT GGCCGAGAAC GTGCACGTGC GGCATATCCT CCACACCACC 
AGGGTGCCGG CCGCGGTGTC GGAGCGGACC AGCCGGGAGG CGAAACGGAT GGCCTGCGAC 
ATTGCCGAGT TGCTCGGACA CGTCGGGGTC ATGGCGGTTG AAATGTTCGT CTTGGGCGGC 
GAGAGCGTGC TGGTCAATGA GATCGCTCCC CGAACGCACA ACAGCGGACA CTACACTTTC 
GGCGCCTGCG TGACCTCTCA GTTCGAGCAA CATCTGCGGG CGGTCTGCGG TCTGCCGTTG 
GGCGATCCCG CGCTGCTCTC CCCCGCGGTC ATGGTGAATC TGCTTGGAGA GCTTTGGGTT 
GAGGGCACCC CGTGCTGGGA AACGGTGTTG TCGCGCCCAA ACGCCCGCCT GCACCTTTAC 
GGCAAAAGGG AGGCAAAGGT GGGCCGGAAG ATGGGGCACG TCCTGATCGT TGATGCCGAC 
ACCGACCGCG CCTTACGGGA GGCGGAGGAG ATCGTGGTGC TGCTTCGCCC CGGCGACAGC 
GTCTCGGCTC CGATCAGCCG GGCGGGCGGC GGGGCGGACG GGAGATGGGC GCGATGCTGA

Protein sequence

MKTVFPGGRV GVLGGGQLGR MLALEAKRMG YGVGVLDPVA GCPAAQVADF FLQASLDDVE 
AALRLAAQVD VVTVENEFVP AALLARLERA VPVHPSASVL RTIQDRLLQK EFLKTAGFPQ 
APFAAVDDPR CLGEAVRAVD FPAVLKSRQG GYDGKGQVVV TEPGALESAW RAIGGRPAVL 
ETLVPFKMEI AVILARGVQG ETRVYPVAEN VHVRHILHTT RVPAAVSERT SREAKRMACD 
IAELLGHVGV MAVEMFVLGG ESVLVNEIAP RTHNSGHYTF GACVTSQFEQ HLRAVCGLPL 
GDPALLSPAV MVNLLGELWV EGTPCWETVL SRPNARLHLY GKREAKVGRK MGHVLIVDAD 
TDRALREAEE IVVLLRPGDS VSAPISRAGG GADGRWARC