Gene Daro_0451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0451
Symbol
ID	3568363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	494032
End bp	495192
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	63%
IMG OID	637678892
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_283678
Protein GI	71906091
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGTAA AGTCTGCAAT GATTCTTCCT CCAGCTACCC TTGGCATGCT CGGTGGCGGC 
CAGCTCGGCC GCTTCTTCGT TTCGGCCGCC CACGAACTGG GCTATCAGGT CTGGGTGCTC 
GATCCGGACA AGAATTCGCC GGCCGGCCAG ATCGCCGAAC GCCATTTTTG TGTTGATTAC 
AACGACTATG CGGCGCTTGA CGAGTTTGCC GCCGGTTGTG CCGCAATCAC CACCGAGTTT 
GAGAACGTGC CCGCCGATAC GCTGGATTAT CTAGCCAAGT TCGTGCCGGT ACGCCCGTCG 
GCAGCGGCCG TCGGCATTTG TCAGAACCGC ATCGCCGAAA AGTCCTTCCT GCGCGACAAC 
GGCCTGCCGC ACGGTCCATT CGCCGCCATC CGTTGCGAAG ACGACATTCG TAATGCCGAT 
GCCTCGCTGT TTCCGGCCAT CCTGAAAGTG GCCCGCTTCG GCTACGACGG CAAGGGGCAG 
GCCACGGTCC ATAACCGCGA GGAAGCGCTG GTCGCCTTCG GTCAGTTCAA GGGCGAACAG 
TGCGTGCTGG AACAGCGCCT GACGCTCGAC TACGAGGTCT CGGTCGTCCT CGCCCGTGAC 
GAGCGCGGCC GGGTCGCCTG CTTCCCGACC GGCGAAAATC AGCACACCAA GGGCATCCTC 
GACGTTTCCA TCGTGCCGGC GCGCACCACC GCTTGCGTCA AGAGTGATGC CGAGGAGGTC 
GCTGCCCGTA TTGCTGAAAA GCTCGGCTAC ATCGGCACCA TGGGCGTCGA GTTCTTCATC 
AGCCGCGGCC AGTTGATCGT CAACGAAATG GCACCGCGGC CGCACAACAG CGGCCACTAC 
ACCATTGACG CCTGCGTGAC CGACCAGTTC GAGCAGCAGG TGCGTGCCCT GTGCGGCTTG 
CCGCTTGGCG AGCCGCGGGC GCACTCGGCC TCGGTCATGG TCAATCTGCT CGGTGACCTT 
TGGTACGACG GCGAAACCTA CCGCGAGCCG GACTGGGCCA AGCTGCATGC CGTGCCCAAC 
TTGAAGCTGC ACCTCTACGG CAAGCACCAC GCCCGCCCGG GACGCAAGAT GGGCCACTTC 
ACGGTGATCG GGGACAACGC CGAGGCCGTG CAAAAGGCCG CTCTGGCTGC CCGTGCCGCC 
ATCGGCATCA GGGACGAATG A

Protein sequence

MPVKSAMILP PATLGMLGGG QLGRFFVSAA HELGYQVWVL DPDKNSPAGQ IAERHFCVDY 
NDYAALDEFA AGCAAITTEF ENVPADTLDY LAKFVPVRPS AAAVGICQNR IAEKSFLRDN 
GLPHGPFAAI RCEDDIRNAD ASLFPAILKV ARFGYDGKGQ ATVHNREEAL VAFGQFKGEQ 
CVLEQRLTLD YEVSVVLARD ERGRVACFPT GENQHTKGIL DVSIVPARTT ACVKSDAEEV 
AARIAEKLGY IGTMGVEFFI SRGQLIVNEM APRPHNSGHY TIDACVTDQF EQQVRALCGL 
PLGEPRAHSA SVMVNLLGDL WYDGETYREP DWAKLHAVPN LKLHLYGKHH ARPGRKMGHF 
TVIGDNAEAV QKAALAARAA IGIRDE