Gene RPD_2052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2052
Symbol	moaA
ID	4022534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2301181
End bp	2302215
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	64%
IMG OID	637962245
Product	molybdenum cofactor biosynthesis protein A
Protein accession	YP_569188
Protein GI	91976529
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2896] Molybdenum cofactor biosynthesis enzyme
TIGRFAM ID	[TIGR02666] molybdenum cofactor biosynthesis protein A, bacterial

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.128137
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGTG CAGTGATGAC TCCACCGACC GTCGGCGCTT CGGCGATGAC CGATCCGTTC 
GGCCGGACGA TCAGCTATCT GCGGGTGTCC ATCACCGACC GCTGCGACTT TCGCTGTGTC 
TACTGCATGT CGGAAGACAT GACCTTCCTG CCCCGCGCCG ATCTTCTGAC GCTGGAGGAA 
CTCGACCGGC TCTGCTCGGC CTTCATCGCC CGCGGCGTCC GCAAGCTTCG GCTGACGGGG 
GGGGAGCCAC TGGTCCGGCG CAACATGATG TCACTGGTGC GCTCACTGTC GCGCCATCTC 
GGCACCGGCG CGCTCGACGA ACTCACCCTC ACCACCAACG GCTCGCAGCT CGCCCGATTC 
GCCGAAGAAC TAAGCGACTG CGGCGTCCGC CGCATCAACG TCTCGCTCGA TACGCTCGAT 
CCCGGAAAAT TCCGCGCGAT CACCCGCTGG GGCGACCTCG ACCGGGTGTT GGCCGGAATC 
GAGGCGGCGC GCGCCGCCGG CCTCGCCGTC AAGATCAACG CCGTGGCGCT GAAGAACATC 
AATGAGGACG AGATTCCGTC ACTCATGCAA TGGGCCCACG GCCTCGGTAT GGGACTGACG 
CTGATCGAGG TGATGCCGCT CGGCGAGATC GGCGAAGGCC GGATCGATCA ATATGTTCCG 
CTGTCGCTGG TTCGCGCGAG GCTTTCGAAC AACTACACCT TGACTGATTT GCCAGATAGC 
ACCGGCGGCC CAGCCCGCTA CGTCCGGGTC GATGAAACCG GCGGCAAGCT CGGCTTTATC 
ACGCCCCTCA CCCATAATTT CTGCGAATCA TGCAACCGGG TGCGGATCAC CTGCACCGGG 
ACCCTACACA CCTGCCTCGG ACAGGAGGAT GCGTCCGACC TGCGCCGGCC GCTCCGCGCA 
TCGCCGGACG ACGATCTGCT CAACGCCGCG ATTGATCGTG CGATCGGCCA CAAGCCGAAG 
GGGCACGACT TCATCATCGA CCGCAAGCAC AACCGGCCCA GCATTGGCCG TCATATGAGC 
GTCACCGGCG GCTGA

Protein sequence

MSSAVMTPPT VGASAMTDPF GRTISYLRVS ITDRCDFRCV YCMSEDMTFL PRADLLTLEE 
LDRLCSAFIA RGVRKLRLTG GEPLVRRNMM SLVRSLSRHL GTGALDELTL TTNGSQLARF 
AEELSDCGVR RINVSLDTLD PGKFRAITRW GDLDRVLAGI EAARAAGLAV KINAVALKNI 
NEDEIPSLMQ WAHGLGMGLT LIEVMPLGEI GEGRIDQYVP LSLVRARLSN NYTLTDLPDS 
TGGPARYVRV DETGGKLGFI TPLTHNFCES CNRVRITCTG TLHTCLGQED ASDLRRPLRA 
SPDDDLLNAA IDRAIGHKPK GHDFIIDRKH NRPSIGRHMS VTGG