Gene RPD_3500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3500
Symbol	ureC
ID	4024014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3890446
End bp	3892158
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	64%
IMG OID	637963704
Product	urease subunit alpha
Protein accession	YP_570624
Protein GI	91977965
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0804] Urea amidohydrolase (urease) alpha subunit
TIGRFAM ID	[TIGR01792] urease, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGTGA AAATCTCGCG GTCCGTCTAT GCCGACATGT TCGGCCCGAC CACCGGCGAT 
CGCGTCCGGC TTGCCGACAC CGATCTGATC ATCGAGGTCG AGAAGGACTT CACGACCTAC 
GGCGAGGAGG TGAAGTTCGG CGGCGGCAAG GTGATCCGCG ACGGCATGGG GCAGTCGCAG 
GTGACCAACA AGGACGGCGC CGCCGACACG GTCATCACCA ACGCGCTGAT CGTCGATCAC 
TGGGGCATCG TCAAGGCCGA CGTCGCAATC AAGGCCGGGA TGATCAGCGC GATCGGCAAG 
GCCGGCAATC CGGACATCCA GCCGGGCGTC GATATCATCA TCGGCCCGGG CACCGACGTG 
ATCGCGGGCG AGGGCAAGAT CCTCACCGCC GGCGGCTTCG ACAGTCACAT CCATTTCATC 
TGCCCGCAGC AGATCGAACA TGCCTTGATG AGCGGCGTCA CCACCATGCT CGGCGGCGGC 
ACCGGGCCAT CGCACGGCAC CTTCGCGACC ACCTGCACGC CGGGGCCGTG GCATATCGGC 
CGGATGATTC AGTCGTTCGA TGCCTTCCCG GTCAATCTCG GCATTTCCGG CAAGGGCAAC 
GCGGCGCTGC CCGGCGCGCT GATCGAGATG GTAGAGGGCG GCGCCTGCGC GCTGAAGCTG 
CACGAGGACT GGGGCACGAC GCCGGCGGCG ATCGACAATT GCCTCACCGT CGCCGACGAT 
CACGACGTGC AGGTGATGAT CCATTCCGAC ACGCTGAACG AGAGTGGCTT CGTCGAGGAC 
ACCATCAAGG CGTTCAAGGG CCGCACCATC CACGCTTTCC ACACCGAGGG CGCCGGCGGC 
GGCCACGCGC CGGACATCAT CAAAGTTGCC GGCCTGGAGA ACGTGCTGCC GTCCTCGACC 
AATCCGACCC GGCCGTTCAC CCGCAACACC ATCGACGAGC ATCTCGACAT GCTGATGGTG 
TGCCATCATC TCGATCCGTC GATCGCCGAG GATCTGGCGT TTGCCGAAAG CCGCATCCGC 
AAGGAGACGA TCGCGGCGGA AGACATCCTG CACGATCTCG GCGCGCTGTC GATGATGTCG 
TCGGACAGCC AGGCGATGGG CCGGCTCGGC GAAGTCATCA TCCGCACCTG GCAGACCGCC 
GACAAGATGA AGAAGCAGCG CGGTTCGCTG TCGCAGGATT CCGCCCGCAA CGACAATTTC 
CGCGTCAAGC GCTACATCGC CAAATACACC ATCAATCCGG CGATCGCGCA TGGCGTGTCG 
AAGCTGATCG GTTCGGTCGA GACCGGCAAG ATGGCCGACC TCGTGCTGTG GTCGCCGGCG 
TTCTTCGGCG TCAAGCCGGA TTGCATCGTC AAGGCGGGCA TGATCGTGGC GGCGCCGATG 
GGCGATCCGA ATGCCTCGAT CCCGACGCCG CAGCCGGTGC ACTACCAGCC GATGTTCGGC 
GCTTACGGCC GCGCGCTCAC CGCGTCGTCG GTGGTGTTCA CCTCGCAGGC TGCCGCAGCC 
GGCCATCTTG CCCGTGACCT CGGCATCGCC AAGGCGCTGT ATCCGGTCAG CAATGTCCGT 
GGCGGCATCT CGAAGAAGAG CATGATTCAC AACGACGCCA CGCCGAACAT CGAGGTCGAT 
CCCGAAACTT ACGAAGTCCG AGCCGACGGC GAGTTGCTGA CCTGCGCGCC GGCCGAGGTG 
CTGCCGATGG CGCAGCGCTA TTTCATGTAT TGA

Protein sequence

MSVKISRSVY ADMFGPTTGD RVRLADTDLI IEVEKDFTTY GEEVKFGGGK VIRDGMGQSQ 
VTNKDGAADT VITNALIVDH WGIVKADVAI KAGMISAIGK AGNPDIQPGV DIIIGPGTDV 
IAGEGKILTA GGFDSHIHFI CPQQIEHALM SGVTTMLGGG TGPSHGTFAT TCTPGPWHIG 
RMIQSFDAFP VNLGISGKGN AALPGALIEM VEGGACALKL HEDWGTTPAA IDNCLTVADD 
HDVQVMIHSD TLNESGFVED TIKAFKGRTI HAFHTEGAGG GHAPDIIKVA GLENVLPSST 
NPTRPFTRNT IDEHLDMLMV CHHLDPSIAE DLAFAESRIR KETIAAEDIL HDLGALSMMS 
SDSQAMGRLG EVIIRTWQTA DKMKKQRGSL SQDSARNDNF RVKRYIAKYT INPAIAHGVS 
KLIGSVETGK MADLVLWSPA FFGVKPDCIV KAGMIVAAPM GDPNASIPTP QPVHYQPMFG 
AYGRALTASS VVFTSQAAAA GHLARDLGIA KALYPVSNVR GGISKKSMIH NDATPNIEVD 
PETYEVRADG ELLTCAPAEV LPMAQRYFMY