Gene RPC_4850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4850
Symbol
ID	3973593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	5411215
End bp	5412243
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	66%
IMG OID	637927962
Product	NUDIX hydrolase
Protein accession	YP_534691
Protein GI	90426321
COG category	[L] Replication, recombination and repair
COG ID	[COG2816] NTP pyrophosphohydrolases containing a Zn-finger, probably nucleic-acid-binding
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.716993
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.684444
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGACCAA CCGCCGCAGT CACCTTCCCG GAAATTGCGA GCCTCGATCG CCACGGCGGC 
GCCAGCCTCG CGGACCAGCG CATGACAACA AACGATTCGT TTCCGCTCGG CCAGCCGGCC 
TTCGTCACGC ATGTGCTGGA TCGCGCCGCG CATCTGCGCA GCGACGACGA CAAGTTGTTC 
AAGCTGGAAA GCGGCCGCGA CGCCCGCGCC TATGTGGTGC ATCGCGATTC GCTGGTGATG 
GCCAAGCAGG CCGACGGCGT CCGCGCGCTG TTGACGATCG ACGAGGCTTT GACGTTCGGG 
GCCAATTCCG GAACCATCTT TCTCGGCTTG CGCGATGGCG CGCCACTGTT CGGCATGGGG 
ATCGCGGCTG ACGCCGTAGA GCGGTTACTG ATCCGCAACG ACGTCGCGGT GAGCGAGCTG 
CGCGGCATGG CGATGGAGGG CGCGGTGCCG GCGGGAGAAC TCTCAGCGAT CGCGATGGCG 
AAATCGATGG TCAGCTGGCA TCAGCGCCAC GGCTATTGCG CCAATTGCGG CGCCCGCACC 
GTGATGTCGC AAGGCGGCTG GAAGCGCGAT TGCCCGAGCT GCAAGGCCGA GCATTTCCCG 
CGCACCGATC CGGTGGTGAT CATGCTGGTA ACGTTCGGCG ACAAATGCCT GCTCGGCCGG 
CAGAAGCAGT TTCCGCACGG GATGTATTCG TGCCTCGCCG GCTTCGTCGA AGCCGCGGAA 
ACCTTCGAGG ACGCGGTGCG CCGCGAGGTG TTCGAGGAAT CCGGGATCCG CTGCGGCGAC 
GTCGCCTATT ACATGACGCA GCCCTGGCCC TATCCGTCGT CGCTGATGAT CGGCTGCTCG 
GCGCAGGCGA CCACCGAGGA TATCGTGGTC GACCACACCG AACTCGAAGA CGCCCGCTGG 
TTTTCCCGCG ACGAGGCGAT GCTGATGCAT CACCGGCGGC ATCCCGACGG GCTGACCGGC 
GCGCATTCGT TCGCGATCGC CCACCACCTG CTCGGCCGCT GGCTGCACGG CCCGTCTTCA 
GCGACATGA

Protein sequence

MRPTAAVTFP EIASLDRHGG ASLADQRMTT NDSFPLGQPA FVTHVLDRAA HLRSDDDKLF 
KLESGRDARA YVVHRDSLVM AKQADGVRAL LTIDEALTFG ANSGTIFLGL RDGAPLFGMG 
IAADAVERLL IRNDVAVSEL RGMAMEGAVP AGELSAIAMA KSMVSWHQRH GYCANCGART 
VMSQGGWKRD CPSCKAEHFP RTDPVVIMLV TFGDKCLLGR QKQFPHGMYS CLAGFVEAAE 
TFEDAVRREV FEESGIRCGD VAYYMTQPWP YPSSLMIGCS AQATTEDIVV DHTELEDARW 
FSRDEAMLMH HRRHPDGLTG AHSFAIAHHL LGRWLHGPSS AT