Gene Rru_A1780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A1780
Symbol
ID	3835202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	2071855
End bp	2073051
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	64%
IMG OID	637825877
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_426867
Protein GI	83593115
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.797351
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATCT GGACCCCAAA ATCCCCGAGT CTCGCGCCCT ATGCCAGCGA TCCGGCGACC 
AGCCGGGGCC GGCTTTACCC CGAAGCGTCG TCGCCGACGC GCTCGCCCCA TCAGCGCGAC 
CGCGATCGCG TGCTGCATTC GGCGGCCTTC CGCCGCCTGA AATACAAGAC CCAGGTCTTC 
GTCAATTCGG TCGGCGAGAA TTACCGCACC CGCCTGACCC ATAGCCTGGA AGTCTCGCAG 
ATCGCCCGCT CGGTCAGCCG GGTTCTTGGT CTCAACGAGG ATCTGGCCGA GGCCCTGGCC 
CTGGCCCATG ACCTGGGCCA CACCTGCTTT GGCCATGCCG GCGAGGATGC GCTGAAGGAC 
TGCATGGCGG CCTATGACGG CTTTGACCAT AACGCCCAAT CGCTGCGCAT CGTCACCAAG 
CTGGAGCGGC GCTATGCCGA ATTCGACGGC CTCAATCTGA CCTGGGAAAC CCTGGAGGGG 
CTGGTCAAGC ACAACGGGCC GCTGATCCGC CCGGGGGAGG CGACGCTCCA GGACCTGCCC 
GCGGCCATCC TCGAGTATGT CGACCGCCAT GACCTGGAGC TTTCGTCCTT CGCCGGACCC 
GAGGCCCAGG TGGCGGCATT GTCCGATGAT ATCGCCTATA ACGCCCATGA TCTGGACGAT 
GGCCTGCGCG CCGGTCTGTT TCCCTTGGAG GCGGTGATCG AGGTCCCGCT GGTCGGCCCC 
TTGTTGCGCC ACGTGCTTGA TCGCTATCCC GGCATCGAAC CGTCGCGGGC GATCCATGAA 
ACGGTGCGCC GGGTGATCAC CGCCATGGTC GATGACGTCT GCGCCGAAAG CGCCCGGCGG 
CTGGAGCGGC AAAACCCCGG GTCGGCGGCC GAAGTGCGGG CGCTGGATGC GCCGGTGATT 
GCCTTCAGCG AAGAAATGGC CCAAAAGGAC GCCGGATTGA AAGGTTTCCT TTTCCCCACC 
CTTTATCGTC ACTACCGGGT GAATCGGATG ACCAGCAAGG CGCGGCGCGT CGTTCGCGAG 
ATGTTCGGCC TGCTGGTCGA AGAGCCGATG CTGTTGCCCG ATGACTGGCG CGCCCGCACC 
ACCCGCCCGC ACAGCCACAA AACCGCCCGT GTTGTTTGCG ACTACATCGC CGGCATGACC 
GACCGCTTCG CGCTGGACGA ACATGCCAGA CTGTTTGATC CTTCGGTGAA ACCATGA

Protein sequence

MSIWTPKSPS LAPYASDPAT SRGRLYPEAS SPTRSPHQRD RDRVLHSAAF RRLKYKTQVF 
VNSVGENYRT RLTHSLEVSQ IARSVSRVLG LNEDLAEALA LAHDLGHTCF GHAGEDALKD 
CMAAYDGFDH NAQSLRIVTK LERRYAEFDG LNLTWETLEG LVKHNGPLIR PGEATLQDLP 
AAILEYVDRH DLELSSFAGP EAQVAALSDD IAYNAHDLDD GLRAGLFPLE AVIEVPLVGP 
LLRHVLDRYP GIEPSRAIHE TVRRVITAMV DDVCAESARR LERQNPGSAA EVRALDAPVI 
AFSEEMAQKD AGLKGFLFPT LYRHYRVNRM TSKARRVVRE MFGLLVEEPM LLPDDWRART 
TRPHSHKTAR VVCDYIAGMT DRFALDEHAR LFDPSVKP