Gene Rru_A0159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A0159
Symbol
ID	3833689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	185135
End bp	186748
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	72%
IMG OID	637824231
Product	exodeoxyribonuclease VII large subunit
Protein accession	YP_425251
Protein GI	83591499
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGACA CCCCCAACGC CCCCGTCCAC AACCTTCCCG AACTCTCGGT ATCCGAGCTG 
TCGGGCGCCC TCAAACGCAC GATCGAGGAG GCTTTTTCGC GCGTCCGCGT GCGCGGCGAG 
ATCAGCCAGC CCAAGGTGGC CGGCTCGGGG CACTGCTATT TGCGCCTGAA GGACGATCAG 
GCGGTGATCG ACGCCATCAT CTGGCGCGGC ACCATGGCCA AACTCGCCCT GCGCCCGGAA 
GAGGGGCTCG AGGTCATCGC CATCGGCCGA CTGACCACCT ATCCCGGCCG ATCAAGCTAC 
CAGATCGTTA TCGAATCGCT GGAACTGGCC GGCGAGGGCG CCTTGCTGAA AATGCTCGAG 
GAGCGGCGCA GACGGCTGGC CGCCGAAGGG CTGTTCGATG CCGGGCGCAA GCGCCGCCCG 
CCCTTCCTGC CCTCGGTGAT CGGCGTCATC ACCTCGCCCA CCGGCGCCGT CATCCGCGAT 
ATCCTCCACC GCCTTGCCGA TCGCTTTCCC CGTCCGGTTC TGGTCTGGCC GGTCGCCGTC 
CAGGGCGAGG GCGCGGCCGC CCAGATCGCC GCCGCCATCA CCGGCTTCAA CGCCCTGCCT 
GCGGGCGGGC CGGTGCCGCG CCCCGACGTG CTGATCGTGG CGCGCGGCGG CGGCAGCCTG 
GAAGACCTGA TGGCCTTCAA CGACGAGGCC GTGGTCCGCG CCGCCAGCGC CAGCGCCATC 
CCGCTGATTT CCGCCGTCGG CCATGAAACC GACACCACCT TGATCGACCA CGCCGCCGAC 
CTGCGGGCGC CGACGCCGAC GGGGGCGGCG GAAATGGCCG TGCCGGTTCG CCTGGATCTG 
CTGGCCCAGG TCCGCGAGCG CGGCGGCCGG CTTGACGGCG CGACCTTGCG GCTGATCGAG 
GAACGCCGCT TGCGGATCGA AGGACTGGGG CGCGGCCTGC CCGACCTCGC CCGGCTGATC 
GGCACCTTCG CCCAGCGCCT TGATGATCGC GCCGAGCGTC TGGAGGCCGC CTTGCCCCGC 
CTGCTCGATC GCCGGGCCGA TGGCGTTTTC CATACGGCCG CCCGCCTGCG CGGACCGGGC 
GAGATGATCG CCCGCAAGGC CGATGCCCTG GAACGCGCCG GACGCGGCCT GGAGACCGGG 
CTCGCCCGCG GCCTGCGCGA GGCGGCGAGC CGACTTGACC AGCGGGCCGA CCGTCTGCGT 
CCGGGCCAGA TCGCCCGCCT TGTCGCCGAA GGAAGCCGGG CCTTGACCAC CCTGGCCGGC 
CGGCTTGACG ATCTTGGCCG CCAGACCCTG GTCCGCCGCC AGGACACCCT GGAGGGCCTG 
GGCGCCCGGC TGGACAACAT GTCCTATCGC AAGGTGCTCG AACGCGGCTA TGCGGTGGTC 
CGCGATGCCA CGGGCGCCAT CGTGCCGGCG GCGCGCGGCC TGACCAAAGG CGACGGCGTC 
GTCCTTGATT TCCGTGACGG CCGGGTGGCG GCGACGATCG GCGAGGCCGA CCCCGAGGCG 
ATCCCCGGCC AACCCGCTCC GGAAACTCCG CCGACCGCCG CCGGCCGGTC GCCCGCGCGG 
CGGCCGCGAT CTGCGGGCGA AGGCCGCCAG GGCGACCTGC TCAAGGACCT CTGA

Protein sequence

MIDTPNAPVH NLPELSVSEL SGALKRTIEE AFSRVRVRGE ISQPKVAGSG HCYLRLKDDQ 
AVIDAIIWRG TMAKLALRPE EGLEVIAIGR LTTYPGRSSY QIVIESLELA GEGALLKMLE 
ERRRRLAAEG LFDAGRKRRP PFLPSVIGVI TSPTGAVIRD ILHRLADRFP RPVLVWPVAV 
QGEGAAAQIA AAITGFNALP AGGPVPRPDV LIVARGGGSL EDLMAFNDEA VVRAASASAI 
PLISAVGHET DTTLIDHAAD LRAPTPTGAA EMAVPVRLDL LAQVRERGGR LDGATLRLIE 
ERRLRIEGLG RGLPDLARLI GTFAQRLDDR AERLEAALPR LLDRRADGVF HTAARLRGPG 
EMIARKADAL ERAGRGLETG LARGLREAAS RLDQRADRLR PGQIARLVAE GSRALTTLAG 
RLDDLGRQTL VRRQDTLEGL GARLDNMSYR KVLERGYAVV RDATGAIVPA ARGLTKGDGV 
VLDFRDGRVA ATIGEADPEA IPGQPAPETP PTAAGRSPAR RPRSAGEGRQ GDLLKDL