Gene Rru_A2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A2001
Symbol
ID	3835426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	2310554
End bp	2311606
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	64%
IMG OID	637826101
Product	hypothetical protein
Protein accession	YP_427088
Protein GI	83593336
COG category	[S] Function unknown
COG ID	[COG3528] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCGCC CGATGTTTTC CCTTCTAGGG GCCGCCGCAC TGGGCTGCGC CGTGGTCGCC 
GCGCCCGCCA GCGCCGCCGA TCCGACCGAA CAGATCGATC CCGATACCGG TACGCCGTCC 
TATTATCCCA AGTGGGATGA CGGCACGCTG TCGATTCAGG TTGAAAACGA CAAGTTCGGC 
TTTTCCGGGA CCGACCAGCA TTACACCAAC GGCCTTCATG CCACCTGGTT GTCGGGGACC 
GGCGATATGC CGATCTGGGC CCAGGAAGTC GGCAACGCCT TGCCGTTCTT TCCGACCAAT 
TCGATCAAGC GCTACAGCCT GAGCTTTGGT CAGAGCATTT TCACGCCGTC CGACACCCAG 
GCCGATGATC CCGATCCCGA TGATCGCCCC TATGCGGGCT GGACCTATAT CGGCCTGGGC 
TATCTGGCCG AAACCGGCAA TACCCTTGAC CGCCTGGAAA TCGACTTGGG CGTGGTCGGT 
CCCTGGGCCC TGGGCGAAGA GACCCAGAAC AACTTCCATA GCCTGATCGG CGTCGATACG 
GCCAAGGGCT GGGGCTCGCA ATTGCATAAC GAGCCGGGCG CCGTGCTCTA TTACGAACGC 
ATGTGGCGGG CCTTGGGCAG CTTCAAGGCC GGTGGCCTGG GCTTCGACTT CTCGCCCCAT 
GCCGGCGCCG CCCTGGGCAA CGTTTATACC TATGCCGCCG GTGGCGGCAC CGTGCGGGTC 
GGCTTCAACC TGCCCGATGA TTACGGCCCG CCGCGCATCC GCCCCAGCCT TCCCGGCTCG 
ACCCAGTTCG AACCGACCGG CGGTCTGGGC GGCTATCTGT TCGCCGGCGT CGAAGGCCGC 
GCCGTCGCCC GCAACATCTT CCTCGATGGC AACACCTTCC GCGACAGCCC CAGCGTCGAC 
AAGAAGATCT TCGTGGGCGA CGTTCAGGCC GGCGTGGCGG TGACCCTTGG CAATACCCGG 
GTGACCTATA CCCAGGCCAT CCGCTCGCCC GAATTCGACG GTCAGGACAA GCCCGATATC 
TTCGGATCGA TCAGCCTGTC CTATCGCTTC TAG

Protein sequence

MMRPMFSLLG AAALGCAVVA APASAADPTE QIDPDTGTPS YYPKWDDGTL SIQVENDKFG 
FSGTDQHYTN GLHATWLSGT GDMPIWAQEV GNALPFFPTN SIKRYSLSFG QSIFTPSDTQ 
ADDPDPDDRP YAGWTYIGLG YLAETGNTLD RLEIDLGVVG PWALGEETQN NFHSLIGVDT 
AKGWGSQLHN EPGAVLYYER MWRALGSFKA GGLGFDFSPH AGAALGNVYT YAAGGGTVRV 
GFNLPDDYGP PRIRPSLPGS TQFEPTGGLG GYLFAGVEGR AVARNIFLDG NTFRDSPSVD 
KKIFVGDVQA GVAVTLGNTR VTYTQAIRSP EFDGQDKPDI FGSISLSYRF