Gene Rru_A3333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A3333
Symbol
ID	3836785
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	+
Start bp	3845680
End bp	3846930
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	67%
IMG OID	637827454
Product	SAM-dependent methyltransferase
Protein accession	YP_428414
Protein GI	83594662
COG category	[R] General function prediction only
COG ID	[COG1092] Predicted SAM-dependent methyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.427413
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAAT GCCCTATCCT GGGGCCTCCT CCCCCTTTCG GAATCGTCAT GACAGAGCCA 
AATTCGCCGT CTCTCCCCGA AATCCGCCTT CTCGCCGGCC ACTCGAAGCG GCTCCGCCAG 
GGCCATCCCT GGGTTTTCTC CAACGAGATC GCCATGACCC CGGAGGCCAA GGCCATGACT 
CCGGGAGCGC TTGTCACCTT GCGCGATGCC GGGGATGAGC CGCTGGCCAT CGCCACGTTT 
AATCCGCATT CGCTGATCGC CGCGCGGGTT CTTGATCGCG ATCTTGGCGC CAGCATCACC 
AAGGAATGGG TCTTCGTCCG GCTTCAGCGG GCCTTGCGCC TGCGCGACAC GCTGTTTGAC 
CAACCCTATT ACCGGCTCGT CCATGGCGAG GCCGACGGCC TGCCCGGGCT GGTCGTCGAC 
CGTTTGGGCG ATGTCATCGC CGTCCAGGCC AACAGCGCCG GGATGGATCT GCTGACGCCA 
CTGATTCTCG ACGCCATCGA AAACCTGCTG GCGCCGCGCG CCATCGTGCT GATCAACGAC 
GCGCCGGTGC GCCTACTCGA AGGGCTGACC CAGGAAACCG CCCTGGCCCG GGGCCAGATC 
GACGGCCCGG TGCCGGTGAT CGAAAACGGC TTTTCCTATC TGGCCGACCT GCAGGAAGGC 
CAGAAGACCG GCTGGTTCTT CGATCAGCGG CCCAATCGCG CCTTCGTCGC CGACCTCGCC 
CGCGGCCGCT CGGTGCTTGA TGTCTATAGC TATGCCGGGG GCTTCGGGCT GCTGGCGCTG 
GCGCGCGGCG CCACCTCGGC CACCCTGGTC GACCGCTCCG ACCAGGGCCT GCTGCTGGCC 
CAACAGGCCG CCGCCACCGC CGGACTCGGC GGGGCGCTGA CCACCCACAA GGCCGAGGGT 
TTCGCCTACC TCGAGCAAGC AGAGCATGAG GGCAAGCGTT TTGGCGTCGT CGTCTGCGAT 
CCGCCGGCCT TCGCCAAGAC CCGCAAGGAT CAGGCCTCGG GCGCCAAGGG CTATCGCAAG 
GTCGCCCGCC TCGCCGCCGC CCTGGTCGAA CCCGGCGGCT TTCTGTTCGT CGCCTCGTGC 
AGCCATCACA TGCCGATCGA CCGCTTCCAG GACGAAACCG CCCATGGCAT CGCCCAGGCC 
GGGCGGACGG GGCGGATCTT GCGCTCGGGC GGCGCCGGTC CCGACCATCC GGTCCATCCC 
GATCTGGCCG AATCGGCCTA TCTCAAGACC CTGACCTGGG CGATCGACTA A

Protein sequence

MRKCPILGPP PPFGIVMTEP NSPSLPEIRL LAGHSKRLRQ GHPWVFSNEI AMTPEAKAMT 
PGALVTLRDA GDEPLAIATF NPHSLIAARV LDRDLGASIT KEWVFVRLQR ALRLRDTLFD 
QPYYRLVHGE ADGLPGLVVD RLGDVIAVQA NSAGMDLLTP LILDAIENLL APRAIVLIND 
APVRLLEGLT QETALARGQI DGPVPVIENG FSYLADLQEG QKTGWFFDQR PNRAFVADLA 
RGRSVLDVYS YAGGFGLLAL ARGATSATLV DRSDQGLLLA QQAAATAGLG GALTTHKAEG 
FAYLEQAEHE GKRFGVVVCD PPAFAKTRKD QASGAKGYRK VARLAAALVE PGGFLFVASC 
SHHMPIDRFQ DETAHGIAQA GRTGRILRSG GAGPDHPVHP DLAESAYLKT LTWAID