Gene Rru_A3107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A3107
Symbol
ID	3836553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	+
Start bp	3577151
End bp	3578578
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	66%
IMG OID	637827222
Product	glycosyl transferase, group 1
Protein accession	YP_428189
Protein GI	83594437
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.27638
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCTGTTC GGGCAAGAAA CGTAAAGGGG AATTCAAATC CCAGACTCAA TTCTTATATT 
ATTCTAGTTA AAGTTTTCGA CGGCCCGGAA ACCCCGGTTT CGCGCCAGTC GCCCCATCTG 
ACCCGGGATT CTTGTCAGCA CTGTGATCCA TTCACCCTCA ACCGGGGCGC TATCGTGAAA 
ATCCTTTATC ACCACCGAAC CCAGGCCAAC GACGGATGCG CCGTTCATAT CACCGAAATG 
ATCGCCGCCC TGCGGCGCGA CGGTCACGAG GTGGTGGTGG TGGCGCCGGC GGTGGCGAAG 
GGCGAACCCT CGGCCGAGAA GACCACGGGC GGGCTGATCG CCACTTTGCG CAAAAGACTT 
CCCAAGGCCG CCTTTGAAGC TCTGGAGTTC CTGTATTCCG GGTTTGCTTA TTTTCGTTTA 
TTGCGCGCGG TGTTTTCCCA CCGCCCCGAC GTTCTTTATG AACGCTACAG CCTTTTCATG 
CCGACCGGCA CTTGGATTCG CCGAACCTGC GGCCTGCCGG TTCTCCTCGA GGTCAATTCG 
CCTTTGCGCG AGGAGCGCGC CCGGCACGGC GGACTGGCCC TGGGCGCCCT GGCCGGCTGG 
ACCGAGCGGG TGTCATGGAA AGGCGCCGAT CGCGTGCTGC CGGTCACCGC CGTGCTCGCC 
CGCCAGATCA GCGCCATCGG CGTGGCCGAA GGGCGGATCA GCGTGATCGC CAATGGCATC 
AATCCCCAAA CCTTCGGCCC TTTGCCCGAG GGCGACCAAG CCAAGGCCGC CCTTGGTCTG 
GAGGGCAAAC TGGTTCTCGG CTTCACCGGC TTCGTCCGCG ATTGGCACGG ATTGGACCGG 
GTGATCGAGG CGCTGCCCCG CACCCCCCAG GCCCATCTGC TGATCGTCGG CGACGGCCCG 
GCGCGCCAGG ATCTGCTCGC CCGCGCCCAG CAGATGGACG TTGGCGAGCG CGTCAGCTTT 
ACCGGCGTGC TGCCCCACGC CCGCATCGCC GGCCATGTCG CCGCCTTCGA TATCGCCCTG 
CAGCCGGCGG TCACCGCCTA TGCCTCGCCG CTCAAGCTTT TTGAATACCT TCAGATGGGG 
CGGACCATTC TGGCTCCCGA CCAGCCCAAT CTGCGCGAGA TCCTGACCGA TGGCGTGAAC 
GCCCGTCTGT TCGACGCCGA GCGCGGCGAA GCCTTCGCCG AAGCGCTCGA CGGCCTGATC 
GCCAACCCCG AGGAGCGCCG CCGTCTGGCC GAAGGCGCCC GGGCGACGAT CGCCCGCCTT 
GGCTTGACCT GGGATCACAA CGCCCGCCGG GTCGTCGCCC TCGCCCAAGC CGCGCTTCTC 
GCCTGCCCCC GCCGGCGCCC CGCCGCCGGA ACGGCAGGGC CCCTTGGTCC GACGGCGGCC 
CGCCCTTCCT CCCGGGCAGC GGACGATCCC CCCGGCGCGC CGCGGTAG

Protein sequence

MSVRARNVKG NSNPRLNSYI ILVKVFDGPE TPVSRQSPHL TRDSCQHCDP FTLNRGAIVK 
ILYHHRTQAN DGCAVHITEM IAALRRDGHE VVVVAPAVAK GEPSAEKTTG GLIATLRKRL 
PKAAFEALEF LYSGFAYFRL LRAVFSHRPD VLYERYSLFM PTGTWIRRTC GLPVLLEVNS 
PLREERARHG GLALGALAGW TERVSWKGAD RVLPVTAVLA RQISAIGVAE GRISVIANGI 
NPQTFGPLPE GDQAKAALGL EGKLVLGFTG FVRDWHGLDR VIEALPRTPQ AHLLIVGDGP 
ARQDLLARAQ QMDVGERVSF TGVLPHARIA GHVAAFDIAL QPAVTAYASP LKLFEYLQMG 
RTILAPDQPN LREILTDGVN ARLFDAERGE AFAEALDGLI ANPEERRRLA EGARATIARL 
GLTWDHNARR VVALAQAALL ACPRRRPAAG TAGPLGPTAA RPSSRAADDP PGAPR