Gene Rru_A0925 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A0925
Symbol
ID	3833961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	+
Start bp	1099736
End bp	1102021
Gene Length	2286 bp
Protein Length	761 aa
Translation table	11
GC content	67%
IMG OID	637825013
Product	glycosyl transferase, group 1
Protein accession	YP_426013
Protein GI	83592261
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.259199
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCACG TCAGCCGAAT CGCCTTTATC GGCAATTCCT TGCCCCGCCG CTGCGGGATC 
GCCACCTTCA CCACCCATCT GCGACAGGCG GTCGGAACGC GCTTTGCCGA CATCGAGACC 
TTCATCGTGG CGATGACCGA TCCCGGCCAG GATTACGCCT ATCCCGCCAG CGTGCCGATC 
GAAGTGCATC AGGACCGGCT GGAGGATTAC CTCCATGCCG CCGATCTGCT CAACGACGGC 
AATGTGGATA TCGCCTGCCT TCAGCACGAG TTCGGCATCT TCGGCGGCGA GGCCGGCGAA 
AACATCCTGG CGCTGCTCGG GCGCTTGACC ATGCCGATCG TCACCACCTT GCATACCGTG 
CTCGACCAGC CCACGCCCGC CCAGCGCGAT GTGCTCGACC GTCTTTTCGC CCTGTCGGCC 
AAGCTGATCG TCATGGCGCA GAAGGCGCGC GAGCTTTTGC GCACGGTTTA TCGGGTGCCC 
GCCGACAAGA TCGAGGTGAT CGCCCACGGC ATCCCGGATT TCCCCTTCGT CGGCTCTGAA 
AAGGCCAAGG CCGAGCTTGG CTTCAGCGGC CGCGCCGTGA TCTTGACCTT TGGCCTGCTG 
TCTCCCAACA AGGGCATCGA GGTGATGATC GACGCCATGC CGGCGATCGT GAAAAGCCGG 
CCCGACGCCG TTTATGTCGT TCTGGGCGCC ACCCACCCCA ATCTGGTGCG CGAGCAGGGC 
GAGGCCTATC GCGACAGCCT GCGGGCCCGC GTCCAGGATC TGGGTCTGCA AGACCACGTG 
GTTTTCCTCG ATCGCTTCGT CGATCAGGAC ACCTTGCTGC GCTTCATTTC GATGTGCGAC 
ATCTATGCCA CCCCCTATCT CAATCTGGCG CAGATGACCT CGGGCACCCT GGCCTATAGC 
TTCGGCCTGG GCAAACCGGT GGTCTCCACC CCCTATTGGC ATGCCCGCGA GCTTTTGGCC 
GATGGTCGGG GCATTCTGGT TCCCTTTGGC GACGCCGGGG CCATCGGCCT CGCCATCGCC 
GGCCTGTTGA CCGACGACGC GCGGCGCGAG GCGATGGCCG AGCGCGCCTA TATCGGCAGC 
CGGTCGATGA TCTGGCAACG CAGCGCCGAG CGTTATCTCG ATGTCTTCAC CGCCGTTCTC 
CAGGATCGCC AGGTCCACGA GGCGGCGCCG GTCGAGCGCG GCCGCGGGGC GCGCCCCCCT 
CACGCCCCCC CCGAAATGCG GTTGGGCCAT TTCCTGGCGA TGTGCGACGA CACCGGCTTG 
TTCCAGCACG CCGTCCATGT GGTGCCCGAT CGCTCGCACG GCTATTGCGT GGACGACAAC 
GCCCGGGCCC TGTTGCTGGC CTGCGCGCTG AATGCCCCGG GCGAGGAACC GCTGGCTGGG 
GCCTTGATCA GCCGCTTGGC CGCCTTCGTC CAGCACGCCT GGAACCCCGA CACCAAGCGC 
TTTCGCAATT TCCTCAGCTT CGAGCGGCGC TGGCTGGAAG ATCGCGGCTC GGAAGACAGC 
CATGGCCGCA CCCTGTGGGC CCTGGGCGAA TGCGCGCGCA GCGACGCCCT CGCCTCGCGG 
CGGCGTTGGG CGGCGGCGCT GTTTACCCAG GCTTTGCCCA GCGTCGAAGG CTTCACCTCG 
CCGCGCGCCT GGGCCTTCAC GCTGTTGGGG CTGAACGCCT TTTGCGCCGC CGGGGTGGTC 
GATGCCCAGG CCCTGCGCCT GCGCGGCCTG CTGGCCGACC GGTTGATGGC CCTGCTGGGC 
GCGGTCGAAA GCGCCGATTG GGTGTGGTTC GAAGAGGGGC TGGCCTATGA CAACGCCCGT 
TTGTCCCAGG CGCTGATCGT GACCGGGCGA GCGACCCGGA CCCCGGCCTA TATCGAGGGC 
GGTCTGCGCT CGCTGCGCTG GTTGATGACG ATCCAGACGG CGCCGGCGGG CTTTTTCCGG 
CCGGTTGGCT CGGACAGCTT CGGCGATCTG CGCCAGCCGC CCAAGCCCTT CGATCAACAG 
GCCCTGGAGG TGGCGGCGAC GATCGCCGCC TGCCTCGCCG CCTGGCAGGC CGATGGCGAT 
GACCAATGGC GGATCGAGGC GATGCGCAGC TTCGACTGGT TCCTGGGCCG CAACGACCTG 
GGGGTTCCCT TGGTCGACCG GGAAACCGGC AGTTGCCGCG ATGGTCTGCA CAGCGATCGC 
CCCAATGAAA ATCGCGGCGG CGAGTCGGTG CTGTCCTATC TGTTGAGCTT GGCCGAGATC 
AGGCGCACCG CCCGTCTTGG CATTGACAGC GCGACCTTGC TGCCGCTGCG GGCAAGGCGC 
CTTTAG

Protein sequence

MTHVSRIAFI GNSLPRRCGI ATFTTHLRQA VGTRFADIET FIVAMTDPGQ DYAYPASVPI 
EVHQDRLEDY LHAADLLNDG NVDIACLQHE FGIFGGEAGE NILALLGRLT MPIVTTLHTV 
LDQPTPAQRD VLDRLFALSA KLIVMAQKAR ELLRTVYRVP ADKIEVIAHG IPDFPFVGSE 
KAKAELGFSG RAVILTFGLL SPNKGIEVMI DAMPAIVKSR PDAVYVVLGA THPNLVREQG 
EAYRDSLRAR VQDLGLQDHV VFLDRFVDQD TLLRFISMCD IYATPYLNLA QMTSGTLAYS 
FGLGKPVVST PYWHARELLA DGRGILVPFG DAGAIGLAIA GLLTDDARRE AMAERAYIGS 
RSMIWQRSAE RYLDVFTAVL QDRQVHEAAP VERGRGARPP HAPPEMRLGH FLAMCDDTGL 
FQHAVHVVPD RSHGYCVDDN ARALLLACAL NAPGEEPLAG ALISRLAAFV QHAWNPDTKR 
FRNFLSFERR WLEDRGSEDS HGRTLWALGE CARSDALASR RRWAAALFTQ ALPSVEGFTS 
PRAWAFTLLG LNAFCAAGVV DAQALRLRGL LADRLMALLG AVESADWVWF EEGLAYDNAR 
LSQALIVTGR ATRTPAYIEG GLRSLRWLMT IQTAPAGFFR PVGSDSFGDL RQPPKPFDQQ 
ALEVAATIAA CLAAWQADGD DQWRIEAMRS FDWFLGRNDL GVPLVDRETG SCRDGLHSDR 
PNENRGGESV LSYLLSLAEI RRTARLGIDS ATLLPLRARR L