Gene RPB_0886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0886
Symbol
ID	3909066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1013469
End bp	1015490
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	71%
IMG OID	637882779
Product	glycosyl transferases
Protein accession	YP_484508
Protein GI	86748012
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGCCG ACCGCGCCGG ACACAACGTT GCGGTGGAGC AGCGCGGCAG GCACGCGGGG 
ACCTCGCCAT GGCCGGGGCG GCCGGGCTTT CTCGCCTGCT GGAACGGGTC CGCCGTCGAT 
GCTGCGACCG TGCCGCCGCA GAGTCCCGAA CTGAATTGCC TGCGCGGTGT GCTGCCACCG 
AACCTGCTGG AGGCCGCCCG CCGGCGCGCC GGCGAACTCG GAACGGGTGC CGATCAGGTG 
CTGATCCGAT GGGGCGTGAT CGACGAAACG ACTTATCTGC ATCGACTGGC CCGGCATCTC 
CGGATCGCCC CCGAGGATTT TGCGCAGGTC GGCCGCGACG ACACGCCGTT GTGCGACGAC 
CAGATGCGGT TCGCCGCGGC GGCGGGGGTG ATGCCGCTGC GGCAGAACGG CGACCTGGTA 
TGGGCGATGG CGCCACGGCG GATGGCGGCG CGCACCTTGT GCGGCGTGCT GCACGATCAT 
CCATCGCTGC GCAGCCGGTT TCGCGTCGCC CCCCAGTGCG CGATGCAGCA GTTCCTGCAG 
CAGACCGGTC AGGGCCTGGC GCAGCACGCG AGCTTCGGCC TGCAGCGCCG CTATCCCGCG 
CTGGCGGTTT CACCCTGCGA TGTCGAGATC GGCTGGCGGA CCGGGCTCAG GCGCGCGGCG 
GCCGGTGCGT TGCTGGCCGC CGCCTTGCCG CTGCTGTGCG CCGTCCATTC CGGCGTGGTC 
ACGGCGCTGC TGTTTCTCGG CTTCATCGGA TTGCGGCTGG CGGCGAGCCT GCAGCCGCGA 
CCGCCCGCAC CACGATCGGC GCGCCGGCCG GACGACGCAT TGCCGATCTA CACCGCGATC 
GCGGCGCTGT ATCGCGAGGC GGCGTCGGTG GCGTCGCTGG TCGAAGCGAT CGAGGCGCTG 
GACTATCCGC GCGAGAAACT TGACATCATT CTGGTCGTCG AGCTCGACGA TCTCGCCACC 
CGCGCCGCGA TCGCGCGGCT CGGGCCGCGA CCACATCTGC GCGTGCTGAT TGCGCCGGCG 
GTCGGGCCCA GGACCAAGCC GAAGGCGCTC AACTACGCGC TGCCGTTCGT GCGCGGCGGC 
ATGGTGACGG TGTTCGACGC CGAGGACCGC CCGGAGCCCG ATCAGCTTCG CGCCGCGCTC 
GACGCCTTCG CGCGCGGCGG GCCGACGACC GGCTGCGTCC AGGCCGGCCT GTGCATCGAC 
AACATCACCC ATAGCTGGCT GTCGCGGCTG TTCCTCGCCG AATATGCCGG CCAGTTCGAG 
GCGGTGCTGC CCGGCCTGAC GCGACTGGGT CTGCCGCTGC CGCTCGGCGG CTCGTCGAAT 
CACTTCCGCA CCGCCGTGCT GCGCGAGGTG GGCGGTTGGG ATGCTTACAA CGTGACGGAG 
GATGCCGATC TCGGCTTCCG GCTGGCGCGG TTCGGCTACA GCGCCATCAG CTTCGACTCC 
CGCACCTTCG AAGAGGCGCC GATCGGCCTC GCCGCGTGGC TCGGCCAGCG CACCCGCTGG 
ATGAAAGGCT GGATGCAGAC CTGGTGCGTG CACATGCGCC GGCCCCGGCT GTTCTGGCGC 
GACGCCGGCT GGCGCGGCGT GCTGGCGCTG AACCTGTTCG TCGGCGGCAG CGTGCTGTCC 
GCCCTGATCC ATCCGCTGCT GCTCCTGGAC CTCGCCACGA CAGGGCTCGC GCTCGCGCAG 
GGCGAGCCGC TGTCCCCGCC TTCGCCGTGG GCCTCGCTCC ACGGTCTGGC CGTCGCCGCC 
GGATACGTCG GCAGCGCGGT CGTCGCTGCG ATCGGCCTGA AGCGGATCGG TCGGCTGCAC 
GATGCGGCCT GGCTGCTGCT GATGCCGCTG TACTGGATCT GCCTGTCGAT CGCGGCCTGG 
CGCGCGCTCG GCGAACTGGT GTGGAAGCCG CATCATTGGC AGAAGACCGA GCACGGCGTC 
GCCGCGCGTG CCGCCCCTTC GCCGAAGGCC GTCGGGAAAA CGCTCGTCAG AGATAGCGCT 
TCAGATCCGC GGCGGCCTCT TCGGGCTTCC GCTTCATGTT GA

Protein sequence

MVADRAGHNV AVEQRGRHAG TSPWPGRPGF LACWNGSAVD AATVPPQSPE LNCLRGVLPP 
NLLEAARRRA GELGTGADQV LIRWGVIDET TYLHRLARHL RIAPEDFAQV GRDDTPLCDD 
QMRFAAAAGV MPLRQNGDLV WAMAPRRMAA RTLCGVLHDH PSLRSRFRVA PQCAMQQFLQ 
QTGQGLAQHA SFGLQRRYPA LAVSPCDVEI GWRTGLRRAA AGALLAAALP LLCAVHSGVV 
TALLFLGFIG LRLAASLQPR PPAPRSARRP DDALPIYTAI AALYREAASV ASLVEAIEAL 
DYPREKLDII LVVELDDLAT RAAIARLGPR PHLRVLIAPA VGPRTKPKAL NYALPFVRGG 
MVTVFDAEDR PEPDQLRAAL DAFARGGPTT GCVQAGLCID NITHSWLSRL FLAEYAGQFE 
AVLPGLTRLG LPLPLGGSSN HFRTAVLREV GGWDAYNVTE DADLGFRLAR FGYSAISFDS 
RTFEEAPIGL AAWLGQRTRW MKGWMQTWCV HMRRPRLFWR DAGWRGVLAL NLFVGGSVLS 
ALIHPLLLLD LATTGLALAQ GEPLSPPSPW ASLHGLAVAA GYVGSAVVAA IGLKRIGRLH 
DAAWLLLMPL YWICLSIAAW RALGELVWKP HHWQKTEHGV AARAAPSPKA VGKTLVRDSA 
SDPRRPLRAS ASC