Gene RPD_1649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1649
Symbol
ID	4022129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1857299
End bp	1858648
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	67%
IMG OID	637961844
Product	glycosyl transferase, group 1
Protein accession	YP_568787
Protein GI	91976128
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0395854
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAAG TGACGGACAC CCCCTTGGCG CAGCCCCCCG ACACACAGGC CCCTCTGTCT 
CAACCCTGGC TGTGGATGGA CGTGTCGACC AGCTTTCGCT CGCGCTCCGG CCAGATGAAC 
GGCACGCTCC GCGTCGAGCA AAGCATGGCG ACGGCGCTGT CCGAACTGAT GGCGCCGCAG 
CTCCGGTTCT GCCGCTACGA TCCGCTGCGG CGGGACTACG TGCCGCTCGC CAATGCGCCG 
GATCTCGGCG ACAAGCCGGT CGCCGCCGCA CCGAAGCAGA AGCGCACGAC GGCGCTGTCG 
TCGATCAAGC CGCTCGGCAA GAAAATCGAA CGTGCGATCC GAACGTCGGT GCGCAGCGCC 
GCGGCGCCGT TGTTGCAAAA GATATCAGGC AGCAATGGAC TGCCGCTGAT CGGCGGCGCC 
GACGGCCGGG AAGTCCTGCT GCTCGCCGGC GAAAACTGGT CGCGGGTGAA CTACGCCGCG 
GTGGCGCGGA TGCGCCGCGA ACGCGGCACC AGGGTCGCCG CGGTGTGCCA GGATTTCATC 
CCGGTGATGG CGCCGCAATT CTTCGCCGAC GGCGATTTCG TCACGATGTT CGACGCCTAT 
GCGCAATTCC TGATCCGCGA ATGCGACCTG ATCATCTCGA TCTCGCAATC GACCAGCGCT 
GATGTGATGG CCTATGCGCA GCGCCATGGC GGCCTGCGCG GCGCGATCGA GCTGGTGCAT 
CTGGGGGCTG ATCTGGCCGC GCCGGAAGCC GGGCGGCGGC CGCAGGCGCT CAGCGACGCG 
CAGGCCAAGC GCTTCGTGAT CAGCGTCTCG AGCATTCAGT CGCGCAAGAA TTTCGACCTG 
CTGTATCACC TCTGGCGGCG CCTGACCGAG CAGGGCACCC CGGACCTGCC GACGCTGGTG 
CTGGTCGGCC AACCCGGCTT CGGCAGTTCG GACCTGTTGT GGCAGATCGC GCATGATCCG 
GTCACCGCGT CCTCGATCGT GCATTTGCCG CGCGCCGGCG ACGCGGAGCT GGCGTGGCTT 
TACCGGCACT GCGCGTTCAC GCTGTATCCC TCGTTCTACG AAGGCTGGGG ACTGCCGGTA 
TCGGAGAGTC TGGCGTTCGG CAAATACTGT CTCGCATCGA ACACGTCATC TCTGCCGGAG 
GCCGGAGCGG GGCTGGCCGG CCACCTCGAT CCGCTGGATT TCGCCGCCTG GCGCGAAGCG 
GTGCTTGACC TGATCCGTGC GCCTGATCAA CTTGCACGGC ACGAGGCGGC GATCCGGCAG 
AACTATCGCC CGGTGACCTG GGCGCAATCG GCGCATCGGC TGGCGGAGGT GTTGCGCAGC 
CTGTCGGCCG CGTCCTACCC CAAGGTCTAG

Protein sequence

MTKVTDTPLA QPPDTQAPLS QPWLWMDVST SFRSRSGQMN GTLRVEQSMA TALSELMAPQ 
LRFCRYDPLR RDYVPLANAP DLGDKPVAAA PKQKRTTALS SIKPLGKKIE RAIRTSVRSA 
AAPLLQKISG SNGLPLIGGA DGREVLLLAG ENWSRVNYAA VARMRRERGT RVAAVCQDFI 
PVMAPQFFAD GDFVTMFDAY AQFLIRECDL IISISQSTSA DVMAYAQRHG GLRGAIELVH 
LGADLAAPEA GRRPQALSDA QAKRFVISVS SIQSRKNFDL LYHLWRRLTE QGTPDLPTLV 
LVGQPGFGSS DLLWQIAHDP VTASSIVHLP RAGDAELAWL YRHCAFTLYP SFYEGWGLPV 
SESLAFGKYC LASNTSSLPE AGAGLAGHLD PLDFAAWREA VLDLIRAPDQ LARHEAAIRQ 
NYRPVTWAQS AHRLAEVLRS LSAASYPKV