Gene RPD_1141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1141
Symbol
ID	4021617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1296521
End bp	1297588
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	64%
IMG OID	637961333
Product	glycosyl transferase, group 1
Protein accession	YP_568280
Protein GI	91975621
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0760697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATTG CGCAGGTTGC TCCGCTGACG GAGGCTATCC CGCCCAAGCT CTACGGCGGT 
ACGGAAAGAG TCGTGCATTG GTTGACCGAA GAACTCGTCG CGCTCGGACA CGACGTGACG 
CTGTTCGCCT CCGGCGATTC CACCACGTCG GCGAAACTCG AGGCGACCTG GCCGAGAGCG 
CTCCGCCTCG ATGGCGCGGT GCGCGACGCC AACGCGCTGC ACATGGTCAT GCTGGAGCAG 
GTGAGACAAC GGTGTGACAA AGAGGAATTC GATCTCCTCC ACTTCCATCT CGATTACTAT 
CCCTGGTCGC TGTTTCGTCG ACAGCCGACG CCCTTCATTA CAACGCTGCA CGGCCGTCTC 
GATTTGCCCG AGCATCAGCC GGTGTTCGCG GCTTTCGCAG ATGTGCCGGT GGTGTCGATT 
TCGGATTCGC AGCGCCGCCC GGTGCCGAAG GCGAACTGGA TCCGCACCAT CCATCACGGG 
CTTCCGGCCG ATCTGCTGAC GCCGCTGGTC CGCAAGCCGA GCTATCTCGC GGTACTCGGG 
CGGATCGCGC CGGAGAAGGG CGTCGACCGT GCGATCCGGA TCGCGATCCG CGCCAATGTC 
CCGCTGAAGA TCGCGGCGAA GGTCGACCGG GCCGACCTGG AGTATTTCGA ACAGGTCATC 
GAGCCGATGT TGCTTCACCC GCTGATCGAG TTCATCGGCG AAATCGGCGA CCAGGAGAAA 
TCCGAGTTTC TCAGCGGCGC GCTGGGATTG CTGCTGCCGC TGGATTGGCC GGAGCCGTTC 
GGCCTGGTGA TGATCGAATC GCTCGCGTGC GGCGCGCCGG TGATCGCCTA TAACCGCGGC 
TCAGTCCCCG AGATCATCGA ACAGGGACTG ACCGGATTCA TCGTCGAGGA CGAGACCAGC 
GCGGTGACGG CTGTGCATCA ACTCGAAGAT CTCGATCGCT CCGCGATCCG CGCACGGTTC 
GAGGAACGCT TCACAGCGCG GCGGATGGCG CTCGACTATC TGGCGGCCTA TCGAGGCCTG 
CTCGCAAAGG CGGTCCCGCC GCGGATCAAG CTGGTGTCGG GCGAGTAA

Protein sequence

MRIAQVAPLT EAIPPKLYGG TERVVHWLTE ELVALGHDVT LFASGDSTTS AKLEATWPRA 
LRLDGAVRDA NALHMVMLEQ VRQRCDKEEF DLLHFHLDYY PWSLFRRQPT PFITTLHGRL 
DLPEHQPVFA AFADVPVVSI SDSQRRPVPK ANWIRTIHHG LPADLLTPLV RKPSYLAVLG 
RIAPEKGVDR AIRIAIRANV PLKIAAKVDR ADLEYFEQVI EPMLLHPLIE FIGEIGDQEK 
SEFLSGALGL LLPLDWPEPF GLVMIESLAC GAPVIAYNRG SVPEIIEQGL TGFIVEDETS 
AVTAVHQLED LDRSAIRARF EERFTARRMA LDYLAAYRGL LAKAVPPRIK LVSGE