Gene RPC_4719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4719
Symbol
ID	3972695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	5280285
End bp	5281325
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	67%
IMG OID	637927831
Product	glycosyl transferase family protein
Protein accession	YP_534560
Protein GI	90426190
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.19129
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCTTG GTTCTGACCT GTCCGCCCTC GCCGCCGGCA ACGGCGCTGC CGCTGCGAAA 
ACGCTGTCAC TGGTGGTGCC GCTGTTCAAT GAGGCGGCGG GCCTGCCGCA GCTGCACGAC 
CGGCTGGTGG CGCTCGCCGC CACGCTGCGG CAGCGCTACG GGCTTGGCTG CGAAGTGATC 
TATGTCGACG ACGGCAGCGC CGACGCCACG CTGAGCGTGG CGCGCGGTCT GTCGGCGCCG 
ACGCTCGACG TCCAGGTGGT GTCGCTGTCG CGCAATTTCG GCAAGGAAGC CGCCTTGATG 
GCCGGGCTCG ACCATGCCGG AAACGGCGCG GTGCTGTTCA TGGACGGCGA CGGCCAGCAT 
CCGCCGGCGC TGGTCGAACA ATTGGTGCAG CACTGGATCG TCGACAGCTA CGACGTGGTC 
TACACCGCCA AGGCGCACCG CGACAACGAA ACCTGGCTGC GCCGCACCGC GGTGCGCGGC 
TTCTACATGC TGATCAATTG GGGCGCGCGG CAGAAGATCC CGGAAGACGC CGGCGATTTC 
CGGCTGCTGT CGCCGCGCGC CGCCGCGGCG TTGCGGCAAT TGCCGGAGCG CAACCGCTTC 
TTCAAGGGAC TGGCGAGCTG GATCGGGTTT CGCCAGATCC GCGTCGACTA TGAGCCGGAG 
CCGCGCTCGC ACGGCATCAC CTCGTTCAAC GCCGCACGGC TGGTCGGGCT GTCGATCGAG 
GGCCTGACCT CGTTTTCGGT GGCGCCGTTG CGCATCGCCA GCCTGCTCGG CCTGTTGCTC 
GCCTTCGTGG CGTTCCTGTT CGGGCTGTCG ATCCTGTGGG AGACCATGGT CAGCGGCAAA 
TCGGTGCCGG GCTATCCGTC GCTGGTGGTC GGACTGATGA CGATCGGCGG CGTGCAGCTG 
ATCATGATCG GCATCGTCGG CGAGTATATC GGCAAGATCC TCTCCGAATT GAAGGCGCGG 
CCGATCTATT TCGTCGCCGA ACACAGCGTC AAGCGCGCCG ACACCACCAC CAACACCGGC 
GAACGGACCG CCGCCGAATG A

Protein sequence

MILGSDLSAL AAGNGAAAAK TLSLVVPLFN EAAGLPQLHD RLVALAATLR QRYGLGCEVI 
YVDDGSADAT LSVARGLSAP TLDVQVVSLS RNFGKEAALM AGLDHAGNGA VLFMDGDGQH 
PPALVEQLVQ HWIVDSYDVV YTAKAHRDNE TWLRRTAVRG FYMLINWGAR QKIPEDAGDF 
RLLSPRAAAA LRQLPERNRF FKGLASWIGF RQIRVDYEPE PRSHGITSFN AARLVGLSIE 
GLTSFSVAPL RIASLLGLLL AFVAFLFGLS ILWETMVSGK SVPGYPSLVV GLMTIGGVQL 
IMIGIVGEYI GKILSELKAR PIYFVAEHSV KRADTTTNTG ERTAAE