Gene RPD_1801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1801
Symbol
ID	4022283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2014151
End bp	2015644
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	68%
IMG OID	637961995
Product	glycosyl transferase family protein
Protein accession	YP_568938
Protein GI	91976279
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.268246
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATGA CGGCGCGACG TTTCGTCGGC GGCACCGCTC TGGCCGTCGC CGCCATGGTG 
GCGCTGCGCC TCGTCGCCGC GGCGGTGACG CCGCTGACCT TCGACGAAGC CTATTACTGG 
ACCTGGTCGA AGCATCTCGC CGCCTCCTAT TTCGATCATC CGCCGATGGT CGCCTTGGTG 
ATCCGGCTCG GCACGCTGAT CGCCGGGGAC ACCGAATTCG GCGTCCGGCT GATCTCGGTG 
CTGTTGGCGT TGCCGATGAG CTGGGCGACC TGGCGCTCCG CGGAATTGCT GTTCGGCGGC 
GGTCGCCTCG CGTCCCATGC GACGCTGCTG CTCAACGCCA CGATGATGGT CTCGATCGGC 
ACCGTGATCG TGACGCCGGA TGCGCCGCTG CTGGCGGCGT CTGCCTTCGT GCTCTATGCC 
CTCGCGCAGG TGCTGTCGTC CGGAAAAGGC GCGTGGTGGC TTGCGGTCGG CGTCGCGGTC 
GGCGCCGGGC TGCTGTCGAA ATACACCGCC TTGTTCTTCG GCCCGGCGAT CCTGATCTGG 
TTGTTGTGGG TGCCGGAACA GCGGCGCTGG CTGCTGTCGC CGTGGCCCTA TCTCGGCGGC 
CTGATCGCAT TTGCGATGTT TTCGCCGGTG GTGCTGTGGA ATGCCGATCA CCAGTGGATT 
TCATTCGTCA AGCAGTTCGG CCGCGCCAAG GTCGAAGGCT TCAACCCGGG CTATCTGCTC 
GAACTGGTCC CGACCCAGTT CGTGCTCGCG ACGCCGCTGG TCTACATCCT CGGCCTGATG 
GGGCTGTACG CATTGACGCG CGGCGCCGGC GCGGCCGGCG CGCGCGTGCT GATCAGCGCG 
ATCGTCTGGA CCATCGCGCT GTATTTCGCC TGGCAGGCGA CGCACGATCG GGTCGAGGGC 
AATTGGCTCG GCGCGCTGTA TCCCGCCTTC GCGGTGGCCG GCGCTGTCGC CGCGACCTTC 
GCGCCATGGG GCAAGCGGGC GCGGCGCGTG GTCGATGTCT GCATCCGCTG GGCCGCGCCG 
GTCGGCGTGG TGATGTTCGT GCTGGTCGTG GTCCAGGCCA ACACCGGCGT GCTGACCGGC 
CATCGCCGCG ACGCCAGCGT GCGCGCGGTC GGCGTCGGCT TCCCGCAGAT CGCCGCCGAG 
ATCGCAGCCG TGCGGGAACG GACCGGGGCG ACCTGCGTGC TCGCCAATGA TTACGGCAAT 
ACGGCGTGGC TGGCGTTCTA TCTGCCGAAG GGCACCTGCG TCGCGCAGCG CAACGAGCGC 
TATCGCTGGC TCGCAGTGCC GCCGCCGACC CCGGAGCAGC TCGCGGGCAA GCTGCTGCTG 
GTCGGCGAGA CCAATGCCGC CGCCCATCCG GCGCTGCGGG CGACGTTCAG CCGGATCGAG 
AAGGTCGGCG CGGTCGAGCG CAGGCGGGGG CCGCTGCTGG TCGACACGCT GGAACTGGAC 
ATTCTCGAAG GCGCCAAGCG CGACGTGCTC GACAATTCGC CTCCGGTCTA TTGA

Protein sequence

MTMTARRFVG GTALAVAAMV ALRLVAAAVT PLTFDEAYYW TWSKHLAASY FDHPPMVALV 
IRLGTLIAGD TEFGVRLISV LLALPMSWAT WRSAELLFGG GRLASHATLL LNATMMVSIG 
TVIVTPDAPL LAASAFVLYA LAQVLSSGKG AWWLAVGVAV GAGLLSKYTA LFFGPAILIW 
LLWVPEQRRW LLSPWPYLGG LIAFAMFSPV VLWNADHQWI SFVKQFGRAK VEGFNPGYLL 
ELVPTQFVLA TPLVYILGLM GLYALTRGAG AAGARVLISA IVWTIALYFA WQATHDRVEG 
NWLGALYPAF AVAGAVAATF APWGKRARRV VDVCIRWAAP VGVVMFVLVV VQANTGVLTG 
HRRDASVRAV GVGFPQIAAE IAAVRERTGA TCVLANDYGN TAWLAFYLPK GTCVAQRNER 
YRWLAVPPPT PEQLAGKLLL VGETNAAAHP ALRATFSRIE KVGAVERRRG PLLVDTLELD 
ILEGAKRDVL DNSPPVY