Gene RPD_1664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1664
Symbol
ID	4022144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1873798
End bp	1875309
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	67%
IMG OID	637961859
Product	hypothetical protein
Protein accession	YP_568802
Protein GI	91976143
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.197745
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGCGG CTGACCTGAT GGATCGAACC TTGTCCCGGT CGGGATTTTC CATCGGTCTG 
ATGGCGCTCG TCGTCGCCGT GCTGGTGTTG CCGGTCGGGC TGGCCGCGCT GGTGTTCCCG 
ACACCGCTTT ACGATACCCG CGAACTGGTC GCATGGGGAC GGCACTTCCC GCTGCTGACG 
CCGGTGCATC CGCCGGTGAT GGTGTGGGTC GGCGGCGCGG TGGATTGGCT GTTCGGGCCT 
TCCGGCACCG CGATCGTGTT CGTCAACCAG ATCTGCCTCG CGGTCGGCCT CGGCTATCTC 
TACGCTACGC TGCGCCTGCT GGTCGACCGC GCGATGGCGG CCTACATTCT GGCGCTGGCC 
GCGACGTCGT TCTACGTCGT GTTCGGGCCG CTGTCCTGGG CGCTCAACGC CGACATCCTG 
CAGCTCACCT CCTGGCCCGC GGTGCTGTAT CACTTCCTGC GCGGGCGCAG CACGGATCGC 
TGGCTGCACT GGATCCTGCT CGGGGTGTGG ACGGCGATCG CGGCGCTGAC CAAGTACAAT 
GCCGCCGTGC TGTTCATCGG GATGGCGGCC GGCGTGCTCG TCTTGCCGGC GTTCCGCGCC 
TGTCTGCGTC GGCCGGGCCT CTATGTCGCG GCGCTGGTCG GCGCGCTGCT GTTCCTGCCG 
CACGTCATTG CGGCGCTGCG CTATGGCACC ACCATCGCGT ATGGCGAACG GCACTTCACC 
GGTTTCGGAT CGATCGAAGA TACCGCGCGG CGGCTCGGCC TGCTCGTCGC CGGCTATCTG 
CCGCTGCTGC TGCCCGGCGC CATCGTCCTG GCGATCGCGG TGGCGCGGCG GATGGTGGTG 
TGGCGCGTGC CGCGCCTTGC ACAGATCAGC GACGATCTGA AATTCGTCGT GATCGTCAAC 
GTCACGATGT TCGTCGTGCT GCTGGTGCTG ATCGCCGTGT TCGGGCTGGA ATACATCGCC 
CGCTACGGCG CACCGTTCGC CGAACTCGCG GTGCTGGCGT TGGCGCCGCT GTTCACCTGG 
AACGAGGCGC GGCGCGACCT TGCGGTGCGC CAGACGGTGC AATCGCTCGG CGCGCTCTAC 
GCCGTGCTCG CGGTCGGCGT GTCGGTCATC TATCTGTTCT TCGCCTCGCA CAGCGGGCTG 
CAGGAGCCGA CCGCGCAGGC CGCCCGCATC ATGCTCGCGG ACTGGAACAG CAAGTACACC 
TGCGGCCCGG GCTATTTCCT GGGCGATCGC CAGACGGTCT ACGGAATCGG CATCGCGGCC 
GGCCCCGATG GCGACTCGAT GACGATCAAT TTCATTCCGA AGGCGCGCTG GTTCGATGCC 
ACGAAGCTCG AAGCTAACGG CGCCGTGCTG GTCTATACGC TGCCGCAGGT CCCCGCCGAT 
TTCGCGGCAG CGTTCCCCGA TCTGAAAATG TCGGATGAAA AGCGCATCAG CGTGCCGGTG 
CTGCGGACCC ACACCGGCAA GACCAAGGAA TACTTCTACC GCCTGGTCGC GCCGAAGGCG 
TGCGGGGGCT GA

Protein sequence

MSAADLMDRT LSRSGFSIGL MALVVAVLVL PVGLAALVFP TPLYDTRELV AWGRHFPLLT 
PVHPPVMVWV GGAVDWLFGP SGTAIVFVNQ ICLAVGLGYL YATLRLLVDR AMAAYILALA 
ATSFYVVFGP LSWALNADIL QLTSWPAVLY HFLRGRSTDR WLHWILLGVW TAIAALTKYN 
AAVLFIGMAA GVLVLPAFRA CLRRPGLYVA ALVGALLFLP HVIAALRYGT TIAYGERHFT 
GFGSIEDTAR RLGLLVAGYL PLLLPGAIVL AIAVARRMVV WRVPRLAQIS DDLKFVVIVN 
VTMFVVLLVL IAVFGLEYIA RYGAPFAELA VLALAPLFTW NEARRDLAVR QTVQSLGALY 
AVLAVGVSVI YLFFASHSGL QEPTAQAARI MLADWNSKYT CGPGYFLGDR QTVYGIGIAA 
GPDGDSMTIN FIPKARWFDA TKLEANGAVL VYTLPQVPAD FAAAFPDLKM SDEKRISVPV 
LRTHTGKTKE YFYRLVAPKA CGG