Gene RPB_1601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1601
Symbol
ID	3910072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1804001
End bp	1805077
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	69%
IMG OID	637883497
Product	lipopolysaccharide heptosyltransferase II
Protein accession	YP_485222
Protein GI	86748726
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02195] lipopolysaccharide heptosyltransferase II

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTACG ATTCACTCAA AATGAGCCTG GCCGTAGCGG CTGACCGCGC GGAAACCAGC 
CCGGTGCTGC TGATCCCTTA TATGTGGATC GGCGATTTCG TGCGCTGCCA TACGGTCGTG 
CGGGTCCTGA AAGACCGCTG GCCGGACCGG CCGGTGGATG TCCTGACCAC GACGCTTTGC 
GCACCTTTGG TGGATTACAT GCCCGGCGTG CGCCGGGGCG TCGTCTGGGA CCTGCCGCGC 
AAGCGATTGG CGCTCGACCA GCAGCGGGCG CTGGCGGCGA AGCTCCGCGA GCAGCACTAC 
GGCGCCTCGC TGGTGATGCC GCGGACGTTC AAATCCACGA TTGCGCCGTT TCTCGCCGGT 
ATCCCGAACC GCACCGGCTT CATCGGCGAG GTCCGGTTCG GCCTGCTCAA CGACTGGCGG 
CGCGGCGAGA AGGCGCTGCC GCGGATGATC GACCGTTGTG CCGCACTGGC GCTGCCGGCC 
GGCATCGACC TGCCGATGGA TTGGCCGGAG CCGCAACTCG TTGTGCCGCC AGCCGAGATC 
GCCGCCTGGC GGCGGGCCAA CGGGCTGGAG GGCCGGACTG CCGTGGCGCT GGCGCCAGGC 
GCGGTCGGCC CGTCGAAGCG CTGGACCTAT TATGCCGAGG CGGCCAAAGC GCTGACCGAC 
CGCGGTCTGG ACGTCTGGGT GATCGGCGGC CCCGGCGAGA GCGAGAAGGC CGCCGAAATC 
GTCGCCGCGG CCGGTCCACG CGCGCGAGAC CTCACCGGCA CGGACCTGCG CAACGGCATC 
ATGGCGCTGG CGGCGGCCGA TCTGGTGATC TCCAACGATT CCGGCCTGCT CCACGTCGCA 
GCAGCGATCG GCAGCCGCAC CATCGGCATC TTCGGCCCGA CCAGCGCCTG GCATTATGCG 
CCGCTCAACC CGATCGAGGC GGTGATCGAG ACCAGGACCG ACGTGCCCTG CCGCCCCTGC 
CACAAACCGG TGTGCCGGAT GGTACATCAC AAATGCATGC GCGACATTCC GGTCGAGGAT 
GTGATGGCGG CGGCGCAGCA AGCGCTGGGC AAGGCCGGCC TCGCCCCGGC GCGATAG

Protein sequence

MNYDSLKMSL AVAADRAETS PVLLIPYMWI GDFVRCHTVV RVLKDRWPDR PVDVLTTTLC 
APLVDYMPGV RRGVVWDLPR KRLALDQQRA LAAKLREQHY GASLVMPRTF KSTIAPFLAG 
IPNRTGFIGE VRFGLLNDWR RGEKALPRMI DRCAALALPA GIDLPMDWPE PQLVVPPAEI 
AAWRRANGLE GRTAVALAPG AVGPSKRWTY YAEAAKALTD RGLDVWVIGG PGESEKAAEI 
VAAAGPRARD LTGTDLRNGI MALAAADLVI SNDSGLLHVA AAIGSRTIGI FGPTSAWHYA 
PLNPIEAVIE TRTDVPCRPC HKPVCRMVHH KCMRDIPVED VMAAAQQALG KAGLAPAR