Gene Rpal_3768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3768
Symbol
ID	6411446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4047213
End bp	4048313
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	62%
IMG OID	642713649
Product	glycosyl transferase group 1
Protein accession	YP_001992742
Protein GI	192292137
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACCCAT TGCGCTTTCG TCGACTGACG ATCAACGGGA AGTTCCTGAC AGCGCGACCT 
ACCGGCGTGC ACAGGGTCGC CGATCAACTT ATTCGCCAGA TCGTTTTGAA CCAGGGCCTC 
CTGGACGGCG TATTTGCGAC TTCGCCTGCG ATCGTTGCCC CAAGGTCCGC ACCGGACGGG 
ACGCAAGGCG TTCACGTCGA GCGCTATGGC CGCCTGCGCG GGCAGTTGTG GGAGCAGATG 
GACCTGCCCC GCGCCGCGCG CTCCGATCTG CTGCTCAACC TGTGCAATCT TGGACCTGTG 
GCACTCGGCA GCGCGATCAC GATGATCCAT GATGCTCAAG TCTTCATCAC GCCGCAGTCC 
TATTCGTTCG CTTTTCGCAC GTGGTATAAG ACCATTCTGC CGCTGATCGG GCAGAGACAT 
CGCCGTATTC TGACGGTGTC CCATTTCTCC GCCGAGCAAC TGACGCGGGC CGGCGTCGCC 
GATGCCGAGC GCATCTCAGT GATTCATAAC GGCGTCGATC ACGTCCTTGC GTATCCACGA 
GCGCCCGAGA TCATCGAGCG TCTTTCGCTT GCGCGGCGGC GCTTTGTTGT CGCGCTTTCT 
TCCACTCAGG CGCACAAAAA TATCAAGGTC CTGCTGGATG CCTTCTCCAG TCCGGAGCTT 
GGCGACACCA AACTCGTCCT GTTTGGCGGA CATGATCGCG GCGACTTTGA ACGCCTGTCC 
TCCAACGTGC CGGCCAATGT CGTGTTTGCA GGGCCGGTGA CCGACGGGGA GTTGCGGTCC 
CTGTTTGAAG CGGCGCTGTG CGTGGCATTT CCATCCACCA CGGAGGGGTT CGGCCTTCCC 
CCGTTGGAAG GAATGGCTTT GGGGTGTCCG GCCATCGTCG CGCCATGCGG TGCACTTCCC 
GAGGTCGCCG GGCAAGGTGC GCTCTACGCG GCGGCAGACA ACCCCAGGGA GTGGATCGAA 
GCGATCAGGT CCCTCGCGGC CTCGCCGCCA TTCTGGCTGG AGCGCTCCGC CGTGGGGGTA 
GCGCAGGCAG CCAATTTCAC TTGGCGGAAA GCCGGTACGG ATCTCTGCAA TGTCATTCGA 
CTCGTCGCCG AAGACCGATA G

Protein sequence

MNPLRFRRLT INGKFLTARP TGVHRVADQL IRQIVLNQGL LDGVFATSPA IVAPRSAPDG 
TQGVHVERYG RLRGQLWEQM DLPRAARSDL LLNLCNLGPV ALGSAITMIH DAQVFITPQS 
YSFAFRTWYK TILPLIGQRH RRILTVSHFS AEQLTRAGVA DAERISVIHN GVDHVLAYPR 
APEIIERLSL ARRRFVVALS STQAHKNIKV LLDAFSSPEL GDTKLVLFGG HDRGDFERLS 
SNVPANVVFA GPVTDGELRS LFEAALCVAF PSTTEGFGLP PLEGMALGCP AIVAPCGALP 
EVAGQGALYA AADNPREWIE AIRSLAASPP FWLERSAVGV AQAANFTWRK AGTDLCNVIR 
LVAEDR