Gene Rpal_3765 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3765
Symbol
ID	6411443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4042276
End bp	4043397
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	60%
IMG OID	642713646
Product	glycosyl transferase group 1
Protein accession	YP_001992739
Protein GI	192292134
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGGTC AAGCAGGACT CGTCGATTGC GACTTCACGC TCGCGCTCAA CAACAGGACC 
GGCAAGTTCT TCTTCTGCGG CGATCTGATC GCCGGCTCGA AGGATCTGAT CCGCGACGTC 
TATTACTGGA GGCTTGGATT CGACCAGATT CCCACCGGTC TGATTGCCCG AATCCTGGGC 
CGACTGGCCG TCGTAGAAAT CGATCTCCGG GTTCGGCATC CCAGGACACT CCCGACCTTC 
TTGTCGCGCC GGGACAGGCT ACCAATCGTC TTTACCGATC CAAGAGAAGT CCTGATCCAC 
GACCTGCGCG AAACCGATAT CATCCTTTGC CATGACGTCG GCCCGCTGAC CCACCCGACC 
TTTTACGCCG ATGGCGTCGA GCAGATCTAC CGCGCGGCGT TCGATCGCAT TGCGGAGGCC 
AAGCCGCATC TTCTGTTCGC CAGTGAAAGC TCCTGCGAGG AGTTCAAGCT GCTCTATGGC 
GACGATTTCC CGTACTTGGG CGTTCTTTAC CCCCCGATCA GATTCGGCGC GGGCTCCTCA 
GACCAGCAAC CGGTGACGTC TATCCCGGGC AAGTTCTTTC TGTCCGTCGG TAGCCTGGGA 
ACGCGCAAGA ACCAGTTGCG GGCGATCGAG GCCTTCGGAC GAAGCGGCCT CGTCGAGAAG 
GGATATCGAT ATGTGATTTG CGGCGGGCCG GAGCCTGGCG CCGAACACGT CATCGCCGCT 
GCAGACCAGA CCCCCGGCGT CCTTATTCCG GGTTACGTCA ACGATCCGCA GCTTCGCTGG 
CTGTACTCCC ACGCAGAAGG ATTCATTCTT CCGAGTTTGC TTGAAGGCTT CGGCTTGCCG 
GCGGCCGAGG CGATTCACTA TGGGGTGATG CCATTGCTGA GCCGAGGCGG CGCTCTCGAA 
GAGGTCGCAG GCCCATCGGC CATTCTTGTC GACCCGCTGG ATGTCGATGC GATCGTCCAA 
GGAATGCATC AGATTGCAGT CATGAGCGAG GGGGAGAAGG CGCAACGCTT GGATCAGATG 
CGAACGAGTA TTGCGAGATT TTCGACGGAA AACGCCTTAG GGGTCTGGCG ATCAGTTCTG 
TCCCGCGCCG CTTCGCTTCA CCAGCATGTG GGCGCTAGCT GA

Protein sequence

MSGQAGLVDC DFTLALNNRT GKFFFCGDLI AGSKDLIRDV YYWRLGFDQI PTGLIARILG 
RLAVVEIDLR VRHPRTLPTF LSRRDRLPIV FTDPREVLIH DLRETDIILC HDVGPLTHPT 
FYADGVEQIY RAAFDRIAEA KPHLLFASES SCEEFKLLYG DDFPYLGVLY PPIRFGAGSS 
DQQPVTSIPG KFFLSVGSLG TRKNQLRAIE AFGRSGLVEK GYRYVICGGP EPGAEHVIAA 
ADQTPGVLIP GYVNDPQLRW LYSHAEGFIL PSLLEGFGLP AAEAIHYGVM PLLSRGGALE 
EVAGPSAILV DPLDVDAIVQ GMHQIAVMSE GEKAQRLDQM RTSIARFSTE NALGVWRSVL 
SRAASLHQHV GAS