Gene Rcas_0458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0458
Symbol
ID	5537921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	583327
End bp	584670
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	60%
IMG OID	640892621
Product	glycosyl transferase group 1
Protein accession	YP_001430607
Protein GI	156740478
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATTG TTCTGCCGGT TCATCATTTT TTGCCGCGCT ACACCGCCGG CGCTGAGTTG 
TACACCTATC GCCTGGCGCG CTGGTTGCGC CACCATGGGC ATGATGTGGA AGTCGTCGCT 
GTGGAGTCGG TCGATCATGA GAAACCGGGC GTCTTCGATG TAACGTCAGA CACGTTCGAT 
GGCATTCCGG TGTATCGGTT GCATTTCAAT CGGTATGCGC AGGAGCGACA TTGGGAATAC 
GATAATCCGC TCATCGGCGA ATGGTTTGCG CGTTACCTCG AACAGGAGCG CCCCGATTTG 
GTTCACTTTC AGGCTGGCTA TCTGATGGGT ATCGCGCCGC TGCGAGCCGC CGTTGCCGCC 
GGTCTGCCGA CTGTGCTGAC CCTGCACGAT TACTGGTTTA TCTGCCCGCG ATGGACCCTG 
CTGCGCGGCG ATGGCGCGCT GTGCCGTGCC GTTCCCGATG ATCCTGCCGA ATGTGCCTGG 
TGTCTGCGCC TCGACAGGCG CCGCTTCCGC CTGCCGGAGC GGGTGACAGG CGGCAGGTTC 
GGGGAGATCA TGCGTCGCGC TGGCTATGAT CCGGGACGCG AGTCTATTGC GTTGCGTCGT 
AAGGCGTTGC TCTCCTCGCT GGCGCTACCG GACGCCGTCG TCGCTCCTTC CCGTTTTCTG 
GCGCAACAGG TGCGCGCTTA CGTGCAACCA GAACGTCTGC ACGTCTCGCG TCTTGGTCTG 
GACCTGACAC TCTTCTCAGA CGTGCAGCGC GATAAAGAAC ATCGGACTCT CCGGATCGGA 
TTCATTGGAC AGATCGCGCC ACACAAGGGG GTCCACCTGC TCATTGCCGC GTTTCAGAAG 
GTGCAGGCGC GCTTCGGCCG CATCGAGTTG CACCTCTACG GCGGATTGAC CGCGAATCCG 
GGGTATGTTG CCCGGCTGCG CCGTATGGCA GCAAAGGACC CGCGCATTCA TTTCCACGGC 
AGAATCGAAA ACACGAGCGT TCCTGCGACG CTGGCGAGTC TCGATGCAAT CGTGGTTCCA 
TCAATATGGT ACGAGAACTC GCCATTGGCG ATTATGGAGG CGCACGCTGC GGGAACGCCG 
GTGGTAACTG CCGACATCGG CGGTATGGCT GAACTGGTGC GCGATGGCGT CGATGGTCTG 
CACTTCCGCT TCAACGACGC TACCGACCTG GCGCATGTTT TGCAGCGATT GGTTGATGAG 
CCTGATCTGT TGTCCCGCTT GCGATCCGGT ATTCAGCAAC CGCGTAGCAT CGATGAGGAG 
ATGGTTCAGG TTCTCGCTAT CTACGATGAT GCCATCGCTC GCCGTAGCGC TCCGGTCGTG 
TGTAGCAGTG AGCAGAACGA TTGA

Protein sequence

MKIVLPVHHF LPRYTAGAEL YTYRLARWLR HHGHDVEVVA VESVDHEKPG VFDVTSDTFD 
GIPVYRLHFN RYAQERHWEY DNPLIGEWFA RYLEQERPDL VHFQAGYLMG IAPLRAAVAA 
GLPTVLTLHD YWFICPRWTL LRGDGALCRA VPDDPAECAW CLRLDRRRFR LPERVTGGRF 
GEIMRRAGYD PGRESIALRR KALLSSLALP DAVVAPSRFL AQQVRAYVQP ERLHVSRLGL 
DLTLFSDVQR DKEHRTLRIG FIGQIAPHKG VHLLIAAFQK VQARFGRIEL HLYGGLTANP 
GYVARLRRMA AKDPRIHFHG RIENTSVPAT LASLDAIVVP SIWYENSPLA IMEAHAAGTP 
VVTADIGGMA ELVRDGVDGL HFRFNDATDL AHVLQRLVDE PDLLSRLRSG IQQPRSIDEE 
MVQVLAIYDD AIARRSAPVV CSSEQND