Gene Rcas_1839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1839
Symbol
ID	5539317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2348592
End bp	2349680
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	63%
IMG OID	640893977
Product	glycosyl transferase group 1
Protein accession	YP_001431948
Protein GI	156741819
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCATATTC TGCACATCTA CAAAGACTAC CCGCCGGTTT TCGGCGGCAT CGAGAGGTAT 
GTGCGCGACC TCGCAGAAGG TCTGGTTGCG CGCGGTCATC GGGTGACGGT GCTGATCACC 
AATACCAGAC GCTGCACCTC TATCGAACGA CCATTGCCCG GATTGATGAT TGTGCGCGCG 
GCGCGGATGG CGCATCTGGC ATCGACGCCG CTCAGCCCGG CAATGATCGC GCTGGCGCGT 
GGGATTCACG CCGACGTGGT TCATTTGCAG TTTCCCTACC CGCCTGGCGA CCTGGCGGCA 
ATGGCAGCGC CCGGGTCGCC GCCGCTCGTC ATTTCGTACC ACAGCGACAT CGTGCGCCAG 
AAAACGCTTT TGCGCCTCTA CCGACCGCTG CTAGCGCTGA CATTGCGCCG CGCAGCGCGG 
ATCATCGCAT CCAGTCCCGG ATATATCACC TCGTCGCCGT TTCTTCGCGC ACACGCCGCA 
AAGTGTGAGG TCGTGCCGAT CGGCATCGAT GTGACGCGCT TCTCTCCAGG CGACCGACGC 
GCCAATGCCG TGCCGCGCCT GCTCTTCGTC GGACGGCTGC GCTACTACAA AGGGCTGCAC 
ATTCTGATCG AGGCGCTGCG CATGGTCGAG GGAGTCGAAC TCTGGATCGC CGGGAATGGA 
CCGGAGAGGG CGCGACTGGA GCGACAGGTG GCCGGCGCTG GATTGAATCA GCGGGTGCGC 
TTCCTCGGCG ACGTGGCAGA TGAGGACCTG CCTGCGATCT ACCGGCATGC GGATATTTTT 
GTGCTGCCAT CACACCTGCG CGCTGAAGCA TTCGGCATTG TGCTGGTCGA GGCGCTGGCA 
AGCGGGTTGC CGTGCATCAG TACCGCGCTC GGAACCGGAA CCGATTTTGT CAATATGCAC 
GAAGAGACCG GTCTGGTCGT GCCGCCAGGA GACGCCGCAG CGCTGGCGGA TGCTATCCGT 
CGCCTGCGGG ACGACCCGGC GCTGCGGGCG AAGTATGGCG AAGCGGGCGT TCATCGCGCG 
CGGGCGCTCT TCTCACGCGA ACGGATGCTG GACGCCGTAG AGCGAGTCTA TTATTGGGCG 
TTGCCATAA

Protein sequence

MHILHIYKDY PPVFGGIERY VRDLAEGLVA RGHRVTVLIT NTRRCTSIER PLPGLMIVRA 
ARMAHLASTP LSPAMIALAR GIHADVVHLQ FPYPPGDLAA MAAPGSPPLV ISYHSDIVRQ 
KTLLRLYRPL LALTLRRAAR IIASSPGYIT SSPFLRAHAA KCEVVPIGID VTRFSPGDRR 
ANAVPRLLFV GRLRYYKGLH ILIEALRMVE GVELWIAGNG PERARLERQV AGAGLNQRVR 
FLGDVADEDL PAIYRHADIF VLPSHLRAEA FGIVLVEALA SGLPCISTAL GTGTDFVNMH 
EETGLVVPPG DAAALADAIR RLRDDPALRA KYGEAGVHRA RALFSRERML DAVERVYYWA 
LP