Gene Rcas_0800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0800
Symbol
ID	5538266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1045034
End bp	1046134
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	61%
IMG OID	640892952
Product	glycosyl transferase family protein
Protein accession	YP_001430935
Protein GI	156740806
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.985817
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTAAGC ACGATTTCCA TGGTGGATCG GCAACAAACC GGCGCGATGC GTCTGCATCG 
CCGGCTTCCG CAATCCCTAC CGACGACCCG CACGCGGCGC TGGCGTTCTG CCGCCGTCTG 
GCAGGGTTGA TCGCCGATCA CTCCGTCAAT GGCGCTGCAA AAACGCCACA ACCGCAGCCA 
CACCTCTCGG TCGTGATGCC GGTCTTCAAT GAGCGCGAGA ACCTGCCGGC GCTCTATGAG 
CGTCTGACCC GCGTGCTGAA CGCCGAAGGG CAGCAATATG AACTGGTGTT CGTGGACGAC 
GGGAGCCGGG ATGGCAGTCG GGATGTGTTG CTGACCCTTG CTGCACGCGA TCCGCGCGTC 
GTCGTCGTCG AGCTGGCGCG CAACTTCGGG CATCAGATTG CGATCAGCGC CGGGCTGGAT 
CACGCACGCG GCGATGGCGT CATTGTGATG GACTCGGATT TGCAGGACCC GCCGGAGGTG 
CTGCCGCAGT TTATCGCTCG CTGGCGCGAG GGGTACGATG TCGTGTACGC AGTGCGCGCG 
AGGCGGAAAG AGAACCTCTT GCTGCGCGTG GCATATGCGT TCTTCTACCG GATGTTGCGG 
CGGATCGCCA ATATCGACAT TCCGCTCGAC GCTGGCGATT TCTGCCTGAT GGATCGGCGC 
GTTGTCGATA TATTGACGGC AATGCCGGAA CGAAACCGGT TCGTGCGCGG CATTCGCAGT 
TGGGTTGGGA TGCGGCAGAT CGGGTTGCCC TACGACCGAC AAGGACGGCA CGCCGGGAAG 
CCGAAATACA CACTGAGTCG GTTAACCTAT CTGGCGCTCG ATGGGATTGT GTCGTTCAGT 
TTCGTTCCAC TGCGGATTAT CACGATGCTC GGCTTTCTCG TCTCGACGAT CTCGATAGCG 
CTGGCAATCG TGTACGCCGT GCAGCGCATC GCGTTCGGGC TGACCCCGCC TGGATTCCCG 
ACCCTGATCG TGGCGATTTT CTTCCTGTCC GGCATTCAGC TGATTACCAT CGGCGTCATC 
GGTGAGTATG TGGGGCGCAT TTTCGAGGAG GTCAAACAGC GTCCGTTGTA TGTGGTGCGG 
CGGGTGGTTG GCGGGGAGTA G

Protein sequence

MGKHDFHGGS ATNRRDASAS PASAIPTDDP HAALAFCRRL AGLIADHSVN GAAKTPQPQP 
HLSVVMPVFN ERENLPALYE RLTRVLNAEG QQYELVFVDD GSRDGSRDVL LTLAARDPRV 
VVVELARNFG HQIAISAGLD HARGDGVIVM DSDLQDPPEV LPQFIARWRE GYDVVYAVRA 
RRKENLLLRV AYAFFYRMLR RIANIDIPLD AGDFCLMDRR VVDILTAMPE RNRFVRGIRS 
WVGMRQIGLP YDRQGRHAGK PKYTLSRLTY LALDGIVSFS FVPLRIITML GFLVSTISIA 
LAIVYAVQRI AFGLTPPGFP TLIVAIFFLS GIQLITIGVI GEYVGRIFEE VKQRPLYVVR 
RVVGGE