Gene Rcas_0801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0801
Symbol
ID	5538267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1046376
End bp	1047542
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	64%
IMG OID	640892953
Product	glycosyl transferase group 1
Protein accession	YP_001430936
Protein GI	156740807
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATTG TGATGCTTGC TCCGTTCGGC ATCCGTCCCA AGGGCACACT GGCGGCGCGC 
ATGTTACCGC TGGCGCAGGC GCTCACGCGG CGTGGGCACG AGGTTGTGAT CGTTGCGCCG 
CCGGTACACA ACCCGGAGGA CGCCGCAACG TGCGTGGTCT ATGGCGATGT ACCGGTGGTC 
CATACCGCTG TGCCGTCGAT CTCCGGCGCT ACGGCAGTGG CGCAGCAGAC TCTCGCGCTG 
CTACGCGAGA CGCTGCGCCG CTCGCCGGAT GTTGTGCATC TGTTCAAACC AAAGGGGTAT 
AGCGGTCTCG CCGCTTTGCT GCTTCGGGCG ACTCGCCCGG CATTGCCGCT GGTGGTGGAT 
ACTGATGATT GGGAAGGTTT CGGCGGTTGG AACGATCTGC TGCCGTATCC TCCGGCGGCA 
AAGCGTCTGT TTGCCTGGCA GGAGCGCGAT CTGCTGCGCC GGGCAAATGC GGTGACGGTC 
GCCAGTCGCG CGCTCGAAAC CCTGATATGG AGTCTTGGCA TTGATCCTGA TCGCGTCTTT 
TACCTGCCGA ATGGCGTCGA ACGTTTAGCA TCGAACATCC CGTGTCCCAT GTCCCATGTC 
TCACGTGCAA CGTGGAACCT TCTCCTCTAT ACCCGCTTTT GGGAACTCGA TGTGCGCGAG 
GTTGTGGCGG CGCTTACCGG GATTACGTCC CGGCGACCGG ATGCCCGCCT GATCGTAGCC 
GGCAAAGGTG AGCGTGGCGA GGAGCAGATT CTGCTGCGCC TGACGGCACG CGCCGGTCTT 
TCACACGTTG TCGATTATCG GGGATGGTTG TCGCCGGATC AGATCCCGGC GACGCTGGCA 
TCCGCCGATG TTGCGCTCAT GCCTATGCAG GATACGCTGA TCAACCGCAC GCGCGGTCTG 
GCGAAACTGC TCGAGTTGAT GGGCGCCGGT CTGCCGATTG TCGCCAGCCG AGTTGGGCAA 
GCAGCCGAGT ACCTGGAGCA TGGCGTGAGC GGCTGGCTCG TTCCGCCGGG CAATGCTGGG 
GCTTTGGCGG AAGCGGCGCT CCTTCTGCTG AACGATGCCG ATCTCCGGCA ACGCCTGAGT 
GTTGGGGCGC GTCAGGCGGC CTGGCGCTAC GCCTGGGGCG CGCTGGCGCC GGTTGTTGAA 
CAGGCATATG TGAGGGCGCG GGGTTGA

Protein sequence

MRIVMLAPFG IRPKGTLAAR MLPLAQALTR RGHEVVIVAP PVHNPEDAAT CVVYGDVPVV 
HTAVPSISGA TAVAQQTLAL LRETLRRSPD VVHLFKPKGY SGLAALLLRA TRPALPLVVD 
TDDWEGFGGW NDLLPYPPAA KRLFAWQERD LLRRANAVTV ASRALETLIW SLGIDPDRVF 
YLPNGVERLA SNIPCPMSHV SRATWNLLLY TRFWELDVRE VVAALTGITS RRPDARLIVA 
GKGERGEEQI LLRLTARAGL SHVVDYRGWL SPDQIPATLA SADVALMPMQ DTLINRTRGL 
AKLLELMGAG LPIVASRVGQ AAEYLEHGVS GWLVPPGNAG ALAEAALLLL NDADLRQRLS 
VGARQAAWRY AWGALAPVVE QAYVRARG