Gene Rcas_3097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3097
Symbol
ID	5540593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4014024
End bp	4015196
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	62%
IMG OID	640895216
Product	glycosyl transferase group 1
Protein accession	YP_001433169
Protein GI	156743040
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.367624
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCATTG GCGTCGCCAT GATCCTGCAC GATTTCTACC CATCCATCGG CGGGGCGCAA 
ACGCATACGC TGGCGCTCAG TCGGGCGCTG CGTGCGCGCG GCATCGATGC GATAGCGGTG 
ACGCGCCCGT ATCCTGGAAC GCTGGCATAT GAAGAGGTTC AGGGCATTCC GACCTATCGC 
GTTGGGATGC ACGGCGGGCG CGTGCTTGCC GGGGTGAGTT ACCTGGCCGC CGGTCTTGCG 
CTGCTCATAC GTGAACGAAA CCGCTACCAG ATTCTGCACT GCCATCAAAT GATTTCACCG 
ATGACGCTGG CGCTGATGGC GCGCGCGCTG CCCGAAAAAC GACTGGTTAT CAATCCGCAT 
GGGCGCGGTC CGCGTGGTGA TGTGGCAAAA CTGACCAGGT TGCGCCCGCT AACGGGGAAA 
CTGCGCGTTG CAGCGGCGCT GCGCTGGGGT GATGCCTTTG TTGCGATTTC CCGCGATATT 
CACGATGAAT TGTGCGCGAT GGGCGTTCAG GAAGAGCGCA TATGGGATAT TGCCAATGGC 
GTTGATGTGG AACGTTTTGC GCCGGCCTCA CTCGACGAGC GGACGGAACT GCGGCGCCGG 
CTTGGTCTGC CGGACGGAAG ACTGGTCGTC TTCGTTGGGC GGTTGACGGT CGCCAAAGCG 
CTCGATGTGC TGCTGAACGC CTGGGCGCAA CGTGATACGA CACTGGCGGA CGCGCGGCTG 
ATCATTGTGG GGGATGGCGA GTTGCGCAAT GACCTCATGC GTCAGGCGCG CGATCTGGGT 
GTCGAGCAGT CCGTGATGTT CGCCGGCGCA ACCAATGATA CGGCAGCATA TCTGCGCGCA 
TGTGACGCAT TCGTGCTGTC TTCGCGCACA GAAGGGATGC CGGTCGCGCT GCTCGAAGCG 
ATGGCATGTG GTCTGCCGTG CGTCGCCACG TGCGTTGGCG GTTCGATGGA GATCATTGAG 
GATGGGGTGA ACGGGTGCCT GGTGATGCCG GAAGATGCCG GTGCGCTGGC GCGGGCAGTG 
GCGCAAGCGC TTGCAACGCC AGAGTGGGGC GTCCATGCGC GGCGGCATAT TCAGGAGCGA 
TACGCTATCG ATACAGTGGC ACAACGCTAT GTGGCGCTGT ACGAACGCCT CGTGAACGGT 
AGGAGTGCGG GTGCTGTGCG CACTCCTGCG TAA

Protein sequence

MPIGVAMILH DFYPSIGGAQ THTLALSRAL RARGIDAIAV TRPYPGTLAY EEVQGIPTYR 
VGMHGGRVLA GVSYLAAGLA LLIRERNRYQ ILHCHQMISP MTLALMARAL PEKRLVINPH 
GRGPRGDVAK LTRLRPLTGK LRVAAALRWG DAFVAISRDI HDELCAMGVQ EERIWDIANG 
VDVERFAPAS LDERTELRRR LGLPDGRLVV FVGRLTVAKA LDVLLNAWAQ RDTTLADARL 
IIVGDGELRN DLMRQARDLG VEQSVMFAGA TNDTAAYLRA CDAFVLSSRT EGMPVALLEA 
MACGLPCVAT CVGGSMEIIE DGVNGCLVMP EDAGALARAV AQALATPEWG VHARRHIQER 
YAIDTVAQRY VALYERLVNG RSAGAVRTPA