Gene Rcas_3106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3106
Symbol
ID	5540602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4024369
End bp	4025517
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	62%
IMG OID	640895225
Product	glycosyl transferase group 1
Protein accession	YP_001433178
Protein GI	156743049
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.277853
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGACAG ATTTGCCCGG GTACCCGCTG CGTGTCTTGC ACGTTCGTCC GCGTTTGGGA 
ATCGGCGGTG CAACCGAGTA TCTCATCCGG CTGGCGGAGA GCCAGGCGAA CGCGGGGTAT 
CACGTGGTGA TTGCGTCGGG AGGCGGCGAC TGGCTCAGGC GCATTGCAGG GTTTGCGCGC 
TCCTATGATC GGCTGCCGCT GACGCCATAT CTTGGGTCCG GGAAGCGGAC GCCGAATCTT 
CCGGGGTTAC TGGCATCGGG CCTCCAACTG GCGCGCATTA TTCGCGCCGA GCAGATCGAT 
CTGGTCAATA CGCACCATCG CTTTGCGGCG CTGGCGGCCA GGCTGGCGTC GCGGCTGACC 
GGCACGCCGG TCGTGACAAC GTTGCAAGAA GTGCCCTGGC GGAATCGCGG TCTGACACGA 
TTTTCCCTGG GAACGCAGGC TATCACGATG AGTGCAATGA TGAAACGGTT CGTCATCGAC 
GTGTGCGATA TTGCGCCGGA TCGGGTCACG GTGATTCCTA TCGGCATCGA CATCCCGGCG 
CCGCTCTCCA TAGATCGTCG CCGCCAGTTG CTGGCGGAAC TGCGTCTCGA TGGCGCTGCG 
CCGATCATCG TGAGCGTCGG GCGCTTGGTG TCGCGCAAAG GGCATATGTA TCTGATACGG 
GCGTTGCCTG AGGTGATTCG GCGCTATCCC GACGTGCAGG TGGTGCTGGT GGGCGATGGC 
GAGGAGCGCG CAACGCTCGA ACGAGAAGCG CAGGCGTTGG GTGTCGCCGA CAGGGTGACG 
TTTGCCGGTG CGCGGAGCGA TGCGGTCGAT CTGATGGCGC TGGCTGATTT TACCGCGCTT 
CCATCGCTCG AAGAAGAGTT TGGGATTGTC ATTACCGAGT CGTTTTCGTG CGGCAAGCCG 
GTGGTGGCCA CCACAGTCGG CGGCATTCCC GAGCATGTGC GCTCGATGGA AAATGGCATA 
CTCGTGCCGC CGCGCGACAG CCGCGCGCTG GCGGAGGCGA TCATCTTTTT GCTCGACCAT 
CCGAATATGG TGCGTCAGTT TGGCGACTGC GCTCGGCGCA TGGTTGAGCA GCAGTATACC 
CGGCAACGTT TTCTGGAACG CACAGAGGCG GTCTATCGCG CGGCGCAGAT GCGGGAGGTT 
GGGCGATGA

Protein sequence

MVTDLPGYPL RVLHVRPRLG IGGATEYLIR LAESQANAGY HVVIASGGGD WLRRIAGFAR 
SYDRLPLTPY LGSGKRTPNL PGLLASGLQL ARIIRAEQID LVNTHHRFAA LAARLASRLT 
GTPVVTTLQE VPWRNRGLTR FSLGTQAITM SAMMKRFVID VCDIAPDRVT VIPIGIDIPA 
PLSIDRRRQL LAELRLDGAA PIIVSVGRLV SRKGHMYLIR ALPEVIRRYP DVQVVLVGDG 
EERATLEREA QALGVADRVT FAGARSDAVD LMALADFTAL PSLEEEFGIV ITESFSCGKP 
VVATTVGGIP EHVRSMENGI LVPPRDSRAL AEAIIFLLDH PNMVRQFGDC ARRMVEQQYT 
RQRFLERTEA VYRAAQMREV GR