Gene Rcas_3100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3100
Symbol
ID	5540596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4017335
End bp	4018312
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	58%
IMG OID	640895219
Product	glycosyl transferase family protein
Protein accession	YP_001433172
Protein GI	156743043
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0346657
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAAC CGCGGGTCAG TGTTGTCATT ACGGCATACA ATGCCGCCGA ATACCTCAGT 
GCTGCAATCG AGAGCGTGCT GGCACAATCG CATCCCGCAG ACGACGTCGT TGTGGTTGAT 
GATGGGTCAA CCGACGCGAG TGCGGCGGTT GCGCAATCCT ATGCGCATCG TGGCGTTCGC 
CTGATCCGGC AGGATAATCA GGGTCCCGGC GCTGCGCGCA ATCGCGGGAT ACGCGAGACG 
AGCGGTGAGT TGGTGGCTTT TCTCGATGGC GATGATCTCT GGTTGCCGAA CAAACTTGAG 
CGCCAGTTGG CGTATCTGGT AGCGCATCCC GAAACGGTCA TGGTCAGTTG CCTGCGTTGG 
CGCTGGGATC AGACGACCGG CGAGCGACAC ATTGAGTATT TTGGCGTGCC GCCAGGACGC 
ATCCTGGCAC ATGAGAATGT GGTGCGCAAT GTTATTGGCA ACCCATCGAT GACGCTTATC 
CGGCGTTCTG TGTTCGATGC GGTCGGGATG TTCGATACGC AACTGCGCTG GGGGCAGGAT 
TGGGATTTGT TTATTCGCAT TGCATCCTAC GGTCCCGTCG GTTTTGTGGA GGAGCCGCTC 
ATGATCTATC GCTGGCATCC TGGCGGCATC TCGCACCATC GGGGCATCGA ACGGTTGGAT 
ATGTTTCAGT CTATCGCATG TCGGGGTATT GCCCGTATTC AACCGGCGTG GCGTCGTCCG 
CTTTTGCTCG CGCGACGGTT GAGTTGGGAT CAGTGTGATC GCGCGGCATA TGCATCGCAG 
GTCGGGTTGT CACGGGCGCG TCGCGTATGG CACGCGGCGC TTGGATTGGC ATTATTCCCG 
TTTGAACGTC CGGTGAGCAA AACAAAGCGG CTGCTGCGCT CAATCTTTGG TGATGACTCC 
TACGCCGCTG TTGGGCGCAG GCTACGGTCG GTCGTGTACC GTCCCATCGG TGAACGGGAA 
GGTCTTGAAC GGTTTTGA

Protein sequence

MTEPRVSVVI TAYNAAEYLS AAIESVLAQS HPADDVVVVD DGSTDASAAV AQSYAHRGVR 
LIRQDNQGPG AARNRGIRET SGELVAFLDG DDLWLPNKLE RQLAYLVAHP ETVMVSCLRW 
RWDQTTGERH IEYFGVPPGR ILAHENVVRN VIGNPSMTLI RRSVFDAVGM FDTQLRWGQD 
WDLFIRIASY GPVGFVEEPL MIYRWHPGGI SHHRGIERLD MFQSIACRGI ARIQPAWRRP 
LLLARRLSWD QCDRAAYASQ VGLSRARRVW HAALGLALFP FERPVSKTKR LLRSIFGDDS 
YAAVGRRLRS VVYRPIGERE GLERF