Gene Rcas_2341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2341
Symbol
ID	5539822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	3019879
End bp	3020916
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	63%
IMG OID	640894474
Product	glycosyl transferase group 1
Protein accession	YP_001432442
Protein GI	156742313
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.220594
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCGTC CACTCTACAT TTCGCCGGTT GGTCGCGGCG GCGTCGATTT TGGCATTCAG 
AACATCACTC GCGCAGTGCG ACGCTACGGC GCGCCGCGTG CCGAATTGCT GCGCCTGCCG 
GAGATCTACA ATTTTCTGCC TATACTGATC CCGCGCGGGT TGCCGCGTGG TTGGTGGCGG 
GGATTCGACC TCATTCAGGG GCGTTCGCGC GTGGCATTTG CGCTGCGCGC GCCGGGACGC 
CCCCTTGTCA CAACCGTTCA CCACCTGACG ACCGATCCTG ACCTTCAGCC CTACAGCACA 
CCGGCGCAGC GGTTGTTCTA TCGCCTGATC GAAGCGCGCT ACGACTGGTG GTCGATCAGT 
TCCGCCGATG CGGTGGTGTG CGTCTCGCGC TACACGCAAC AACAGGTCGC CCGCGCCTAC 
GGATACACCA ACACCACCGT CATCTACGAT GGGATCGACA CTGATGTGTT TGTGCCGCCT 
CCCGACATGC AACGGCGCAA CGATGGATTG CCCGACTGCG ACGGACGCAT TCGCCTGCTC 
TTCGTCGGCA ATCGGACGCG ACGCAAGGGG TTCGACCTGC TGCCGCGCAT CATGAACCTG 
CTGCCGGAAG CGTATGTTTT GTATTACACG AGCGGCTTCC AGGACGTTGA TGAAGGTCCA 
CCGCACCCGC GCATGGTTCC GATTGGCGCG CCGGACCGCG ATGGATTGGT GGCGGCGTAT 
CAGTCGTGCG ACATCCTGCT GGCGCCGTCG CGCCTGGAGG GGTTCGGGAT CGTGCAGGCG 
GAGGCGCTGG CGTGCGGACG ACCGGTCGTG ACCACGCGCA TTTCCGCGTT GCCGGAAGTC 
GTCGATCATG AACGGTCCGG TTTTCTCTGC CCGCGCGATG ACGTCGCCGC TTACGCAGAG 
GCGGTGCAGC GGCTCGGCGA AGATGAAGCG CTGCGACGGC GCTTTGGCGA ATACGGGCGC 
GAGAAAGTGG CGCGTTCATT TGGATTCGAG CAACTGGGGC GTGGATTTCT GGACCTCTAC 
GAGCGTCTGG TGCGATGA

Protein sequence

MVRPLYISPV GRGGVDFGIQ NITRAVRRYG APRAELLRLP EIYNFLPILI PRGLPRGWWR 
GFDLIQGRSR VAFALRAPGR PLVTTVHHLT TDPDLQPYST PAQRLFYRLI EARYDWWSIS 
SADAVVCVSR YTQQQVARAY GYTNTTVIYD GIDTDVFVPP PDMQRRNDGL PDCDGRIRLL 
FVGNRTRRKG FDLLPRIMNL LPEAYVLYYT SGFQDVDEGP PHPRMVPIGA PDRDGLVAAY 
QSCDILLAPS RLEGFGIVQA EALACGRPVV TTRISALPEV VDHERSGFLC PRDDVAAYAE 
AVQRLGEDEA LRRRFGEYGR EKVARSFGFE QLGRGFLDLY ERLVR