Gene RoseRS_4087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4087
Symbol
ID	5211070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	5124238
End bp	5125248
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	56%
IMG OID	640597675
Product	glycosyl transferase family protein
Protein accession	YP_001278381
Protein GI	148658176
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.445004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.177761
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCGCG TCAGTATTGT TATTCCATGC TACAACCTTG GCGAGTATCT GCAGGAAGCG 
CTCGATAGCG CACTGCAACA AACGCATGCC GATCTTGAGG TGATTCTGGT TGACGATGGT 
TCAACCGATC CCGCAACCAT ACGAACCATC GATCAACTTG CACCTCACCC GCAGCTGCGT 
GTTTTTCGCA CGCCTAATCA GGGAGTGGCG CGCGCCCGGA ACTATGGCAT TTCCCTGGCG 
ACAGGGGCGT ATGTCCTGCC GCTTGACGCC GATGATCGTA TTCTGCCGGA GTATGTTGCG 
CGTGCGGCTG CAATTCTCGA CGCCAATCCC GGAGTTGCGT TCGTCGGGTG TCACTATCGA 
ACGTTTGGCT TGCGTCAGTC CGAGTATCGG CCAGCAGCGT ATCGCTTACC GGACATGCTG 
GTTGAGAATG TCGCGCCGGT GACATCCCTG TTTCGTCGTT GCGTATGGGA AGAGGTGGGC 
GGCTACTGCC CGGAGTTGAA TAGTATTGAA GATTGGGACT TATGGATCGG TATGTTGGAG 
CGAGGGTATC GGGGTGAAGT CGTGCCCGAT ATTCTCTTCG AGTATCGTGT GCGCTCGAAC 
TCTAATCTTT CGCAGATTCG TCAACCAGAG TTATACCAGA AGCGTCTCCA GTTGCTCTAC 
GCACGCCACG CCGGGTTGTA TGAACAGTAT CGCGCAGAGG TGCTGGCGTT GAAGGATCTG 
CTCTTTGCCC ATCAACTTGC CTATACCCAC TGGCTCGAAG AGCAACGCTG CGCCTGGGAG 
CAGGTGGCAC AGGAGCGGTT GGAAATGATC ACGCGATACG ACCGGAATTG GGCCGTCCGG 
GAGCAGCGTC GCCAATGGTG GAGATATCAG ATCGGGCGCG TGCAGCGAGT CCTGGCGCAA 
CATCCCGATC CCATACATCG GATGCAGGCG CTGACAAAAG GAGGGCTGCG AGTTCTGCGG 
CGAAAACTGT CGCCATACCT GCAGCGCGTA TCGTGGAGAA AGGTCCTCTA G

Protein sequence

MTRVSIVIPC YNLGEYLQEA LDSALQQTHA DLEVILVDDG STDPATIRTI DQLAPHPQLR 
VFRTPNQGVA RARNYGISLA TGAYVLPLDA DDRILPEYVA RAAAILDANP GVAFVGCHYR 
TFGLRQSEYR PAAYRLPDML VENVAPVTSL FRRCVWEEVG GYCPELNSIE DWDLWIGMLE 
RGYRGEVVPD ILFEYRVRSN SNLSQIRQPE LYQKRLQLLY ARHAGLYEQY RAEVLALKDL 
LFAHQLAYTH WLEEQRCAWE QVAQERLEMI TRYDRNWAVR EQRRQWWRYQ IGRVQRVLAQ 
HPDPIHRMQA LTKGGLRVLR RKLSPYLQRV SWRKVL