Gene Rcas_3637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3637
Symbol
ID	5541139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4755711
End bp	4757981
Gene Length	2271 bp
Protein Length	756 aa
Translation table	11
GC content	65%
IMG OID	640895757
Product	glycosyl transferase group 1
Protein accession	YP_001433704
Protein GI	156743575
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase [COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.871876
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00349398
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCCTCC CTCCCTTTCC CCTTTCCCCT TCGCTTCCCG CCTACGGCTA TGCGCCGGTC 
GATCCGGCGG CGACGCCGGT GGTGAGTATT GTCACGCCAT GTTACAACTC TGGCGCGATC 
TTCCTCGATA CCGCGCGCTC GGTGCTGCGT CAGTCGTTGC AGCAGTGGGA ATGGATCATT 
GTCAACGATG GGTCGGACGA TGCGGCCACG CTGCGCGTCC TGGCGTTGCT CCGCGCCGTG 
AATGACCCGC GCATTCGCGT GGTGGACCGG TCCCGCTGCG GTCTTTCGGC GGCGCGCAAT 
GCGGGTGTCG CCGTCAGTCG CGCACCGTTG CTCTTCTTCC TCGATAGTGA TGACCTGCTG 
GCGCCGACGG CGCTCGAACA GTGCGCCTGG GCGCTGGCGT CGCGTCCGCA GAGCGCTGCC 
GTGGCGACCC GGTGCGCGAC GTTCGGCGCG GCGCAGCAGG AGACGCGCCG CGGGTTTGCG 
ACGCGCCATA TGTTTCCGCA CGATAATCCG CTGACAGTCA GTGTTCTGCT GCGCCGTTCG 
GCGTTCGACC GCGTCGGCGG GTTCGATGAG CGTTTCCGCG ATGGGTTGGA GGATTATGAG 
TTCTGGGTGC GCCTGGCAGC TGCCGGGTTG TGGGGACACG ATATTGCGGA GGCGCTGGTG 
TGGCTGCGCC GCAAGGCGCC AGAGACGTAT CGCGGGTATC GCTGGACGTT TCGTGAGGAT 
CGGGGGGCAA TGGCGCGTAT GCGCAATGAT CTGCGCACGC GCTATCCGCA GGTGTTCCGC 
GATGGTCCGC CGCGCGTGTC TGGTGAGCCG TCCCCCATTC TGCAACCGCA CGCGCTGATC 
GATCCTGAGC CGCCGTTCGC CAATCGTCTG CAACCGGTCG GAGCGCGGCG GGTGCTCATG 
CTGGCGCCCT GGGTCGAGAT CGGCGGCGCG GATCGCTTTA CCATCGACCT GGCAGCCGGT 
CTGCGCGCGC GTGGGTGTCG CGTGTCGGTG TGCCTGTCGC GTCCGTCGGC CAACCCCTGG 
CTGAATGAGT TGCGCGGCGC TGCCGATGAG GTCTTTAATC TGCCGACGTT CCTTGCGCCT 
GCCGATTATC CGCGCTTTCT GCGCTATCTG ATCGAGTCGC GCAGCATTAC GACGGTGGTG 
GTGCAGAACG ATCTGTTTGC TTATCGGTTG CTGCCTTTCC TGCGCGCCTG GTGTCCTGAT 
GTGCCGATTG TCGATTTTTT GCACATCGAA CAGGAGCACT ACCACGGCGG CGTGCCGCGC 
GCAGCGCTGG AGTATGATCC GGTCATCGAT CTTCATATCA CATCATCGCA CCACCTGCGG 
CAGTGGATGA TCGAGCGCAG CGCCGATCCG GTGCGGGTTG ATGTTTGTTA TATCAATGTG 
GATACACAGC GCTGGCAACC CGATCCGGCG GCGCGCGCGC GCGTTCGCGC GGAACTGGGA 
GCGCCCCCTG ATGTGCCGGT GATCCTGTTT GTCGGACGGT TGGCGCCTCA GAAGCGTCCC 
CGACTGGTGG CAGAGATCGC GCGCGCGCTG ATGGAACAAG ATGTTCCCGG CATGTTTCTG 
GTGATCGGCG ATGGTCCCGA CATGGGCTGG ATGCGGCGGT TTGTGCAGCG GCATCGTCTG 
GAACGCCGGG TGCGGTTGTT GGGGTCGGCG CCATCGGCGC AGGTGCGGGA GATAATGGCA 
GCCGCCGATA TTCTACTCTT GCCGTCGGAA CACGAAGGCA TTGCGTTTGT GCTCTTCGAG 
GCGATGGCGA TGGGGCTGGC GCCGGTTGCC GCCGATGTCG GCGGGCAGCG TGAGTTGGTG 
ACGCCCGACT GCGGTGTGCT CGTTCCGCTG GCGGGAGATC AGGTTGCGCA GTATGTCGAA 
GCGCTGCAAC GCCTGATCGC CGATCCGCAG CGGCGCGCGG CGATGGGGCA GTCGGCGCGC 
GCGCGGGTTG TGGCGCATTT TGACCAGCAG CAGATGATCG ACCGCATGCT GGAACTCTTC 
GAGCAGGCGG CGACCCTGGC GCGCGATGCG CCGCGCCCGT CGGTGGATCG CGGTCTTGGT 
CTGGCGACGG CGTCCCTGGC GATTGAGTAT TTTCAGTTCC GCGAGGCGCT GCTCCGGCTG 
GCGCCGGTGC GTTGGGCGCG CGCGGCGCGC TGGTCCTCTG CTTGGGAAAC GGTGCGGCGG 
ATTGCAGAGG TGCGCACCCT GCTCGACCGC CTTGATCGCC GGATATATGT GCTGCGTCGT 
GAGGTCATGT GGCGAATCAA GCGCGCGCTG GGGAAGGAGT ATAATCAGTG A

Protein sequence

MPLPPFPLSP SLPAYGYAPV DPAATPVVSI VTPCYNSGAI FLDTARSVLR QSLQQWEWII 
VNDGSDDAAT LRVLALLRAV NDPRIRVVDR SRCGLSAARN AGVAVSRAPL LFFLDSDDLL 
APTALEQCAW ALASRPQSAA VATRCATFGA AQQETRRGFA TRHMFPHDNP LTVSVLLRRS 
AFDRVGGFDE RFRDGLEDYE FWVRLAAAGL WGHDIAEALV WLRRKAPETY RGYRWTFRED 
RGAMARMRND LRTRYPQVFR DGPPRVSGEP SPILQPHALI DPEPPFANRL QPVGARRVLM 
LAPWVEIGGA DRFTIDLAAG LRARGCRVSV CLSRPSANPW LNELRGAADE VFNLPTFLAP 
ADYPRFLRYL IESRSITTVV VQNDLFAYRL LPFLRAWCPD VPIVDFLHIE QEHYHGGVPR 
AALEYDPVID LHITSSHHLR QWMIERSADP VRVDVCYINV DTQRWQPDPA ARARVRAELG 
APPDVPVILF VGRLAPQKRP RLVAEIARAL MEQDVPGMFL VIGDGPDMGW MRRFVQRHRL 
ERRVRLLGSA PSAQVREIMA AADILLLPSE HEGIAFVLFE AMAMGLAPVA ADVGGQRELV 
TPDCGVLVPL AGDQVAQYVE ALQRLIADPQ RRAAMGQSAR ARVVAHFDQQ QMIDRMLELF 
EQAATLARDA PRPSVDRGLG LATASLAIEY FQFREALLRL APVRWARAAR WSSAWETVRR 
IAEVRTLLDR LDRRIYVLRR EVMWRIKRAL GKEYNQ