Gene Rcas_1488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1488
Symbol
ID	5538963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1902527
End bp	1903810
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	65%
IMG OID	640893626
Product	glycosyl transferase group 1
Protein accession	YP_001431600
Protein GI	156741471
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0380983
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.669661
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACATCC TGCTTCCAAC CGACGTTTTC CCCCCCGGCT GCGGCGGTGC AGGCTGGAGC 
GCACACGCGC TGGCGCTGGC GTTGATCACG CGCGGTCACA CCGTGACTGC CATTGTCCCG 
CGCGAAGGAG ACCGTGGACT TGTCACCGGC GAAACGCGCG GCGTACCGAC GGTTTCTTTC 
GGTTATCGCG CGCCGCGCAT CCCCTTCGTG CGCAACTACG CGCGCAACGA GCGGTTGTGG 
CCCCGCCTGG CGCGGGTGAT GGTCGAAGCC AGCGCAACAC ACACGTCACA TCATCCGGCA 
ATGATCATTC ATGCCCAACA CGTTCAGGTT GCGCCTGCCG CTGTGATGGC CGGGCAGCGG 
CTTGGCGCAC CGGTGGTCAT CAGTGTGCGC GATCACTGGC CCTGGGATTA TTTTGCAACC 
GGGTTGCACG GCGACCGCAT CCCCCATCCC CGTCAGACAT GGGCGTCGCT GGCAGCCGAT 
CTGCCCGCTC GCCTGGGACC TTTGCGCGGC GCGGCGGCGC TGCCTGCCAT CCCCTATATG 
CTGGCGCACC TGGCGCGCCG CCGCGCCGTC CTGCGCCAGG CAGACGCCGT GATTGCCGGC 
AGTCGCTACA TCGCCGGACG CCTGGTGGAC CTGGTTGAAC CTCAACGACT GCACATTATT 
CCGAATATTG TCGATCTGGC GGCAATTGAT GCCGTGATCG CCACTCCCTC GCACCTGGTT 
GCGCCCGATG AGCGCTTCGT CCTCTATGTC GGCAAACTCG AACGCAATAA AGGAGCGCAT 
CTGCTCGGTG AAATTGTCCG ACAGACAGGC GCAGCGCTCC ACCGCTACAC CCTCGTGATC 
GCGGGTAGCG GCCCGTTGCG GACGGAACTG GAGCAAACGG TGCGCGCCGT TGGCATGCGC 
GCCCGATTTC TCGACTGGAT CGACCACGAC GAGGTGTTAC GTTTGATGGC GCGATGTGAT 
CTGTTGCTCT TCCCCTCGGC GTGGGGCGAG CCATTGAGCC GCGTGCTGCT CGAAGCATGC 
GCCTGCGGCG CGCCTATCCT GGCAATGCCC ACCGGCGGCA CACCGGACAT TATTCTCGAT 
GGAGAAAGCG GCGCACTCGC GGCAACAGTG CCTGGTTTTG CGCGTCGTCT GACCGAACTG 
CTCGAACGAC CGGTCGAGCG CCAGGCGCTT GGCGCCGGAG CACGCCGCCT GGCGGCGCGT 
CGCTTCGCCC CCGATATCGT TGCCGGGCAG GTGGAACGTC TCTATCAGTC GCTTGTAGCA 
CCGAAGCAGT ATGCAGCGCA GTAG

Protein sequence

MHILLPTDVF PPGCGGAGWS AHALALALIT RGHTVTAIVP REGDRGLVTG ETRGVPTVSF 
GYRAPRIPFV RNYARNERLW PRLARVMVEA SATHTSHHPA MIIHAQHVQV APAAVMAGQR 
LGAPVVISVR DHWPWDYFAT GLHGDRIPHP RQTWASLAAD LPARLGPLRG AAALPAIPYM 
LAHLARRRAV LRQADAVIAG SRYIAGRLVD LVEPQRLHII PNIVDLAAID AVIATPSHLV 
APDERFVLYV GKLERNKGAH LLGEIVRQTG AALHRYTLVI AGSGPLRTEL EQTVRAVGMR 
ARFLDWIDHD EVLRLMARCD LLLFPSAWGE PLSRVLLEAC ACGAPILAMP TGGTPDIILD 
GESGALAATV PGFARRLTEL LERPVERQAL GAGARRLAAR RFAPDIVAGQ VERLYQSLVA 
PKQYAAQ