Gene Rcas_3884 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3884
Symbol
ID	5541390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5081313
End bp	5082392
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	64%
IMG OID	640895995
Product	glycosyl transferase group 1
Protein accession	YP_001433938
Protein GI	156743809
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.242445
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACTCG TCTGGCATTC ATCATTCGCA TCACTCACCG GCTACAGCGG CTCATCGCTT 
GCTTTCGTCC TGGGGCTTGA TGCGCGCGGC GTGGCGGTTC GTCCGCTCTA CCTGTACGGC 
GCCGACCGCG ATGAGCATGT GATGATGGGG CGCATCCATC CGCGCATTGC CGAGTTACAG 
CGCGCTCCGG TGCGTTTTGA TGCGCCGCAG GTCGTGTATG CGCCGGGTGA CCGATTCTCG 
AAGAACAGCG GGCGCTACCG CATCGGCTTC ACCATGCTCG AATTTGATCG TCTGCCGCAG 
GAATGGGTGC AGCAGGCCAA TCAGATGGAC GAAGTCTGGA CGCCGACTGC CTGGGGCGCC 
GACGTGTTTG CGGCAAGCGG CGTCACCCGC CCGATCTTCG TTGTGCCGCT TGGCGTGGAT 
TCAGGACGCT TTGAACCGGG AGAACCGCGC GCGCATTTGA CCGACCGCAC GGTATTCCTC 
TCGGTCTTTG AGTGGGGACC GCGCAAAGGA TGGGATATTC TGCTGCGCGC CTACCGCGCA 
GCCTTTCGTG CCGGTGATCC GGTTGTGCTG GTGTTGAAGA TCGACTGCCG CGCCCCTGGC 
GAGAATCCTG TGCGTGAACT GGCGACGCTG TTGCCCATGC CATCACCGCC GGTTGTGCTT 
CTCTACAACC GTTCCCTGGA CGCGCAGCGT ATGGCGGAAC TCTACCGCAG CGCCGACTGC 
TTCGTGTTGC CGACGCGCGG GGAGGGGTGG GGCATGCCGA TCCTCGAAGC GATGGCGTGC 
GGCATCCCTG CAATTGCAAC CGACTGGAGC GGACCGACGG CGTTTCTCAG CCGCGAGAAT 
GGCTATCCAC TGCCGATTCG CGGTCTCGTT CCCGCCGATG CTGGCGGCGC CTACGGTATT 
GGCGCGCAAT GGGCAGAGCC GGACGCCGAT GCCCTGGTTG ATCTGCTGCG TCAGGCGGTG 
CAACACCCCG ATGAGCGCCG CCGCAAAGGG CTGCGCGCTG CCGCCGACGC CAACCGCTGG 
ACGTGGGATC GCGCAGTGGA ACGGGTCTGT GCGCGTTTGA AGGAAACCGG AATCTGGTGA

Protein sequence

MELVWHSSFA SLTGYSGSSL AFVLGLDARG VAVRPLYLYG ADRDEHVMMG RIHPRIAELQ 
RAPVRFDAPQ VVYAPGDRFS KNSGRYRIGF TMLEFDRLPQ EWVQQANQMD EVWTPTAWGA 
DVFAASGVTR PIFVVPLGVD SGRFEPGEPR AHLTDRTVFL SVFEWGPRKG WDILLRAYRA 
AFRAGDPVVL VLKIDCRAPG ENPVRELATL LPMPSPPVVL LYNRSLDAQR MAELYRSADC 
FVLPTRGEGW GMPILEAMAC GIPAIATDWS GPTAFLSREN GYPLPIRGLV PADAGGAYGI 
GAQWAEPDAD ALVDLLRQAV QHPDERRRKG LRAAADANRW TWDRAVERVC ARLKETGIW