Gene Rcas_1030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1030
Symbol
ID	5538496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1343131
End bp	1344615
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	60%
IMG OID	640893169
Product	sugar transferase
Protein accession	YP_001431152
Protein GI	156741023
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03013] sugar transferase, PEP-CTERM system associated [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCGAC GGGCTGCACT CAATACGGCA TCGCGTTCAC ACGCGATGCC ATTCCATCTG 
CGATTGGAGA TTTCCGAGCG CCGGTTGTTG TTGCGCATCG GCGATCTGGC GCTAACGGCG 
ATTGCTGTCT TCGGGGCGCT CTGGGTATGG GCGCGTCTGG CGGACCGCTC ACTGGATATG 
GGATTGGTGC GAGAACAGAT CGGTTGGGTG GCGCTGATCG GCATTGGTTG GACCCTCTGG 
ATGATGCTGG CAGACATGTA CAATCTGCGC CTCGTGGCGC GCGTTGGTCC CAGTATGCGT 
CGGATCCTCC TCGGCGGTCT GGCGCTCCTC TTTGCTTACC TGATCCTGTT CTTCGTCTTG 
TCGCGCGCAC CGGTCACCGG CATGCTCGCC GCAATCGAAA CTGGCGCGCC GCCGCTGCGC 
TTTGCTCCGG CGCTCGCCAT TGTTGCCCTG GTTGTGTTAA TGGTCATCTG GCGGATGGCG 
TATATTCGGG TGCTGGGAGC GCCACACGCG CGGCGACGTC TGCTCATCCT GGGAGCGGGT 
CGGGCCGGTT CAATCCTGTC GCACGTCATT CTCAAGGGGC ACAGCCCGTA CTATGAGATC 
GTCGGGTTTG TTGATGATAC GCCGCAGACA CGTTGTGCTC ACATCGGCAG TGTTCCGGTG 
CTTGGCGGTG TCGATTGTCT TGGCGACGTC GTCTGGGAGC GGCGTGTCGA TGAGATTGTC 
ATTGCCAGCG GCGAGGTGAG TGGCGAGGTG CTTCAGGTGT TGATGGATTG CTACGAAAAT 
GGCGTTGCCA TCACGCCGAT GCCACTGCTC TATGAGCGAT TGACAGGAAA AATCGCTGTT 
GAGCATGTTG GCAGTCAGTG GTATGTCGCA TTGCCGCTCC ACTCGCGCCC GACGCGCACC 
GCCGAGGCGG TGATGAAGCG TCTGCTCGAC CTGTCCGGCG GTATCGTGCT GGTGGTGGCG 
CTGCTGATTC TGTTGCCGTT CGTTGCGCTT GCCATTCGTC TCGACTCGCC GGGTCCGGTG 
TTCCACCGAC AGCAGCGCGT TGGCTGGCGC GGCAAGCCGT TTACCGTGCT CAAGTTTCGC 
TCGATGGTGC AGGACGCTGA GCCGGATGGG GAGGCGCAGT GGGCGACGAA GGACGACCCC 
CGTGTCACCC GGGTTGGGCG CCTGTTGCGC CGTATGCGCC TCGATGAGTT GCCGCAGGCG 
CTCAATGTGT TGCGCGGCGA GATGAGTCTG GTTGGTCCAC GCCCCGAACG ACCGGAGTTT 
GTCGAACGAC TACAACAGAT CATTCCGTTC TATCGGGTGC GCCTGGCGGT CAAGCCGGGT 
CTGACTGGAT GGGCGCAGAT CAACTATGGG TATGGCGATA GCGTGGAAGC GACCCTGAAC 
AAACTTCAGT ATGACCTCTA CTATTTGAAA CATCAATCCT TCTGGTTCGA TCTCCTCATT 
CTGGCGCGAA CGGTGCATGT GGTGCTGCGG ATGAAGGGGC AGTAG

Protein sequence

MNRRAALNTA SRSHAMPFHL RLEISERRLL LRIGDLALTA IAVFGALWVW ARLADRSLDM 
GLVREQIGWV ALIGIGWTLW MMLADMYNLR LVARVGPSMR RILLGGLALL FAYLILFFVL 
SRAPVTGMLA AIETGAPPLR FAPALAIVAL VVLMVIWRMA YIRVLGAPHA RRRLLILGAG 
RAGSILSHVI LKGHSPYYEI VGFVDDTPQT RCAHIGSVPV LGGVDCLGDV VWERRVDEIV 
IASGEVSGEV LQVLMDCYEN GVAITPMPLL YERLTGKIAV EHVGSQWYVA LPLHSRPTRT 
AEAVMKRLLD LSGGIVLVVA LLILLPFVAL AIRLDSPGPV FHRQQRVGWR GKPFTVLKFR 
SMVQDAEPDG EAQWATKDDP RVTRVGRLLR RMRLDELPQA LNVLRGEMSL VGPRPERPEF 
VERLQQIIPF YRVRLAVKPG LTGWAQINYG YGDSVEATLN KLQYDLYYLK HQSFWFDLLI 
LARTVHVVLR MKGQ