Gene Rcas_3101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3101
Symbol
ID	5540597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4018357
End bp	4019826
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	59%
IMG OID	640895220
Product	polysaccharide biosynthesis protein
Protein accession	YP_001433173
Protein GI	156743044
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0405344
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAATCAA CGACAACATC GCAATCCGAA GGAGTCGGCA AGCGCGCCGT GCGTGGAACG 
TTCTGGTCAT TCCTTTCGTA CACGAGCGGG CGCCTCGTCA CGTTTGTCAC TACGCTGATC 
CTGGCGCGTC TGCTGGCGCC GGCGGAGTTC GGCGTGATCG CTTACTGCAC ACTGGTGATC 
GCCTATCTCG ACCTGCTTAA TAATTTTGGC GTCGGGCATG CCCTGATTGC GCGACGTGAC 
AGGTTGGAAG AAGCCCAGAA TGCGGCATTC GTCGTCAGTA TTGGCAGTAG CGTGTTTCTG 
TACGCCGGCG CGTGGATTGC GGCGCCCTCG ATTGCAGTGT TCTTCAATGA GCCGCAGGTA 
ACGCCGTTGC TGCGCGTGTT GTCGCTTGGG CTGCTGCTGG TCGGAATCGG CACTGTGCCG 
ATGGCTATGC TTCAGCGCGA TCTCCGGTTC AAGGCGTATT TACTTCCCGG GATTGTGCGG 
AATATTATCA AAGCAGTGGT TGCCATCAGC ATGGCGTGGC AAGGGTTTGG CGTCTGGAGT 
CTGGTGGTTT CAGAACTGGT CAACAAGGTG TTGGAGGTGA TCATTCCCTG GCTGATTGTG 
CGCTGGCGAC CAACGCGTGC GTTCGACCCG CAGGTGATGC GCGAGATGTT GGGGTATGGC 
GTCCACATTA TGGGGGTCAG TCTGGTTGGC TCCTTTATGG TCAATGTGGA TTATCTGCTG 
GTCGGGCGGT TGCTTGGCGC GGCGGCGCTG GGGTACTATA CAATGGCGTT CCGCATTCCC 
GAACTGGTCA TTCGCAGCGT CAGTCAGATC GTCAGCACCG TCGCCTTTCC TGTTCTGGCG 
CATACCCAAT CGGATCCGGC AAAGACGCAC GACATGTATT TCGCCTATCT GCGCTATATG 
GCGCTGGTGA CCTTTCCCGC AGGCGTTGGG CTGGCGCTGT TGTCGCCGGC GCTGGTGCGG 
GTCTTTTTTG CCGAGGTATG GCGTCCGATG ACGGCGCCAA TGCAGTTCAT CGCCATCGCC 
AGCGCCTTTT CCATCGTGTC GTATCTGTCG GGGATCATTT ACAATGCGAT TGGGCGGCCT 
GATCTGACTT TTAAATTGTC GCTGGCGAAA CTGCCGATTG TTGTGCTGGT GCTCTCCATC 
GGCACGTTCT GGAATATTAC GGGCGTGGCT GCCGGACATG TCGCGCTGAC GCTGGTGTGT 
ATGGCGCTCG ATTTGGTGAT GATCCGACGG GTGACCGGTG TGCGACTGAT GGGCGTGTGG 
CATGCGGTGC AACCAGCGTT GTTGGGCGCA GGGGTGATGG CAGCCGTTGT TGGTGCGCTC 
GACGCGATGC TGACGGGTGC GCCCATCGTG CAATTGGCGG CGCTGCCACC GATAGGCGCC 
CTGGTCTATC TCGGAACTAT CTGGATCGCC GGACGTGAGA TGTTTCTGGA GGCGCGCTCG 
GTGCTGCGCG GTAGTCTGGC GCGCGGTTGA

Protein sequence

MQSTTTSQSE GVGKRAVRGT FWSFLSYTSG RLVTFVTTLI LARLLAPAEF GVIAYCTLVI 
AYLDLLNNFG VGHALIARRD RLEEAQNAAF VVSIGSSVFL YAGAWIAAPS IAVFFNEPQV 
TPLLRVLSLG LLLVGIGTVP MAMLQRDLRF KAYLLPGIVR NIIKAVVAIS MAWQGFGVWS 
LVVSELVNKV LEVIIPWLIV RWRPTRAFDP QVMREMLGYG VHIMGVSLVG SFMVNVDYLL 
VGRLLGAAAL GYYTMAFRIP ELVIRSVSQI VSTVAFPVLA HTQSDPAKTH DMYFAYLRYM 
ALVTFPAGVG LALLSPALVR VFFAEVWRPM TAPMQFIAIA SAFSIVSYLS GIIYNAIGRP 
DLTFKLSLAK LPIVVLVLSI GTFWNITGVA AGHVALTLVC MALDLVMIRR VTGVRLMGVW 
HAVQPALLGA GVMAAVVGAL DAMLTGAPIV QLAALPPIGA LVYLGTIWIA GREMFLEARS 
VLRGSLARG