Gene Rcas_0465 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0465
Symbol
ID	5537928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	592971
End bp	594431
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	51%
IMG OID	640892628
Product	O-antigen polymerase
Protein accession	YP_001430614
Protein GI	156740485
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.216322
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.610525
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGCAA CGTTTATGCG CACAATGCTC AACCAAAAGA GGCGTCACCT GAAGAGCAGC 
CTGACAGCAC GACAACCCCT TCCTGTATTT CGTTCCTTCC TGATAGTCGG CGTGTTGCTC 
GGCATTGTCG GATTGAGCCT GGCGGCTGGG TACGTCATCG GCGCCGATCG GAAATTCGTC 
GCGCTGGCGA TCTTCGGTCC GCTGGCGGCG ATACCGGTTT TCTTTCTTGT CAGTCGGCAT 
TTTACCTATG CGATACTGTC TTTGCCCATA GCAGCAATGG CGATCCCGAT TGATATACCG 
ACGGGAACGT ATACGAAAAT ACCGATCTCA CTGGTTATTG CAACAATGCT CTGCGGTATA 
TGGATCACGT CGATGGCGAT CCGCAACAAT TGGCGACTGG CGCCGTCGCC GATTAACCGT 
CCAATGATCG TATTCTGCAT TGCCTGTACG ATATCGTTGA TATGGGGAAT TGTATGGCGT 
GATCCTATAC TACGGATGGA TATATTTTCG AACTTCATCG TTGTTCAGAT CGCTTCTCTC 
GTTACTTATG CAGTTTCTGT CGGGGTTGCG CTGTTGATCG GTAATTTTCT TTGGAATGAG 
GGTCAAATCA AGTATCTTAT CGGTTGCTTT TTGTTTTTTG GGTCGCTCAT GACCATATTT 
CAAATCTTGA GGATCGATCA TAGAATCCTT ACAGACCGTG GATTATGGGG ATTATGGACG 
GTTATTCCTG CTTATGCGCT GCTGATTACG CAACCCGGCT TGCGCTTGCG TTGGAGATTG 
CTTCTGCTGG CGCTCATTGT CGCTAATCTG TATCAAACGA TCCTGATCAA TCTGCTCTGG 
AAATCGGGAT GGATTCCGAC GGTTATTGCT ATCTTTGCAG CGACATTGAT CCGTTCACGG 
CGTTGGTTCG TTGTGCTGGC CGTTGCAGTG ATTGTGTTGG TATACACACA ACAAGATTTT 
TTCAATCAGA TGATCGAAAC AGAGTTGAAC GAAGGCGCCG ATGGTCGGAT CGGTATGTGG 
GAGATCAATC TGCGCGTGGT TGGCGAACAT TGGCTGTTCG GCACCGGTCC TGCCGGGTAT 
GCGCCGTACT ATATGACCTA CTACCCCTAC GATGCGCGCT CGACGCACAA CAACTATCTC 
GACATCATTG CTCAGTTTGG CGTGGTTGGT TCGATAATCT GGCTCTGGTT CGCGTTTGCC 
AGCACAAGCG AAGGTTTGCG CCTCTACCGT GAAGCGCCGC CTGGATTCCT CAAAACCGCA 
GCATTGACCA CGGTCAGCGG TTGGATCGGC GCGCAGGCAT CGATGTTCTT TGGTGACTGG 
ATTCTGCCGT TTGCCTACAA CCAGACGATT AACGGCTTCA AATACACGGT TTATAGCTGG 
TTTTTCGTCG GTCTCCTGAT CAGCCTCCGG CAGATCATTG AGCGGCGCAA AGCGACCCAA 
ACGGTGAGCA ATAGCGTATG A

Protein sequence

MSATFMRTML NQKRRHLKSS LTARQPLPVF RSFLIVGVLL GIVGLSLAAG YVIGADRKFV 
ALAIFGPLAA IPVFFLVSRH FTYAILSLPI AAMAIPIDIP TGTYTKIPIS LVIATMLCGI 
WITSMAIRNN WRLAPSPINR PMIVFCIACT ISLIWGIVWR DPILRMDIFS NFIVVQIASL 
VTYAVSVGVA LLIGNFLWNE GQIKYLIGCF LFFGSLMTIF QILRIDHRIL TDRGLWGLWT 
VIPAYALLIT QPGLRLRWRL LLLALIVANL YQTILINLLW KSGWIPTVIA IFAATLIRSR 
RWFVVLAVAV IVLVYTQQDF FNQMIETELN EGADGRIGMW EINLRVVGEH WLFGTGPAGY 
APYYMTYYPY DARSTHNNYL DIIAQFGVVG SIIWLWFAFA STSEGLRLYR EAPPGFLKTA 
ALTTVSGWIG AQASMFFGDW ILPFAYNQTI NGFKYTVYSW FFVGLLISLR QIIERRKATQ 
TVSNSV