Gene Rcas_1351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1351
Symbol
ID	5538823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1728765
End bp	1730111
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	60%
IMG OID	640893488
Product	O-antigen polymerase
Protein accession	YP_001431465
Protein GI	156741336
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGAT TGTCCGCACT CGTCGCGCCT GAATACGCCC GAACCGGAAC CGCGCTGCTG 
ATCGGGCTGG TCGTTGCGCC GCTCACCGGT GTGCTGGCAG CGACACAGCC ATTCCTGCTG 
CTGGCATTTC TTGGCGCTGC GGCATGGGTA TTCCTGGTGT TGCGCGGCGG CGCCGCTGCG 
TTCTTCGTGA TGGGGACAGC AGCCCCGCTC CTCTATCTGA TCGATGTGCG CAGCGCGCTC 
TTCGGTCAGG CGTTGCTGGC GCTCTATGGT ATGGCGCTCA TTCACGCACT GTATCAGGTC 
GCGCAACAAC CGGATGCCAG ACGATGGAAT CGCCGGCTGG TCTTCTTCGC CGTTGGGTGG 
GGAGTCGTCG TCGCGCTGGC TGAACGGGCG CTCTTAAGCG AAGGGGTCAG TCTGCGACGC 
CTGGTGATGA CTGCCATCGG TACGCTTCCT TACCTGTGGT TTGCGCTGAC AGCGCCACGC 
ATGGCGAAGG GCGATCAGGC GCATGCATTG CTCGGTGGCG TCGCCATTGG TGCAACTGTC 
GTTGCAGGAG CGTTTCTTAC CAATTCACGC TCGCTGACTG AAGGACTTCA AGGGCGGGAT 
GCCTGGATCG ATACCTACAC GGTGATCGGC AGTTTGAAGA ATTCGCTGGG GTTGTTGTGG 
GTCATTGGTT GGACCCTTCT GCTGGGATGG CGCACCAGAG GCGGGTGGAT GCTCAGAGCG 
CCGCTGCTCG CCATTCTGCT GGCCGCCATC CTCTTCTCGT TCAGTCGCTC ATCCTATATG 
GCGTTGATTG TTGCAACCCT GATGGTGTAC CGCGGTCATT CACTGAAATT GTGGGTCATT 
GCGGGAAGCA TAGGCGCATT CGTGCTATTC GGTCTGCCGG AAGCCGTATG GGCTCGTCTA 
CAAATGACTT GGTCGCCGGG ACGCGGGTTC GACCCGTCGG CAGAGACGCG CATCGATCTG 
TGGGTTGCGG CGATCAATGC CTTTCTCTCC GCTCCGCTAA CCGGTATCGG ATGGGGGAAA 
TTCAGCGAGT ATCTGGTGCG CACCGGTCAG GCGCCTATCG CAGCCGGATC GGCAGTGTAC 
GACCTCGGCT ACGCCCATAA CTACTTTCTC AGCGCCTTTG CCATGCTTGG CATTGGCGGA 
GGGATGTTGA ACATCGGCGT GTTTTTGGCG GCATGGCGGC GCGCACGCAC CCTTGCAGCA 
CGTCAGAGTC CACTGGGGCG CGTCGTGCAG GCAGCGGTGC TGGCAGTGTT CGTGGCGTCG 
ATGTTCGGCG AACCGCTCTT CGATCCCATT CTCGCATTTG TGTTCGTTCT TATCCTGGCA 
TGCCTCGTTG GGCAGGAAGG TGAATGA

Protein sequence

MSRLSALVAP EYARTGTALL IGLVVAPLTG VLAATQPFLL LAFLGAAAWV FLVLRGGAAA 
FFVMGTAAPL LYLIDVRSAL FGQALLALYG MALIHALYQV AQQPDARRWN RRLVFFAVGW 
GVVVALAERA LLSEGVSLRR LVMTAIGTLP YLWFALTAPR MAKGDQAHAL LGGVAIGATV 
VAGAFLTNSR SLTEGLQGRD AWIDTYTVIG SLKNSLGLLW VIGWTLLLGW RTRGGWMLRA 
PLLAILLAAI LFSFSRSSYM ALIVATLMVY RGHSLKLWVI AGSIGAFVLF GLPEAVWARL 
QMTWSPGRGF DPSAETRIDL WVAAINAFLS APLTGIGWGK FSEYLVRTGQ APIAAGSAVY 
DLGYAHNYFL SAFAMLGIGG GMLNIGVFLA AWRRARTLAA RQSPLGRVVQ AAVLAVFVAS 
MFGEPLFDPI LAFVFVLILA CLVGQEGE