Gene Rcas_2209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2209
Symbol
ID	5539690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2852690
End bp	2853955
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	65%
IMG OID	640894342
Product	glycosyl transferase group 1
Protein accession	YP_001432310
Protein GI	156742181
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0688071
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATTG CAATGCTCAG CGTTCATAGC AGCCCCCTCG CGCGTCTCGG AGGCAAGGAG 
GCGGGTGGCA TGAATGTGTA TGTTCGAGAA TTGAGCCGCG AGTTCGGACG GCGCGGCATT 
TCGGTCGATA TTTTCACCCG CGCGCAGGAA CGCACCGCGC CGGCGATCGT TCCGATCGAT 
CAGGGGGTGC GACTGATCCA CGTGCGCGCC GGTCCATCAG CCCCCTACGA CAAAAATCGT 
CTGCTGGACT ATTTGCCGGA GTTTATTGGG CGGGTGCGCT GCTTCGCCGA TAGTGAAGAC 
CTGCACTACG ACATCATCCA CAGTCATTAC TGGGTCTCCG GCGAAGCGGC GCTGGCGCTG 
CGCCGCAGTT GGGGCGCGCC TGTCGTGCAT ATGTTCCATA CCCTTGGCGC AATGAAAAAC 
CAGGTGGCGC GCGGGTCAGA AGAACGCGAG ACCAGGCAGC GAGTCGCTGT CGAGGGAGGC 
ATTCTGCGCG AGGCTGATAT GATCATTGCA GCAACGCCGC TCGACCGGGC GCAGATGGTC 
TGGCACTATA ACGCGGACGC AGAGAAGATC AGGGTTGTGC CGGCCGGTGT TGACCTGCGC 
CGCTTTCGAC CCCGCGATCT CGTGGAGGCG CGCGCGGCGC TCGATCTGCC GCCTCCCCCA 
CACCGCGTCG TCCTGCTGGT GGCGCGTATT GAGCCGCTCA AGGGGATCGA CGCGCTGATC 
GAAGCCGGCG CGCTGCTGCT GCAACGCCAC CCTGCGTGGT GCGGCGCGCT GACGACGCTG 
ATCGTCGGCG GCGGCGGCGA AGAGGAACGC GCGCAATGGA ACGCCGAGCA ACGGCGATTG 
GACGCGCTGC GCCAGCGGCT CGACATCGCC GATGTCGTTC ACTTCGCCGG AGCGCAACCG 
CAGGATCGTC TGCCGCTGTA CTATGCTGCC GCCGATGTTG TGACCATGCC GTCGCACTAT 
GAGTCGTTCG GAATGGCGGC GCTCGAAGCG CTGGCATGCG GCAGGCCGGT TATCGCCACG 
AATGCGGGAG GTCCGGCGTT CATTGTGGAA GATGGCGTGA GCGGGTTGTT GACCCCGCCA 
GCCGATCCGG TGACGCTGGC GCGGCATCTT GAGCGCCTGC TGCGGGACGA TGCCGGGCGT 
GCCGCTATGG GCGCTGCGGC GCGCGAACGC GCGTTGCGGT TCGGCTGGGA ACACGTCGCC 
TGCGATATTC TTAGCGTCTA TCGTGATCTC CTCCGGCAGC GCAGCGCATG GATGCGCGCA 
GGGTAA

Protein sequence

MRIAMLSVHS SPLARLGGKE AGGMNVYVRE LSREFGRRGI SVDIFTRAQE RTAPAIVPID 
QGVRLIHVRA GPSAPYDKNR LLDYLPEFIG RVRCFADSED LHYDIIHSHY WVSGEAALAL 
RRSWGAPVVH MFHTLGAMKN QVARGSEERE TRQRVAVEGG ILREADMIIA ATPLDRAQMV 
WHYNADAEKI RVVPAGVDLR RFRPRDLVEA RAALDLPPPP HRVVLLVARI EPLKGIDALI 
EAGALLLQRH PAWCGALTTL IVGGGGEEER AQWNAEQRRL DALRQRLDIA DVVHFAGAQP 
QDRLPLYYAA ADVVTMPSHY ESFGMAALEA LACGRPVIAT NAGGPAFIVE DGVSGLLTPP 
ADPVTLARHL ERLLRDDAGR AAMGAAARER ALRFGWEHVA CDILSVYRDL LRQRSAWMRA 
G