Gene Rcas_3105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3105
Symbol
ID	5540601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4023107
End bp	4024372
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	61%
IMG OID	640895224
Product	glycosyl transferase family protein
Protein accession	YP_001433177
Protein GI	156743048
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.359614
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGC GATTCTTCTG GTTCTGCGTG ACGCTGATCG GGTATGTCTA TGCCGGCTAT 
CCGGCGCTGT TGACCGTACT GGCGCGGTTG CGTCCGCAAC CGTTGTTTGC GCCGCCTGCC 
GATCTGCCGA TAGTGACGCT CCTGATCGCG GCATACAATG AGCAAAACGT GATTGCTGCC 
AAACTGAGCA ATAGTCTGGC GCTCGATTAT CCGCGCGACA GGCTCCAGAT TCTGGTGGCT 
GCCGATGGGT CGGATGATGC CACGCCCGAC ATTGTCGCCG ATTTTGCCGA TTGTGGCGTC 
GAATTGAGTT ATCGCCCCGA GCGCGCCGGG AAACTGGCGG CGATCACCCG TGCGCTCGCG 
CTGGCGCGTG GTGAGATTAT CGTGTTGTCC GATGCGAATA ACCTGTACGA CGCAGGCGCA 
TTGCGGGCGC TGGTCGCGCC ATTTGCCGAT CCGAGCGTCG GAGCGACGAC AGGCGCCAAA 
GTGATTGCGA AGGGCGACGG AGCGCTTGGT GACTCGGAAG GGTTGTACTG GAAGTACGAG 
TCGTACATCA AGCGCCAGGA GACGCGACTG AGCAGTTGCA CCGGCGCAGT TGGCGAAATT 
ATGGCGGTGC GACGCGGGTT GCTCGATCAG CCGTTGCTGC CGGAGGCGCG GTTGATGGCA 
GACGATCTGG CGCTCGCCAT GCATGTGCTG AAACAGGGGT ATCGCGTGGT ATACATACCC 
AACGCGCGCT CAATCGAGCG GGTATCTGCT TCGGCGCAGG ACGAGCAGGA GCGTCGGGCG 
CGAATTGTGG CGCAGCGTTT TGTGCTGATG CGGCACTCGC ACAGGATGTT GCCGCTGTTG 
AATCCGCTGC TCGTCTGGCA GATTGTGTCG CATAAGTACC TGCGCCCGTT TGTGCCGCTG 
GCGATGATCG GCGCGCTGCT TGCCAATCTG GCGGCGGTGA TTCGTCCGGC GGCGCAGGGG 
GGGATGCTGC GGCTGGCGTC CCCCTTCAAC TGGGTGATGC TGGCGTTGCA GGCAGTGTTC 
TATGCGCTGG CATGGATGGG AGGGCGCAAC GAATGTCGCG GCATATGGGG AAAAGCGCTG 
TATATTCCGG CGTTCCTGGT GAATGGCAAT CGCGCGGCGC TCGTGGGACT GTACCGTTTT 
CTGACCGGGC GCCATACCTC GCTTTGGAAT CGTGTTCAGC GGCGTGAACG TGAAAGCAGC 
GCATCTGAGC AGCGCCGTGT CAACCCGTCG TACCGTGTAC TATCGGGAAA GGAAAACAAT 
CCATGA

Protein sequence

MSGRFFWFCV TLIGYVYAGY PALLTVLARL RPQPLFAPPA DLPIVTLLIA AYNEQNVIAA 
KLSNSLALDY PRDRLQILVA ADGSDDATPD IVADFADCGV ELSYRPERAG KLAAITRALA 
LARGEIIVLS DANNLYDAGA LRALVAPFAD PSVGATTGAK VIAKGDGALG DSEGLYWKYE 
SYIKRQETRL SSCTGAVGEI MAVRRGLLDQ PLLPEARLMA DDLALAMHVL KQGYRVVYIP 
NARSIERVSA SAQDEQERRA RIVAQRFVLM RHSHRMLPLL NPLLVWQIVS HKYLRPFVPL 
AMIGALLANL AAVIRPAAQG GMLRLASPFN WVMLALQAVF YALAWMGGRN ECRGIWGKAL 
YIPAFLVNGN RAALVGLYRF LTGRHTSLWN RVQRRERESS ASEQRRVNPS YRVLSGKENN 
P