Gene Rcas_3940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3940
Symbol
ID	5541446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5146292
End bp	5147500
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	65%
IMG OID	640896048
Product	glycosyl transferase group 1
Protein accession	YP_001433991
Protein GI	156743862
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCG CATTCCTGTG CACATCCGGT CTCGATTATC CATCGCCGCG CGGGCGCTGG 
CTGCCGCTGG CGCGCCGCCT GGCGCGCGAG GGGTACGAAC CGCATCTGCT GATGCTCCAC 
CCGACTTTCG ACCGGCTGAA GGTACGACAG TTCGCCCATG ACGGGGTGCA TTGCGCCTAT 
GTCGGGCAGA TGCACGTGTA CGGGCTGCCC GGCGAGCGAC GGCACTTCGG CGCGCTGGAA 
CTGGCGTCGG TTTCACTGCA AGGCGCCCTG GCACTGGCGC TGGCAACCGT CCGCCTGCGC 
CCCGATGCCA TCCATGTGGC GAAGCCGCAG CCGATCAATG GGCTGGCTGG CATCCTGGCG 
GCACGCAACG GCACGGCGCT GTATGTCGAT TGCGACGATT ACGAGGCGGA GGCAAATCGT 
TTTGGCGGCG CCTGGCAACG GCGGGTTGTG GCATGGTGGG AGGATCGCCT GCCACAGATG 
GCGCGTGGAG TGAGCGTCAA TACGCACTTC CTCTATGATC GTCTGCGATG CCTGGGGGCG 
CCCGAACAAC GCTTGCGCTA CGTTCCAAAT GGCATCGATC TGGAACGGCA GACGCCGCCG 
GACGCGCGTC AGGTCGCGGC ACTACGCACG GCGCTTGGTC TAACCCATCA TCCGACGGTG 
GTCTATCTCG GCGCAATCAG CGCCGTGGCG CATGGGGTGC GTCTGCTCAT TGATGCGTTT 
GCGATGTTGG GGAAACATCT CCCCACGGCA CGCCTCGTGA TCATTGGCGA CGGCGATGAT 
CGTCCGGCGC TGATGGCATA TGCCCGGGCG CGTGGTCTGG AGCGGACGAT CATCTGGGCA 
GGGCGCATTC CACCTGAAAC TGCGCTCACA TGGCTGGCAG TCGGCGATTG TTCGGTCGAT 
CCGGTGGAAG CGACGCCAGC CGCCGCTGCG CGATCGCCGC TCAAGATTGT CGAAAGTATG 
GCGGTAGGGG TGCCGGTCGT GACCGGCGAC GTTGGCGACC GGCGTGAGAT GCTCGGCGAC 
ACTGCCGGGC TGATCGTTTC TCCCGGCGAT GCGCGCGCGC TGGCGGATGG CATAACGACC 
TTGTTGACCG ATCCGACGTA TCGCGCGCAA CTGGCGCAGG GGGCGCGTCT GCGAGCGGAG 
GCTTACAATT GGAACCGGCT GGCATGCGTC TGGCAGACGC TCTATCAGAT CGGCGCATCA 
TCGCTGTGA

Protein sequence

MRIAFLCTSG LDYPSPRGRW LPLARRLARE GYEPHLLMLH PTFDRLKVRQ FAHDGVHCAY 
VGQMHVYGLP GERRHFGALE LASVSLQGAL ALALATVRLR PDAIHVAKPQ PINGLAGILA 
ARNGTALYVD CDDYEAEANR FGGAWQRRVV AWWEDRLPQM ARGVSVNTHF LYDRLRCLGA 
PEQRLRYVPN GIDLERQTPP DARQVAALRT ALGLTHHPTV VYLGAISAVA HGVRLLIDAF 
AMLGKHLPTA RLVIIGDGDD RPALMAYARA RGLERTIIWA GRIPPETALT WLAVGDCSVD 
PVEATPAAAA RSPLKIVESM AVGVPVVTGD VGDRREMLGD TAGLIVSPGD ARALADGITT 
LLTDPTYRAQ LAQGARLRAE AYNWNRLACV WQTLYQIGAS SL