Gene RoseRS_0401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_0401
Symbol
ID	5207337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	507927
End bp	509120
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	60%
IMG OID	640594027
Product	glycosyl transferase, group 1
Protein accession	YP_001274782
Protein GI	148654577
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID	[TIGR03087] sugar transferase, PEP-CTERM/EpsH1 system associated

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGGTG CGGCGATGAA CATCCTCTTT GTTGCACCAC GCTTCCCCGA TCCGCTCATC 
CAGGGCGACC GGCTGCGCGC GCGTCAGTTC CTGCGCGTTC TGCGCCGCTG GCACGAGATC 
ACCCTCGTCA CACCCGCGAC GCCAGAGCTG CCAGACGCTG CCACCATCGC CGACATGTGT 
GACCGGTGGG TTCCAGTGCA TGAACCGCGC TGGCGGGCGC TGTGGCGCGT CGCGTCGCAT 
AGTATTGAGA CGCTGCCATT GCAGACAGCG CTGTTCAGTT CGCCAGCGTT GATCCGCACC 
GTGCGCGACC TGGCGCATCA CCAATCATTC GACTTACTCT ACCTGCATAC CGCACGGGTA 
GCGCCGGTGG TCGACGCCGT CCCGGATCTA CCGAAAGCAA TCGACTTTAT CGACGCGCTG 
TCGCTGAATA TGTATCGCCG CGCCCGCTGT CAGGGCGGTA TCACGCACTG GTTGTTCGAT 
ATTGAAGCGC GCCGGATGGC AGAATGCGAG CAGTACCTTT CCGAAATATG CGATGTACAG 
TTCGTCTCGG CAGTTCGTGA TCGCGCATTC TTAGGACCGA ACGTTCGAGT TGTCAACAGT 
GGGGTTGACG TGGCCCAGTT TCCTTATGTA GAACAGGGAC GTCTCAACGA TCTCATTGTC 
TTGACTGGCC GCATGGGATA CTTCCCCAAT GCGGACGCCG CAGTTTCGTT TGCTTCAAAC 
GTCTTGCCCC TGGTCCGGCA CGAGGTGCCA ACGGCACGCC TGCAGATCGT TGGCGCCGAT 
CCGCCGCAGC GCGTACGAGC ACTGGCGCGT TTGCCGGGTG TTGAGGTGAC TGGCCACGTG 
CCTCGTATCC AGGACTATCT GCAACGCGCG ACAATCGCAG TGGCGCCGTT ACGCAGTGGC 
TCAGGCTTTC AGACTAAAGT AGCTGAAGCA ATGGCAAGCG GTACTCCAGT TGTGGCGACG 
CCGCACATAC TGGATTCGCT TGATGTTCGT CATGACGAGC ATGTGCTTCT GGCGCACGAT 
GATGCTGAAA TGGCAGCGCA AATCGTGCGC CTGCTGCGCG ATGCTGCGCT GCGCCGCCGG 
TTGGCGCGGG CAGCACGCGC GCTGGTTGAA CAGCGTTATA CCTGGGAACG CTCGGCCGCA 
GCGATCAATG CACATCTCGT TGCGGTCGTT CAGCAAGGCA AAAAGATATC ATGA

Protein sequence

MRGAAMNILF VAPRFPDPLI QGDRLRARQF LRVLRRWHEI TLVTPATPEL PDAATIADMC 
DRWVPVHEPR WRALWRVASH SIETLPLQTA LFSSPALIRT VRDLAHHQSF DLLYLHTARV 
APVVDAVPDL PKAIDFIDAL SLNMYRRARC QGGITHWLFD IEARRMAECE QYLSEICDVQ 
FVSAVRDRAF LGPNVRVVNS GVDVAQFPYV EQGRLNDLIV LTGRMGYFPN ADAAVSFASN 
VLPLVRHEVP TARLQIVGAD PPQRVRALAR LPGVEVTGHV PRIQDYLQRA TIAVAPLRSG 
SGFQTKVAEA MASGTPVVAT PHILDSLDVR HDEHVLLAHD DAEMAAQIVR LLRDAALRRR 
LARAARALVE QRYTWERSAA AINAHLVAVV QQGKKIS