Gene RoseRS_4241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4241
Symbol
ID	5211226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5316310
End bp	5317869
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	61%
IMG OID	640597830
Product	glycosyltransferase
Protein accession	YP_001278534
Protein GI	148658329
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00359049
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCCGTC CAGAGGCGCA TCGTATGCCA CATCTTCAAA CGACGACGGC GACCGGATCG 
ATGTACCGGA TCGTTGTGAT CATGCTGTTC GCAGCGGCGG CATTGCTGGC GACGATTAAC 
CTGCCCTACG CGCCGCGCAC CTGGTTCGAT GAGGGATCGC ATCTCCACGT ACCTGAGACG 
CTGGTCCGAT ACGGGAAGTA TGCCGACATC AGCGCCACTC CTGATGGCGG CGTCGAGTTC 
CGCTACCACG GTCCCACGAT CGGCATCGGT CCGACGATTA TGCTGCCGGT TGCGGCGGTC 
TATCAGGCGT TCGGCATCGG TCTGACGCAG GCGCGACTGG TGATCGTGAT CTATTTTGCT 
ATTGCAGTTG TTGCCGGGTA TGCGCTTGCG CAGCGTCTCT ATGGCGGGTG GCCCGCGCTC 
ATCGCCCTGG CATTGCTGCT GGCGTCGCGC ACGGTCAACT ATGAGGGGTT GATCGAGTAT 
GGGCGGCAGG TGCTCGGCGA GGCGCCGGGG GTCGCATTCG TTTTTCTGGG AATGCTGGCA 
TGGCTGACTG CGTTGAAGAC GGCGACAGAG CTGTCGGCGC AGCGGACGCA TCTCATCTGG 
AGCGTGCTGG CAGGATTGGG GTTCGGGATG GCGCTGGTCA CGAAGAATCA GTTCGTGCTG 
ATTGTACCCC TGGCGCTCCT GTTGACCGCG CTGCTCGACT GGCGCTACTA CCGGGCTGGC 
AGTTGGGTGC TGCGTCTGGT TCCTCTTGTC GTGTCGGTCG CGTGCTTTGG CGTCTGGACG 
TTGACGCAGT TTGCGCTGCT CGGTCCCGGA ACTTTCTTCG AGAACATTCA GCAGACACGT 
CAGGCAGCTG GAGGCGCGAT TTTCGTCTTT AATATCCGAT CAACGCTGCG CGCCGGATAT 
TACCTGTTGC GCCCGGATCT GTACGGCGGG TTGATCGTTC CGGCGATGGC GTACACCATC 
TGGCGCGCGC GCAGCCGCAC GTCGCAGGGG TTGAGCGAAG CGCTGCTGGC ACTGTTGATC 
GGTCTGTGGC TGGCATGGTT CGTCGGCGCT TCGCTGGGCT GGCCCCGCTA TGCATTCCCG 
GCAGTCGCCC TGAGCGCGCT GACCGTCGCC CGTCTGGCAT TCGACACGGT AGCCTGGTTG 
CGCCGTCTGC TGCCGGTTGC CGCGACAGTT GCGGTTGTCT ACCTGATTGC GATCATTGCG 
TTGCCGCTCG CTCTGACGGC GCGCGTTGTG TTCACTCCCG ACGACAGTGC ACAGCGGTTT 
GCGGCGTATC TGAATGCCAC CGTGCCGGAA ACGGCAATCA TCGCAACATG GGAGCCAGAA 
CTCGGCGTAT TGACCGACCA CAACTATCGC TACCCGCCGC AACCGACGCT CGATCAGGCA 
GTGCGTTCCA CCTGGCTGGG GGGTGCGCCG GTTCAGTACA ACTGGTATGC GGAGCGCCCG 
ACGTATGTCG TGGTTGGCGG TTTCGGCAGT TATACTGGCG TGTACAATAC GCCGGAACTG 
GAACGCCACT ATATTCAGGT GGCGCAGATC GGAACCTATG CGCTCTTTAT GCACCGTTAA

Protein sequence

MIRPEAHRMP HLQTTTATGS MYRIVVIMLF AAAALLATIN LPYAPRTWFD EGSHLHVPET 
LVRYGKYADI SATPDGGVEF RYHGPTIGIG PTIMLPVAAV YQAFGIGLTQ ARLVIVIYFA 
IAVVAGYALA QRLYGGWPAL IALALLLASR TVNYEGLIEY GRQVLGEAPG VAFVFLGMLA 
WLTALKTATE LSAQRTHLIW SVLAGLGFGM ALVTKNQFVL IVPLALLLTA LLDWRYYRAG 
SWVLRLVPLV VSVACFGVWT LTQFALLGPG TFFENIQQTR QAAGGAIFVF NIRSTLRAGY 
YLLRPDLYGG LIVPAMAYTI WRARSRTSQG LSEALLALLI GLWLAWFVGA SLGWPRYAFP 
AVALSALTVA RLAFDTVAWL RRLLPVAATV AVVYLIAIIA LPLALTARVV FTPDDSAQRF 
AAYLNATVPE TAIIATWEPE LGVLTDHNYR YPPQPTLDQA VRSTWLGGAP VQYNWYAERP 
TYVVVGGFGS YTGVYNTPEL ERHYIQVAQI GTYALFMHR