Gene RoseRS_3273 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3273
Symbol
ID	5210248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	4123655
End bp	4124605
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	61%
IMG OID	640596869
Product	transglutaminase domain-containing protein
Protein accession	YP_001277584
Protein GI	148657379
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0832457
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.311431
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTATC ACATTCGCCA TCTGACCCGG TTCCGTTACA GCGCGCCCGT CAGCGAAAGC 
GTGATGGAAG TGCGTATGCA ACCGCGCAGC GATGGTTCCC AGCGTCTCCA TACGTTTCAA 
ATGACGACGA TACCGCGCGC AACGCTGTTC AGTTACCGCG ACGTTCTTGG GAATGTGGTA 
CATCACTTCG ATGTGCCCGG TCGCCACAAA TTGCTGACAA TCATCGCTGA AGCGCTGGTG 
GAAGCGCTTG AACCGCCGCC GCTGCCCCCG CTCGACAGCG ATGCCTGGCT CGCCCTCGAT 
GCACTTGCTG CCAGCGGCGA ACAGTGGGAG ATGCTCCAGC CCAGCCGTTT TGCATATGCA 
AGTGACCTGC TGCGCTCATT TGCGGATGAA TTGAAGATGC AGCGCGGCAG TGATCCGCTG 
ACAACCCTCT GCTGGCTCAC CGGGCGCATC TACCACGCCT TCGAATACGC ACCCGGCAGC 
ACCCATGTGC ACTCGCCGGT CGACGACGCC CTGCGCACCC GACGCGGCGT CTGTCAGGAT 
TTCGCGCATA TTATGATCGC ACTGGCGCGC ATGTTGGGCA TTCCGTGTCG CTACGTCAGC 
GGCTATCTTT TTCACCGTGC TGAAGACCAT GATCGCTCCG AGGCGGACGC GACCCATGCC 
TGGGTGGAAG CCCTGCTGCC CGGTGTGGGA TGGGTGGGGT TCGATCCGAC GAACAACCTG 
ATAGCCGGTG CACGCCACAT TCGCGTGGCT ATCGGGCGCG ACTATGCCGA TGTTCCGCCG 
TCGCGCGGAG TGTACAAAGG TCAGGCAACG AGCGAACTCG ATGTGGCGGT GCGTGTCACC 
CTGGTTGCAA CGCCTGCGGA GACAGCCGAC GACACAACGC CTGAATGGCG CGCGGTCGAG 
CGTTCGTTCA TCGCTGAAGC GGAGGCGCAG CAGATGCAGG CGCAGCAATA G

Protein sequence

MYYHIRHLTR FRYSAPVSES VMEVRMQPRS DGSQRLHTFQ MTTIPRATLF SYRDVLGNVV 
HHFDVPGRHK LLTIIAEALV EALEPPPLPP LDSDAWLALD ALAASGEQWE MLQPSRFAYA 
SDLLRSFADE LKMQRGSDPL TTLCWLTGRI YHAFEYAPGS THVHSPVDDA LRTRRGVCQD 
FAHIMIALAR MLGIPCRYVS GYLFHRAEDH DRSEADATHA WVEALLPGVG WVGFDPTNNL 
IAGARHIRVA IGRDYADVPP SRGVYKGQAT SELDVAVRVT LVATPAETAD DTTPEWRAVE 
RSFIAEAEAQ QMQAQQ