Gene RoseRS_0374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_0374
Symbol
ID	5207309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	475756
End bp	476796
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	64%
IMG OID	640593999
Product	nuclease
Protein accession	YP_001274755
Protein GI	148654550
COG category	[L] Replication, recombination and repair
COG ID	[COG1525] Micrococcal nuclease (thermonuclease) homologs
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.180384
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00530121
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACGACA TCCGTTCCCG CCGATCATTC CTGGGGCGGG TATTGTCGAT CACGGTCGGC 
GTTCTTCTGA TCGCCGCCGT TGTGCTGCTG ATCATTGGTT TCGTCACGGC ACGCAGCGAT 
CTGTTCGTTT CGCCGGGGGC GACGCCATCA CCCCCGCCAC AGGGCGCAAC CACTTCGGCG 
TCGGTTGCCC TGCCGCCCTC GCCGGTATCG CTCACCCTTC CGCAAGGGTT GGAGCGCGCA 
ACGGTCATCA ACGTCGCCGA TGGCGACACC ATCGAGGTGT CGTTGAACGG GCAAACGGAG 
CGGGTGCGTC TGATCGGCGT CGATACGCCA GAAACCTCGC ACCCCTCACG CCCGGTCGAA 
TGTTTCGGGC GTGAGGCGTC GGCTTTCACC CGCGAGTTGC TGCGTGGGCA GACGGTTCTG 
CTTGAGGATG ACCCGACACA GGATAATCGC GACCGCTTCA ACCGTCTGTT GCGCTTCGTC 
TGGCTTCCTG ACGGACGGTT GGTCAACTAC GAGATCATCG CACAGGGATA TGGTTTTGAG 
TATACCTTCA GGACGCCTCA CCGCTACCAG GCGCAGTTCA AAGCAGCAGA ACGCGCCGCG 
CGCCAGGCGC AGATCGGTCT GTGGGCGCCG GAAACCTGCA ACGGTGAGCG GATCGCGGCA 
GATGCAGTCA CCCCCGTCGT CCGCACGACG CCGACAGCGG CGCTGGAAGT CACGCCATTG 
CCGCCATCCT TCGACGGGTG CCGCACCGAA CCGAATGCGG CGCTTGCTCC GAATCTCCCG 
GTCGCTATTG TGGCGATCGA CAAACGCGCC GAGGTGGTGA CGCTGCGCAA CGTCAGCGCG 
GCGACGGTCA ACCTCGACGG TTGGACGATG TGCAGCATGC GGGGCGCGCA GATCCATCCC 
GGCATCGGGG GAACGCTGGC GCCGGGCGAA ACCCGCGACT TTCCACGCAC CGGCGGTGGA 
AATATCTGGA CCGACAGCAC TTCCGATCCC GGCGCGCTCT ACGACGCCGA AGGGCGTCTC 
ATCGCCTACT GGCCCGATTG A

Protein sequence

MNDIRSRRSF LGRVLSITVG VLLIAAVVLL IIGFVTARSD LFVSPGATPS PPPQGATTSA 
SVALPPSPVS LTLPQGLERA TVINVADGDT IEVSLNGQTE RVRLIGVDTP ETSHPSRPVE 
CFGREASAFT RELLRGQTVL LEDDPTQDNR DRFNRLLRFV WLPDGRLVNY EIIAQGYGFE 
YTFRTPHRYQ AQFKAAERAA RQAQIGLWAP ETCNGERIAA DAVTPVVRTT PTAALEVTPL 
PPSFDGCRTE PNAALAPNLP VAIVAIDKRA EVVTLRNVSA ATVNLDGWTM CSMRGAQIHP 
GIGGTLAPGE TRDFPRTGGG NIWTDSTSDP GALYDAEGRL IAYWPD