Gene Rcas_1304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1304
Symbol
ID	5538776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1682693
End bp	1683949
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	62%
IMG OID	640893442
Product	nuclease SbcCD, D subunit
Protein accession	YP_001431419
Protein GI	156741290
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID	[TIGR00619] exonuclease SbcD

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.611964
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.601138
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCTGC TTCATCTGGC AGACCTGCAC ATTGGCATCG AAAATTATGG TCGCGTTGAT 
CCATCTACCG GCTTGCACAG CCGTCTGCGC GACTACCTGG AGCGCCTGGA TGAGGCGATT 
GACGTAGGAC TTGCCGAAGG CGTAGATGCG GTCCTTATCG CCGGTGATGT GTACAAGAAC 
CGCACCCCCA ATCCCACACA GCAACGCGAG TTTGCGCGGC GCATCCATCG CCTGCGGGCG 
TGCGGTCTGC CGGTCTTTAT CCTCATCGGC AACCATGATG TGTCGCCTGC CGCCGGACGC 
GCACACGCCG TCGAAATCTT CGATACGCTG GCGGTCGATG GGGTGACGAT CGCCGATCGA 
CCGCGCATCC ATACGCTACA GACACGATCC GGTCCACTTC AGGTCATTGC GCTTCCTTGG 
GTGACGCGCC ACGCCCTGCT GACGAAAGAG GAATTGCGCA TGGCGTCGTT CCTGGAAATT 
GAAACGATGC TGATCGAGCG GGTAGAACGC TTTCTGCGCC AGGCTGCCGA CGACCTTGAT 
CCGGCGCTGC CGGCAGTGTT GACCGTGCAC GGCACGATTG ACGGCGCCAC GTTCGGCGCC 
GAACGGCAGG TGCTGCTCGG GCGCGACCTG ATCTATCCGC GCAGCCTGAT GGCGCTGCCG 
AACGTCGATT ATGTGGCGAT GGGGCATATC CACCGTCATC AGGCGCTTGG CGACCATCCG 
CCCGTCGTCT ACCCCGGAAG CATCGAGCGG ATCGATTTTG GCGAGGAGGA CGAAGACAAG 
GGATGTGTCA TCGTTGATCT GAAGGCGAAG GGTGAGGCGC ATTGGCGTTT TCACAAACTG 
GCGGCGCGTC CATTCGTCAC AATTGCGGTC GATGTGCGCA GTATAAACGA CCCGATGCAG 
CGCGTGCTGG CTGCCATCGA GCGGCGCTCG CTGCGCGGCG CAGTGGTGCG GGTGAAGATC 
GACGCGCGTC CCGAACAGGC GGATGCGCTT CAGACTGAGG CGATCCGGCG TGCGCTCGAC 
GATGCCGGCG CCTATGTCAT CGCTGCCGTG ACGGTCGAGG TCGAACGGAG CACCCGCGGA 
CGGTTGGGAA ATAGTGACGC AAGCATCCTC GACGGATTGA CCCCGCGCCG CGCACTGGAA 
TTGTACTTGC GCCAGAAAAC ACCGCCGCTC TCGGAAGAAC GTATCGCCGC GCTCCTCGCC 
GCTGCCGATG AACTGCTGGC AGAAGGCGCT CAGGATCGCG TGGAACTGTT GTCCTGA

Protein sequence

MRLLHLADLH IGIENYGRVD PSTGLHSRLR DYLERLDEAI DVGLAEGVDA VLIAGDVYKN 
RTPNPTQQRE FARRIHRLRA CGLPVFILIG NHDVSPAAGR AHAVEIFDTL AVDGVTIADR 
PRIHTLQTRS GPLQVIALPW VTRHALLTKE ELRMASFLEI ETMLIERVER FLRQAADDLD 
PALPAVLTVH GTIDGATFGA ERQVLLGRDL IYPRSLMALP NVDYVAMGHI HRHQALGDHP 
PVVYPGSIER IDFGEEDEDK GCVIVDLKAK GEAHWRFHKL AARPFVTIAV DVRSINDPMQ 
RVLAAIERRS LRGAVVRVKI DARPEQADAL QTEAIRRALD DAGAYVIAAV TVEVERSTRG 
RLGNSDASIL DGLTPRRALE LYLRQKTPPL SEERIAALLA AADELLAEGA QDRVELLS