Gene Rcas_2978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2978
Symbol
ID	5540470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	3860978
End bp	3862975
Gene Length	1998 bp
Protein Length	665 aa
Translation table	11
GC content	60%
IMG OID	640895096
Product	excinuclease ABC, C subunit
Protein accession	YP_001433053
Protein GI	156742924
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex
TIGRFAM ID	[TIGR00194] excinuclease ABC, C subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0000426335
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCGATC TCATGCATAC GACGGTTGCC GATCCAATCG CCCTTGAAGA ACGGTTGCGC 
GCCGTGCCGC TTGCGCCTGG GGTGTACCTC TGGAAGAACG CCCAGGGGAA AATTATTTAC 
ATCGGTAAGA GCAAACGGCT GCGTGATCGT ATGCGTTCCT ACTTTGCCCG CACCGACGAT 
CCTTACGGCA AAACGGCGCG GCTTGTGGCG CAGATCGCCG ATTTCCAGGT GATCGTGACG 
TCCAACGAGC TTGAGGCGTT GCTGCTCGAA ATGACCCTGA TCAAGCAGCA CCGACCGCGC 
TTCAACGTTT TACTGAAGGA CGACAAAAGC TACCCGTACA TCAAGGTGAC GCTGCACGAG 
CCGTGGCCCC GCATTGTTGC GACGCGCAAC CCGCGTTGGG AAGAGGGGGC GCGCTACTTC 
GGACCGTACT CCAGCGCCGG CGCCGTCTAT CGCACGCTCG ACCAACTCAA CCGGCTGTTC 
GCCTTTCGCC CGCCGTCGCG TTGCCCTGAC GATAAGTTCA ACCGCCATCG GCGGCTCGGC 
AAACCGTGCC TGTACTACGA CATCAAGCGG TGCCTGGGTC CGTGCGTGCC GGGTCTGGTC 
AATCAGAACG ATTATCGCGC AACGGTTGAA TCGGTCTGTC GCTTCCTCGA AGGCAAGAGC 
GACCTGGTGG CGAAAATATT GCGCCGTCAA ATGGAAGAAG CGGCGGAACG GCTCGACTTC 
GAGCGCGCCG CGCGACTGCG CGACAGCATC CGCGACATTG AACTGATCGG TCAGCGGCAA 
CAGGTGTTAC GCCACGATGA CGCCGACCAG GATGTCATTG GACTGGCGCG CGAGGAGGGG 
ATGGCAGTTG TTCAGGTGCT CCGCATTCGC GCAGGAAAAT TGATCAGCGC CGAGTCGTTC 
CCGTTGCAAA ATGCCGAAGG GGAACGTGAT GAATCTCTGC TGGCTTCGTT CCTGACGCAG 
TTCTACGATG CTGCCGCCGA ACTTCCGGCG ACACTGCTGC TGCCTGCGCC ACTCGACGAC 
CTGGCAATCA TCGAGCAATG GCTGGCGCAA AAAGCCGGGC GCAAAGTTGC GCTGCACACA 
CCGCAACGTG GTGAAAAGCG CCGCCTCGTC GAACTTGCCG AGCAGAACGC TCGCCAGAAA 
CTCGATGAAT TGCGTCTGCA ATGGCTCAAC AGCGAACAAC GCGCCGTGGC GGGGTTGACC 
GAAGTGCGCG ATCTGCTCGG TTTGAGCGCA CTGCCGACAC GCATCGAGTG CTTCGATGTT 
TCCAACACGC AGGGCAGCCA TTCGGTTGGG GCAATGGTCG TCTTTGAGCA TGGTGAACCG 
AAGAAGAGCC GCTACCGCAA ATTCAGGATC AAAACCGTTG AGGGCGCGAA CGATGTCGCT 
TCGATCCAGG AAGTGCTGCG GCGGCGTTTC CGGCGTGCTG CCATGGTCAT CGGCGAAGAG 
GAACAACCGG CGGACGAGCG CGTTGTCAAC GGTCAGACCG ATGCCGCAGA GCAGGAAGAT 
GGGGAGAAGA CCGATGCGCC GGGATCACAG TCCGACCTCG AACGCCAGGA GACCTGGGCT 
GAACTGCCCG ACCTCATCCT GATCGACGGC GGCATTGGCC AGGTGAATGG CGCATTACAC 
GTGCTGCGCG ACCTGTGCTT CGAGCATATT CCGGTCGTTG GAGTCGTCAA GGGTCCGAAC 
CGTGACCGCT TCGATCTGCT GATCCCCGGC GCGAGCGATC TCATCGTTCT CGAGCGCGAG 
AGCGCCGCGT TGCGTCTTAT CCGGCGGATT GACGAAGAAG CCGACCGTTT TGCGAAAGAT 
TATCACCGCA AACTGCGCAG CAAATCGGCG ACCGCGTCGC GCCTGGAAGA GATCCCCGGC 
ATCGGCCCGA AGCGGCGCCA GTTGCTGCTC AAACGCTTTG GCTCACTCGA CGGCATTCGC 
AACGCAACCG TTGACGAAAT CGCCGCCGTA CCGGGCATGA CGCGCAAGGC GGCTGAGGAG 
TTGAAGAGCC TGTTGTAG

Protein sequence

MSDLMHTTVA DPIALEERLR AVPLAPGVYL WKNAQGKIIY IGKSKRLRDR MRSYFARTDD 
PYGKTARLVA QIADFQVIVT SNELEALLLE MTLIKQHRPR FNVLLKDDKS YPYIKVTLHE 
PWPRIVATRN PRWEEGARYF GPYSSAGAVY RTLDQLNRLF AFRPPSRCPD DKFNRHRRLG 
KPCLYYDIKR CLGPCVPGLV NQNDYRATVE SVCRFLEGKS DLVAKILRRQ MEEAAERLDF 
ERAARLRDSI RDIELIGQRQ QVLRHDDADQ DVIGLAREEG MAVVQVLRIR AGKLISAESF 
PLQNAEGERD ESLLASFLTQ FYDAAAELPA TLLLPAPLDD LAIIEQWLAQ KAGRKVALHT 
PQRGEKRRLV ELAEQNARQK LDELRLQWLN SEQRAVAGLT EVRDLLGLSA LPTRIECFDV 
SNTQGSHSVG AMVVFEHGEP KKSRYRKFRI KTVEGANDVA SIQEVLRRRF RRAAMVIGEE 
EQPADERVVN GQTDAAEQED GEKTDAPGSQ SDLERQETWA ELPDLILIDG GIGQVNGALH 
VLRDLCFEHI PVVGVVKGPN RDRFDLLIPG ASDLIVLERE SAALRLIRRI DEEADRFAKD 
YHRKLRSKSA TASRLEEIPG IGPKRRQLLL KRFGSLDGIR NATVDEIAAV PGMTRKAAEE 
LKSLL