Gene Msed_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_2049
Symbol
ID	5105271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1971082
End bp	1972413
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	46%
IMG OID	640507939
Product	replication factor C large subunit
Protein accession	YP_001192113
Protein GI	146304797
COG category	[L] Replication, recombination and repair
COG ID	[COG2256] ATPase related to the helicase subunit of the Holliday junction resolvase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTTC CCTGGGTGGT TAAGTACAGA CCAAAGACCC TAGATGACGT GGAGAATCAG 
GAGGACGTAA AGGACGAGTT GAGGTCTTGG ATAGATTCTT GGCTTAAGGG ATCTCCCTCC 
TCCACGGCAG TAATGTTATA TGGTCCTCCT GGGACCGGGA AAACCTCCTT GGCTATAGCG 
TTGGCCAATA CCTACAAACT TGAGCTCGTG GAGACCAATG CCAGCGATAC CAGAAACTTG 
ACCTCACTTA GGGCAATAGT GGAGCGGGCT TCAATTAGTG GTTCTCTCTT TGGAATTAGG 
GGAAAGCTAA TCTTTCTCGA TGAAGTGGAT GGAATTCAAC CAAAGCAAGA CTACGGAGCA 
GTATCAGCAA TTCTAGAGAT AATTAAGAAC ACGAAGTATC CCATATTGAT GGCTGCTAAC 
GATCCATGGA ATCCGAATCT ACGTGATCTT AGAAATGCGG TGAAGATGAT TGAGGTAAAA 
AAACTTGGGA AGATCGCTAT GAGGAGATTA CTCAAAAAAA TCTGCTCTGG CGAGAAAATT 
AAGTGCGAGG ATAACGCGTT GGATCAGATC ATAGAGGCCT CAGACGGCGA CTCTAGATAC 
GCAATAAATT TCCTTCAATC CATTGCTGAG GGATATGGAG AGGTCACGGA AAAGCTGGTA 
AGTGAGCTAG TAAGAAGAAA GGAGAGGGAG CTAGATCCCT TTGAGACTGT CAGGAGCGTG 
TTTTGGGCAA GATATGGTTG GCAGGCCAAG CAGGCAGTGT CTAACTCCCA GGTCGAATAT 
GATCTTCTAA TGAGATGGTT ATCCGAGAAC ATACCGATTC AGTATGAAAT GTTAAATGAT 
ATATGGAGAG GTTACGACGC CCTAGCTAGG GCATCTATCT TCCTCACAAG GGCCAAGCTT 
TCCAGCTGGG ATATGCTAAG TTACACCTTT GACCTTATGG GTCCAGGTGT TGCAATGGCC 
GAAGTGGAGA AGAAGAGTCC CTCGTGGAAA GCGAAGTGGA AGAAGTACCA ATTCCCTACC 
CTAGTACAGC AATTGTACAA ATCTAAGAGG ACTAGGGATA CTAGGGATCA GATAATCAAG 
AAGATAGGAT TCCACCTACA TTCCTCTTCG ACTAAAATTT ACAACGACGT GTTCCCGTTC 
TTCCTTATCA TGACATCAAA GGACTTGGAT GAGCTGGCGA AGAACCTAGA TCTTAGTCCA 
GAGGAGATTG AGTTCATTCA GTCCTCACAG GTAAGGGATG TGGCCTTGAA GGAAACTGGA 
TCTACTGCAC AGCCCTCTGA GAGAACTTCT AGGTCTAGAA CGACCTCTAA ATCCAGGTCT 
AAGAAACCTT GA

Protein sequence

MTVPWVVKYR PKTLDDVENQ EDVKDELRSW IDSWLKGSPS STAVMLYGPP GTGKTSLAIA 
LANTYKLELV ETNASDTRNL TSLRAIVERA SISGSLFGIR GKLIFLDEVD GIQPKQDYGA 
VSAILEIIKN TKYPILMAAN DPWNPNLRDL RNAVKMIEVK KLGKIAMRRL LKKICSGEKI 
KCEDNALDQI IEASDGDSRY AINFLQSIAE GYGEVTEKLV SELVRRKERE LDPFETVRSV 
FWARYGWQAK QAVSNSQVEY DLLMRWLSEN IPIQYEMLND IWRGYDALAR ASIFLTRAKL 
SSWDMLSYTF DLMGPGVAMA EVEKKSPSWK AKWKKYQFPT LVQQLYKSKR TRDTRDQIIK 
KIGFHLHSSS TKIYNDVFPF FLIMTSKDLD ELAKNLDLSP EEIEFIQSSQ VRDVALKETG 
STAQPSERTS RSRTTSKSRS KKP