Gene Mthe_1443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1443
Symbol
ID	4461897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	1542346
End bp	1543563
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	55%
IMG OID	639700462
Product	replication factor A
Protein accession	YP_843857
Protein GI	116754739
COG category	[L] Replication, recombination and repair
COG ID	[COG1599] Single-stranded DNA-binding replication protein A (RPA), large (70 kD) subunit and related ssDNA-binding proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGATA TTGAGCAGAT CATATCCAGG CTCAGCGAGC TTGGGGTCGA TGTCAACATC 
GAGGATGTGG AGAATAGGTA CCGTCTTCTT GTCGACAAGT TTCAGGTCCC TCCTCGGGAG 
GCGCAGAGAA GCGTTCTGAA TTTTTATTTG AAAGAGAAAG GCATCGCGCT CCCCTCCAGA 
AAGAGCGAGC AGGTGAAGAT AAACCAGATC CGCGAGCCTG GAAGGTGGGT GGACCTTGAG 
GCGAAGGTTC TGAGCCTCTT CGAATCACCC AGCCCGGCTA TCTCCCAGGC AGGGATCCTG 
GGAGATGACA CAGGAAACAT ACGGTTCGTC AAGTGGGCGA AGTCCGGGCA GCCAGACCTT 
GTCGAGGGAA AGAGCTATCT CCTAAAGAAT CTCGTAACTG ACGAGTTCCA GGGAAGGTTC 
AGCGTCAAGA TAAACAGAAG CACCGAGATC GCGGAGCTCG ACAGAGAGAT CGAGTCTGTT 
GTGCTTCCAC AGAGCTCCGC AGATTACAGG GTTGTGGACA TCAGCGGGCC AGGGCAGTGG 
ATCAACCTCC GGGCCAAGGT CGTCCAGCTC TGGGAGCCCT CAAGCGAGTC GATCCAGCAG 
CAGGGCCTGC TCGGAGATGA GACCGGAGTC GTTAGGTTCG TCAAGTGGGC GAAGTCCGGG 
CAGCCAGACC TTGTCGAGGG AAAGAGCTAC CTCCTAAAGA ATCTCGTAAC TGATGAGTTC 
CAGGGAAGGT TCAGCGTCAA GATAAACAGA AGCACGGTCA TAGAGGAGAC CGACGAGCCC 
ATAGAGGTAT CTCTAAACAG AAGGATCACA GGTGCCATAG TGGATATACA GAAAGGCTCT 
GGACTGATCA AGAGGTGCCC GACATGCAGG AGGCCGCTCT CCAAAGGTAT GTGCACAGAT 
CACGGGAAGG TTGAGGGCGT ATACGATCTC AGAGTGAAGG CTGTAATAGA CGATGGCCTC 
GTCGCTCAAG ACATACTGAT AAACCGCGAG CGCGTTGAGG AACTCATCGG CCTCACCATG 
GAGCAGGCGA AGGAGATGGC CATAGAGGCG CTGGATCACG AGGTCGTCCT CGCGCTCATC 
GAGGAGAAGC TGATAGGAAG GTACTTCGAG GTCACCGGGC CAGTTAGGGA CAGGTATCTG 
CTCGTGGACA GCATAAATGA GATGACCTTC AGCGATGATG ATGTCTCCCT GCTCGTGAGC 
AGGGCGGAGG GACTATGA

Protein sequence

MEDIEQIISR LSELGVDVNI EDVENRYRLL VDKFQVPPRE AQRSVLNFYL KEKGIALPSR 
KSEQVKINQI REPGRWVDLE AKVLSLFESP SPAISQAGIL GDDTGNIRFV KWAKSGQPDL 
VEGKSYLLKN LVTDEFQGRF SVKINRSTEI AELDREIESV VLPQSSADYR VVDISGPGQW 
INLRAKVVQL WEPSSESIQQ QGLLGDETGV VRFVKWAKSG QPDLVEGKSY LLKNLVTDEF 
QGRFSVKINR STVIEETDEP IEVSLNRRIT GAIVDIQKGS GLIKRCPTCR RPLSKGMCTD 
HGKVEGVYDL RVKAVIDDGL VAQDILINRE RVEELIGLTM EQAKEMAIEA LDHEVVLALI 
EEKLIGRYFE VTGPVRDRYL LVDSINEMTF SDDDVSLLVS RAEGL