Gene Mlab_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_0020
Symbol
ID	4795854
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	-
Start bp	21302
End bp	22783
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	54%
IMG OID	640098665
Product	hypothetical protein
Protein accession	YP_001029465
Protein GI	124484849
COG category	[L] Replication, recombination and repair
COG ID	[COG0514] Superfamily II DNA helicase
TIGRFAM ID	[TIGR00614] ATP-dependent DNA helicase, RecQ family [TIGR01389] ATP-dependent DNA helicase RecQ

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAAG GGATACAGCA GACACTGGAA AAATACTTCC ACCACCAGAC GTTCCGTCCT 
AACCAGCAGG AGATCATCGA AAAGATCGTC AGCGGGAGGG ACGTTCTCGC AGTGATGGCG 
ACCGGCGGGG GAAAATCCCT CTGTTACCAG CTCCCGGCCC TGATGCTTGA CGGGATGACG 
ATCGTCATCT CTCCCCTGAT TGCTCTAATG AAAGATCAAG TGGACTCGCT TTCGAATCAG 
GGGGTGACGG TCGAGACCTT AAACAGTCTG CAAACCTACG ACGAACGACG AAGAGTCGAG 
CAGGATATGC GTGACGGAAA AGTCAGGATC CTGTACGTCT CGCCGGAACG GGCAGTGACT 
CCGGCATTTT TTGCGACGCT TTCCGGCTGC AAGGTGGCGC TTTTTGCCGT AGACGAGGCA 
CACTGCATCT CGATGTGGGG TCATCAGTTC AGGCCCGAAT ATCGGGAGAT CAAACATCTG 
AGGGACAAGT TCCCGGGTGT TCCGATCGCC GCTTTTACCG CCACGGCTAC TCTTCGGGTA 
CGCGAAGATA TCGTAAACGA ACTGAGACTG AACGATCCCG CTGAATTCAT CGGAAGTTTC 
GACCGGAGAA ATCTCCGGTA CTCGGTATTT GCTGAGCCGA ATGCCCAGGT ACGGATGCAG 
AAAATTATCA GTTACGTCAC CGCCCACAAA GATGATCCGG GGATCATCTA CTGCTTCTCG 
CGGGCGAGTA CCGAAGAACT GGCGGAGCGC CTTCGAAAGG TGCATATCAT GGCAAATCCG 
TATCATGCCG GCCTGCCGAC CCCGGAACGG AGCCGGGTGC AGGAAGGATT TCTCAATAAC 
TCAATCAGGG TGATCTGTGC AACGGTGGCG TTCGGGATGG GGATCGATAA ACCTGACGTC 
AGATATGTGA TCCATGCCCA TATGCCAAAA GACATCGAGT CCTACTATCA GGAGACGGGA 
CGGGCAGGGA GAGACGGAAA AGCCGGGGAG TGCCTGCTGT TCTATTCGGG CGGCGACCGG 
CGCAAGATAG AAAATATGCT CGAACGTGAG TTCACCGATA AGAAAAAATC CGAGATCGCC 
CGGGAGAAGC TGGACCAGAT GTATGCCTAC TGCACGGCCA AATCGTGCCG AAGACAGCTG 
CTCCTTTCCT ACTTCGACGA AGAAATACAG CCCTGCGGGA ACTGCGATAC CTGCGGGGAC 
AAAAAAATAA AGCAGAGCAA GCCGGCGGGC AGTCTCACGA AGATGATCCT TACAGGAGTG 
CAGGATGTGG ACGGGATTCT AACGACGCCC GAGTTCATCT CGTTCCTTCT CGGTCTCGAA 
CGGGCAAAGA CGGTAAAACT TCAGCTGAAC ACGCATCCGT TGTTCGGTGC GGCGAACGGA 
AGGGAGAGAG AAGAGATCGA AAAGGAAGTC AGCAGTCTTC TCAAATCCGG CAGGCTCCGT 
CTTGAAGGAA AAACCGTTCG AAAACTGTGC TCAGGAAATT GA

Protein sequence

MTKGIQQTLE KYFHHQTFRP NQQEIIEKIV SGRDVLAVMA TGGGKSLCYQ LPALMLDGMT 
IVISPLIALM KDQVDSLSNQ GVTVETLNSL QTYDERRRVE QDMRDGKVRI LYVSPERAVT 
PAFFATLSGC KVALFAVDEA HCISMWGHQF RPEYREIKHL RDKFPGVPIA AFTATATLRV 
REDIVNELRL NDPAEFIGSF DRRNLRYSVF AEPNAQVRMQ KIISYVTAHK DDPGIIYCFS 
RASTEELAER LRKVHIMANP YHAGLPTPER SRVQEGFLNN SIRVICATVA FGMGIDKPDV 
RYVIHAHMPK DIESYYQETG RAGRDGKAGE CLLFYSGGDR RKIENMLERE FTDKKKSEIA 
REKLDQMYAY CTAKSCRRQL LLSYFDEEIQ PCGNCDTCGD KKIKQSKPAG SLTKMILTGV 
QDVDGILTTP EFISFLLGLE RAKTVKLQLN THPLFGAANG REREEIEKEV SSLLKSGRLR 
LEGKTVRKLC SGN