Gene Mbur_1913 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbur_1913
Symbol
ID	3997705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcoides burtonii DSM 6242
Kingdom	Archaea
Replicon accession	NC_007955
Strand	+
Start bp	2004608
End bp	2005624
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	44%
IMG OID	637959656
Product	flap endonuclease-1
Protein accession	YP_566545
Protein GI	91773853
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID	[TIGR03674] flap structure-specific endonuclease

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTACGG ATATTGGTGA TCTACTTCTT AAGGATACGA TCGAGATAGC TGGCCTTTCA 
AATAAAGTAG TGGCTATCGA TGCGTATAAT ACTCTTTATC AGTTCTTAAG TATAATCCGG 
CAACGTGACG GAACCCCTTT AAAGGATTCC AGGGGTCAGA TCACTTCTCA TCTTTCGGGT 
ATCCTTTATA GGCTTACCAG TCTCATCGAA GCAGGTGTCA AACCTATTTT TGTCTTTGAT 
GGCAAGCCTC CTGATTTCAA ATCTGACACT CTGGCAAAAC GGCATGAGGT CCGGGAAAGT 
GCAACTGCTA AATGGGAAGA TGCAAAAGCG CAGGGGCTTG AGGAAGAAGC CTACAAGTAT 
GCACAGGCCT CCTCAAAAGT GACCCGTGAG ATGATCGATG ATTCTGTCAG ACTATTGGAA 
TTGATGGGTA TCCCTTATGT GAAAGCACCC TCTGAGGGAG AGGCACAGGC CTCATACATG 
GTGCAAAAAG GGGATGCTGA TTATATCGGT TCACAGGACT ATGATTCTTT TCTTTTCGGT 
GCACCACAGG TTGTTCGAAA TCTCACTATT ACCGGTAAGC GAAAGCTTCC AAAAAAGAAC 
ATCTACGTGG ATGTTAAACC CGAGGTCTTG TCCCTTGTGG ATTCCCTTGG GGAACTTGGC 
ATTACAAGAC AGCAATTGAT CGATATTGCC ATGTGTGTGG GCACAGATTA TAATACCGGT 
CTCGAGAACA TCGGTCCGAA AAGAGCGCTT AAACTGGTGA AGGAACACGG CGATATAAAA 
GTTGTACTCA AAGAACTTGG TAAAGATATC GAAGACCTTG ATGCTAAAAG AGATTTCTTC 
ATGAACCCGC CCGTAACAGA CGATTATGAA CTGAAATGGA TCAAGCCTGA TCGTGCCGGG 
GTAATTGATC TTCTCTGCAA AAAACATGAT TTTTCAGAGG AGAGGGTCAA TAAAGCACTT 
GACCGCCTTG AAGCTAACAT AGGCGGCAGT CAAAGCACTC TTGATCAATG GTTTTAA

Protein sequence

MGTDIGDLLL KDTIEIAGLS NKVVAIDAYN TLYQFLSIIR QRDGTPLKDS RGQITSHLSG 
ILYRLTSLIE AGVKPIFVFD GKPPDFKSDT LAKRHEVRES ATAKWEDAKA QGLEEEAYKY 
AQASSKVTRE MIDDSVRLLE LMGIPYVKAP SEGEAQASYM VQKGDADYIG SQDYDSFLFG 
APQVVRNLTI TGKRKLPKKN IYVDVKPEVL SLVDSLGELG ITRQQLIDIA MCVGTDYNTG 
LENIGPKRAL KLVKEHGDIK VVLKELGKDI EDLDAKRDFF MNPPVTDDYE LKWIKPDRAG 
VIDLLCKKHD FSEERVNKAL DRLEANIGGS QSTLDQWF