Gene Cmaq_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0040
Symbol
ID	5710318
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	54915
End bp	55967
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	46%
IMG OID	641274543
Product	flap endonuclease-1
Protein accession	YP_001539884
Protein GI	159040632
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID	[TIGR03674] flap structure-specific endonuclease

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTGTTA CTGAGCTTGG TAAGCTTATT CCAGATAACT TGAGGAGGAG GGTGAGTCTT 
GAGCAGCTTA ACGGTAAGTT AATAGCGTTA GATGCGTATA ATGCTCTTTA TCAATTCCTA 
GCATCAATAA GGCAACCCGA TGGTACACCG CTCATGGATT CCCAAGGCAG GGTCACCAGT 
CACTTAAGTG GATTACTCTA CAGGACAATT AACCTGCTTG AGTATGGTAT TAAACCAGTC 
TATGTGTTTG ATGGTAAGCC CCCTGAATTG AAGCTTATTG AGATTGAGAA GAGGAGGAGG 
GTTAGGGAGA AGGCTGTGGA GGATTGGATT AAGGCTGTTG AGGAGGGTAA GAAGAGTGAG 
GCTAGGAAGT ATGCGCAGAG GGCATTATTC ATAACGAGTG ATATGGTTGA TGAGGCTAAA 
AGACTCCTAG ACTCCATGGG TGTACCCTGG GTTCAGGCTC CAAGCGAGGG GGAGGCTCAA 
GCGGCGTATA TGGCTAGTAA GGGTATCGTG TGGGCTGCCG GCAGCCAGGA TTACGACTCA 
TTCTTATTCG GTGCCCCTAG GCTTGTTAGG AACTTAACTA TTTCAGGTAG AAGAAAGTTA 
CCGGGTAGGG ATGAGTACGT TGAGGTTACA CCGGAGTTAA TAGAGTTGAA TGATGTTCTT 
AAGGCGCTTA GGTTAAGGGA TAGGGGTCAA TTAATAGACT TAGCCATACT ACTGGGTACT 
GATTATAATC CTGAAGGAAT ACCTGGTATT GGTCCACAGA GGGCTCTTAG GTTGATTCAG 
GAATATGGTA GCCTAGATAA ACTCATGAAT ACCGTGCTTA AGAACGCTCA ATTCCCCGTG 
GACCCCTTTA AAATAAGGGA ATTCTTCCTC AACCCACCAG TGACCCAGGA GGTTAATGTT 
AAGTTTAAGG AACCTAATGA GGATGAGGTA GTTAGGCTAC TTGTGGAGGA GCATGACTTC 
AGCCAAGACA GGGTTAAGAA TGCATTAGAA AGATTAAGAA AAAGCATGGG TAAGGCTAAG 
GGATCCACGA CCCTCGACTC ATTCTTCGGT TGA

Protein sequence

MGVTELGKLI PDNLRRRVSL EQLNGKLIAL DAYNALYQFL ASIRQPDGTP LMDSQGRVTS 
HLSGLLYRTI NLLEYGIKPV YVFDGKPPEL KLIEIEKRRR VREKAVEDWI KAVEEGKKSE 
ARKYAQRALF ITSDMVDEAK RLLDSMGVPW VQAPSEGEAQ AAYMASKGIV WAAGSQDYDS 
FLFGAPRLVR NLTISGRRKL PGRDEYVEVT PELIELNDVL KALRLRDRGQ LIDLAILLGT 
DYNPEGIPGI GPQRALRLIQ EYGSLDKLMN TVLKNAQFPV DPFKIREFFL NPPVTQEVNV 
KFKEPNEDEV VRLLVEEHDF SQDRVKNALE RLRKSMGKAK GSTTLDSFFG