Gene Cmaq_0247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0247
Symbol
ID	5710100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	281217
End bp	282374
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	44%
IMG OID	641274749
Product	type I phosphodiesterase/nucleotide pyrophosphatase
Protein accession	YP_001540085
Protein GI	159040833
COG category	[R] General function prediction only
COG ID	[COG1524] Uncharacterized proteins of the AP superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGTGG TTAAGCCTGA TTACAGTGGA GGGAGTTTGC TTAACTTATC ATCATCCATA 
TGCGACTTCC TGGGTGTTAA GAATCAGCAC CCGAGGCTAA GGAGTATTGA TGGTGTTCAG 
GGTAGGAGGA TACTGCTGCT TCTCATCGAT GGTTTAGGTT ATGTCCATTT AAAGCGATAC 
TGCAGTAATT GTGAGGAGGC TAAGTGGCTT GGTAATGTTG AGGAGTTAAC TAGTGTATTT 
CCATCAGTGA CCTCAACAGT CTTAACAACA TTATCAATGG GAGTACCCCC TGGGGTTCAT 
GGTGTATTGG GCACGGTCAT GTATGTTAAG GAGGCTGGTA GCTTGGTTAA TACTTTAACA 
ATGGGTTTAA TGCCTGATGG GAGGAGGGGG GAGTTGAGGG ATATTGGCTA TGACCCTAGG 
GTTATCTTCT ACGGTGGCTC AACAATATTT GAGGAGGCTA AGTTAAATGG ATATAATTCA 
CTGGTTATTA CCCCAAAGGG TATAAGCGGG GGCTTATCAG ACTTAATATA CAGGGGTACT 
GAGGTTAAGG AGTACGTGAG CGTTTACGAT GCCTTAGTAC TAGCCTCCAG GGCCCTTGAG 
AATAACACCC TCGTGTACGT TTACATACCC ACCCTGGATT CGATTCAACA TGAGTATGGC 
CCAGAGTCCG AGGAGTATAG GGTTGCCTTA ATTGAGCTAC TGAATACACT AGGTAGGTTA 
ATTAGGCATC TGCCTCAATC AACTACAGTA GTGTTAACTG CTGATCATGG TCAAGTCCAG 
GTTGGTCAGG GTGATGTAGT GAACTTAAGG GTAATGACTA GGTTACTGGA TTCATTGTCA 
GTGGCGCCTT ACGGTGAACC AAGGGCTCTT CAACTCAAGT TAAGTGACAA GTCACTTAAG 
AATGAGGTTA AGGATGCCTT ATCCTCAATG GGTAGGAAGC TACTTATTTA CGATTCAAGT 
GAAGTTAAGG AACTATTGGG TGGGGTTACT GAGTACACTG AACAGAGGAT GGGTGACCTA 
TGGGTTATAC CACTCGACAC CACTGCCTTA ATCTACCTGT ATAGGCTTAA TGATGATAAG 
GTGGCTAAGT TTAAAGGTCA TCACGCTGGT TTACTTGATT ACGAAATGAA GGTTCCCTTA 
TCCATAATAA ACCTTTAA

Protein sequence

MSVVKPDYSG GSLLNLSSSI CDFLGVKNQH PRLRSIDGVQ GRRILLLLID GLGYVHLKRY 
CSNCEEAKWL GNVEELTSVF PSVTSTVLTT LSMGVPPGVH GVLGTVMYVK EAGSLVNTLT 
MGLMPDGRRG ELRDIGYDPR VIFYGGSTIF EEAKLNGYNS LVITPKGISG GLSDLIYRGT 
EVKEYVSVYD ALVLASRALE NNTLVYVYIP TLDSIQHEYG PESEEYRVAL IELLNTLGRL 
IRHLPQSTTV VLTADHGQVQ VGQGDVVNLR VMTRLLDSLS VAPYGEPRAL QLKLSDKSLK 
NEVKDALSSM GRKLLIYDSS EVKELLGGVT EYTEQRMGDL WVIPLDTTAL IYLYRLNDDK 
VAKFKGHHAG LLDYEMKVPL SIINL