Gene Cmaq_1144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1144
Symbol
ID	5710144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	1200083
End bp	1201249
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	42%
IMG OID	641275643
Product	pyridoxal phosphate-dependent enzyme, putative
Protein accession	YP_001540961
Protein GI	159041709
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1921] Selenocysteine synthase [seryl-tRNASer selenium transferase]
TIGRFAM ID	[TIGR01437] uncharacterized pyridoxal phosphate-dependent enzyme

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.46182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.521262
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGTTT TGGATAAGTT AGGTGTACGT AAGGTTATTA ATGCCTGTGG TACACTCACA 
GTACTTGGTA GTAATAGGGT TAGTTCAAGG GTTTTAGAGG CAATGAGGGA GGTTGCGGAT 
TCCTTCATTG ATATGAATGA ACTCCTAGTT AAGTCAGGGG AATACATTGC CAAGTTACTA 
AATGTACCCG GTGCATTAGT AACAAGCGGT GCCGGAGCCG GCTTAGTACT GGCTGTTGCA 
GCAGCTATTA CTGAGGGTGA TGTGGATAAG ATGAGTAGGT TACCCTTCAC TGATGGGTTA 
AGGAATGAGA TTATTATCCA ATATCCACAC ACAGTGGGTA ATCCATACGT TTACCTCATT 
AATATTCCAG GGGGTAGAGT AAGGATTGTG GGTTCACCAA GTGGTGTTAA TGAAAACGAT 
ATTAAGAATG CCTTAAATAA AAACACAGCC GCAGTACTTC ACTTCCAGTA TGAGCCACAG 
GAGGGTGAGG TGCCTTTAAG TAAGGTTATT GATATTGCCC ATGAATTTAA CACGCCAGTT 
ATAGTTGATG CCGCTGCCGA ACTGCCACCA TTACTTAACT TAACAAGGTT CATTAAAATG 
GGGGCTGACT TAGTAGTGTT CAGTGGCGGT AAGGATATTG GTGCACCCGG TGATACAGGC 
TTGATTCTGG CTAATAATTT AAGGCTCCTT GAGGCGTGTA GGTTAATGAG CCCATTCAGT 
TACATTAATG TTAATGGGCA ATCCAGGGTA TTCATAGGTA GGGTAATGAA GATTAGTAAG 
GAGGATATTG TAGCCCTAGT CGCGGCACTG GAGGAGTACG TTAAGGTTAA TCATGAGGAG 
AGGTTAAGTG TAATGAATAA GATGGCTGAT GAAGTAATAA GTGAATTAAC CGCAGTATTA 
CCGGGTATTA GGATTGAGAA AAGGCTGAAT CATCCTGGGG AGAGGATAAG GCCGGTAACA 
GTACCTAAGG TTGAGATTAA GTTACCGAGA AGGTACACGG AATTATACAT TAAGTTACTA 
AGGGAGGGGG ATCCACCAAT ATACGCATGT GAATGTGAAG GTAATTTATG CATTAACATG 
CATACGTTAA GCCAGGATGA GGTTCCCATT GTTATTAACA GGTTAAAGGA GGTGATTAGT 
AGGTATCCGC CAGTAACTAA TCAATGA

Protein sequence

MGVLDKLGVR KVINACGTLT VLGSNRVSSR VLEAMREVAD SFIDMNELLV KSGEYIAKLL 
NVPGALVTSG AGAGLVLAVA AAITEGDVDK MSRLPFTDGL RNEIIIQYPH TVGNPYVYLI 
NIPGGRVRIV GSPSGVNEND IKNALNKNTA AVLHFQYEPQ EGEVPLSKVI DIAHEFNTPV 
IVDAAAELPP LLNLTRFIKM GADLVVFSGG KDIGAPGDTG LILANNLRLL EACRLMSPFS 
YINVNGQSRV FIGRVMKISK EDIVALVAAL EEYVKVNHEE RLSVMNKMAD EVISELTAVL 
PGIRIEKRLN HPGERIRPVT VPKVEIKLPR RYTELYIKLL REGDPPIYAC ECEGNLCINM 
HTLSQDEVPI VINRLKEVIS RYPPVTNQ