Gene Cmaq_1074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1074
Symbol
ID	5710373
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	1125054
End bp	1126127
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	47%
IMG OID	641275574
Product	pyridoxal-5'-phosphate-dependent protein beta subunit
Protein accession	YP_001540893
Protein GI	159041641
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0511297
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.236924
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCTTA ACTTAACTAA CATGAGCGGG GAGGTAACGT ACAAGTGCCC TAAATGCGGC 
TTCACAACCG AGGCTAATAC CTGGCTTATC AAGTGCCCTA GATGCGGGTC ACCGTTGAAT 
GTGAATTATG ATTTAAGGAG ACCTAGGGAG CTTAGTAGAA GTGAATTAAC GAGGATTCTA 
CCTGTTAAGG AGCCGTTAAG CCTTGGTGAA GGTTTAACCC CACTGGTTAG GAGGGGTGAT 
TACTACTTTA AGCTTGAGTA CCTTAACCCC ACTGGTTCAT TTAAGGATAG GGGGTGGAGT 
CTTGCCCTAT CAGTACTACG TAATGACGTC ACTGTGGTTG AGGATTCAAG CGGTAATGCT 
GGACTATCCC TAGCAGCATA CTCCGCGGTT AAGGGGGTTA GGGCTAGGAT TTACGTCCCT 
AAGACGGCCC CTGAGGCTAA GAAGAGACTT ATGAGGCTCC TAGGCGCTAA TGTGGTTGAG 
GCTGCAACTA GGGCTGATGC ATCATCACTT GCCATGAGCT TCACAGAGGG GGTTTACGTT 
GGTCATTCAT GGAACCCCTT CTTCATACAT GGCGTTAAGT TAATAGCTTA TGAACTAGCA 
TTAGAATTAG GGAACATTGA TAATGTTGTT GCACCCCTAG GTAACGGTAC CTTAACCCTA 
GGCCTATACT TAGGTTTCAA GGAGGCTGAG GAATTGAAGC TTATTAAAGA CACACCTAGG 
ATAATAGCCG TTGAGGCATC AGGCTACGAG TGGGCTTACA GTATGCTTCA CAACACACCC 
ATGGGTGTTA AGGCAACCTT ACCCGACGGC ATAATAGTGC CCCAGCCACC TAGGTTAACT 
CAGATAATTG ACGCGATACG GGACACTGGA GGTGACGTGG TGGTTGTTAA TGATCAGGGG 
GTTATTGAGG GGTTAAGGGA GGGTATTAGG TTAGGGTTCA TAATTGAGCC AACAAGCGCA 
GTTGTCTTTA AGGCCCTTAA GGAAGTGAAC CTAAGTGGCA CAACTGTAGT TATTTTAACG 
GGTTCAGGCT TAAAGCTGAG TAATGAACTG TATCGGTTAA TATACGGTGA ATGA

Protein sequence

MVLNLTNMSG EVTYKCPKCG FTTEANTWLI KCPRCGSPLN VNYDLRRPRE LSRSELTRIL 
PVKEPLSLGE GLTPLVRRGD YYFKLEYLNP TGSFKDRGWS LALSVLRNDV TVVEDSSGNA 
GLSLAAYSAV KGVRARIYVP KTAPEAKKRL MRLLGANVVE AATRADASSL AMSFTEGVYV 
GHSWNPFFIH GVKLIAYELA LELGNIDNVV APLGNGTLTL GLYLGFKEAE ELKLIKDTPR 
IIAVEASGYE WAYSMLHNTP MGVKATLPDG IIVPQPPRLT QIIDAIRDTG GDVVVVNDQG 
VIEGLREGIR LGFIIEPTSA VVFKALKEVN LSGTTVVILT GSGLKLSNEL YRLIYGE