Gene Cmaq_1972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1972
Symbol
ID	5708446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	2048560
End bp	2050005
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	47%
IMG OID	641276482
Product	prolyl-tRNA synthetase
Protein accession	YP_001541778
Protein GI	159042526
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00408] prolyl-tRNA synthetase, family I

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTAGGG GGCCTCAGGG GAGGCCTAGG AGTAGGTGGG TTTCATTCAT TGAGTGGTTT 
AATAAGGTAA TAATGGATGC TGAAGTGTAT GACTACAGGT ACCCTGTTAA GGGGGCCTAC 
ATATGGAGGC CTTACGGTGT CGCTATTAGG CGTAATGTGG AGGCGTTAAT ACGTCGCCTA 
CATGATGAGA CAGGGCACCA GGAGGTATTA TTCCCCGTGT TCATCCCCTA TGAGTTCTTC 
TCAAAGGAGA GTGAGCATAT TAGGGGTTTT GAGAGTGAAG TCTTCTGGGT TAGTAAGGGT 
ACTGGTGGTG AGGAGCGCCT AGTGTTGAGG CCGACCAGTG AGACTGCTAT GATGCCTATG 
TTTAAGCTTT GGATAAGGGA TCACACGGAT TTACCATTGA GGGTGTATCA AATAGTCAGT 
GTGTTTCGTG CTGAAACAAA GATGACTCAC CCAATGATTA GGCTTAGGGA GATTTCAATG 
TTTAAGGAGG CTCACACTGC CCATGCGGAT AGGGATGATG CTGAGAGGCA GGTTAAGGAG 
GCTGTAGGCA TATATAGGAG GATTATGGAT GAATTATGCA TACCGTACTT AATAAGTAGG 
AGACCGGATT GGGATAAATT CGCAGGTGCA GTATACACCA TAGCCTTCGA TACAATAATG 
CCCGACGGTA GGACAATGCA AATAGGCACT GTTCACTACC TGGGTGAGAA CTTCTCAAGG 
GTTTTTGACG TGAAGTACCT GGGTAAGGAT GGGCAAATGC ATTACATTCA CACCACCAGT 
TACGGAATAT CTGAGAGAAT CATAGCGTCA ATGATCGCTG TTAACGGTGA TGATAGGGGT 
TTACTCCTAC CCCCAAGGTA CGCTCCAATT CAAGTAGTGG TAATACCGAT AATGTATGGT 
GAGGATCAAA GCGTATTGAA TTACGCTAAG GGTGTAAGCG GTGAATTACT TAATGCCGGT 
GTGAGGGTTC ATGTTGATGA TAGGAGGGAT AAGACACCTG GCTGGAAGTA CTACCACTGG 
GAGCTTAAGG GTGTTCCAAT TAGGCTGGAG GTGGGGCCGA GTGATGTTAA GGATAATGCA 
GTAACATTAA CCAGGAGGGA TACATTCGAG AAGTATGCCG TGGAGAGGAG TAATGTCGTT 
GATGCCGTGA GGGAATTAAT GAAGGCTATA GAGGATAATA TGCGTAAGTC AACGTGGGAG 
TGGTTAAGGA GCCACGTTAG GAGAAGCAGC AATGTAAGTG AAGCTAAGGC ATTGCTCAAT 
GAGGGTGGTG TGGTTGAGGT TCCGTGGAGT GGCGATGATG AATGCGGTAG GAGAATAATG 
GAGCTCACTG AATCCGATGC ATTAGGCATA CCACTGGATA CTGATGAAAC CCCAAGTGAC 
CTTCGTGACG CAGCCTGCAG TGAGAAGAAG GCTGAGTACT GGCTTAGATT ATCAAGGAGG 
TATTAA

Protein sequence

MVRGPQGRPR SRWVSFIEWF NKVIMDAEVY DYRYPVKGAY IWRPYGVAIR RNVEALIRRL 
HDETGHQEVL FPVFIPYEFF SKESEHIRGF ESEVFWVSKG TGGEERLVLR PTSETAMMPM 
FKLWIRDHTD LPLRVYQIVS VFRAETKMTH PMIRLREISM FKEAHTAHAD RDDAERQVKE 
AVGIYRRIMD ELCIPYLISR RPDWDKFAGA VYTIAFDTIM PDGRTMQIGT VHYLGENFSR 
VFDVKYLGKD GQMHYIHTTS YGISERIIAS MIAVNGDDRG LLLPPRYAPI QVVVIPIMYG 
EDQSVLNYAK GVSGELLNAG VRVHVDDRRD KTPGWKYYHW ELKGVPIRLE VGPSDVKDNA 
VTLTRRDTFE KYAVERSNVV DAVRELMKAI EDNMRKSTWE WLRSHVRRSS NVSEAKALLN 
EGGVVEVPWS GDDECGRRIM ELTESDALGI PLDTDETPSD LRDAACSEKK AEYWLRLSRR 
Y