Gene Cmaq_1960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1960
Symbol
ID	5708457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	2034902
End bp	2037853
Gene Length	2952 bp
Protein Length	983 aa
Translation table	11
GC content	44%
IMG OID	641276469
Product	leucyl-tRNA synthetase
Protein accession	YP_001541766
Protein GI	159042514
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0495] Leucyl-tRNA synthetase
TIGRFAM ID	[TIGR00395] leucyl-tRNA synthetase, archaeal and cytosolic family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATAGCTGAGA AGTGGCAGGA GGAATGGTAT AGTAATGGGG TATTCAATGC TAATCCAAGT 
AATTCAAGGC CTAAATTCTT CATAACTGTG CCTTACCCGT ACATAGAGGG TCCACCCCAC 
ATGGGTCACG GTAGAACATT CACCGTGGGT GATGTCGTGG CCAGGTTTAA GAGAATGATG 
GGTTACAACG TGTTATTCCC AATAGCATTC CACATAACTG GTACACCCAT TCAGGCCGTT 
GCGGATAGGT TAAGTAAGGG GGATGTGGAG TATGAGAATA GGTTGAGAAG GGAGGTTAAC 
ATGTATGTTA AGGATCCTGT TAAGGCAAGT GAAATAGTCA ATGGCTTTAA GGATCCTTGG 
AACATTGTTA ACTTCTTCAA GGGTACGTAC ATTAATGACT TTAAGTCAAT AGGCTACTCA 
ATGGATTTCA GGAGAATATT CATGACAGGT GACCCACATT ACAGCTCCTT CATAATCTGG 
CAGTACGTTA AATTAGCCTC AAAGGGCTAC TTAGTGAGGG GGCGTCATCA AGTCCTCTAC 
GCACCTGATG AGAATCAGGC AGTGGGTGAA CATGACATTA GGGGTGGGGA TGAGTTAAAA 
ATAGACATAC TGCAGTTTAA TCTACTGAAG TTTAAGTTAA ATGACTCATA CCTAGTAGCC 
GCAACCCTAA GGCCTGAGAC AATATATGGG GCAACCAATG TTTGGGTTAA CCCAGATTCA 
ATTTACGTTG AGGCTATTGT TAATGGGGAG AGGTGGATTA TTTCAAAGGC CGCTGCATGG 
AAGCTTCAGT ACCAGGATAA GGATGTTAAG GTTCTGAGGG AGTTTAAGGG TAGTGAACTT 
GTGGGTAAGT TTGTTGAAAG CCCAATAGGG GTTAAGTTAC CCATACTGCC AGCTTCCTTC 
GTTGACGATG ACACAGCCAC TGGGGTTGTG TACAGTGTTC CTGCACATGC ACCCTATGAT 
TACGCAGCGT TAATGGACTT GAAGAGTAAT GATGAATTAC TCAGGAGGTA CGGTATTGAG 
AGTATTGTTA AGGCAATTGA GCCAATAAGC ATAATTAAAT TACCTGGATT CAGCAAGTAC 
CCGGCTAGGG ATGTTATTGA GAAGCTGAAT GTTAAGAACC AGAATGATAG GGAGAGGTTA 
GATGAGGCAA CCAGCATAGT GTACAGGGAG GAGTACTATA ATGGAGTCAT GGGTGATAAT 
ACCCCATTCA ACGGTGTTAA GGTTAATGAT GCTAGGGTTA AGGTAACGGA GGAGTTGAGG 
GGTAGGGGAT TATTAGACGT TATGTATGAG ATTGAGCCTA GGAGAGTGTA CACTAGGGGT 
GGTTCAAGGG TTATTGTGGC GGTGATTAAG GATCAATGGT TCCTTAACTT CGGTGACCCA 
ACTTGGAAAA GCCTAATGCT TAAGGCCCTT GATAACATGA AGATAATACC TGAGGAGTAT 
AGGCAAAACT TCAAGGCGAC CCTAGATTGG TTAAACATGA GGCCCTGCGC CAGGAAGAGG 
GGATTAGGCA CCAGGATGCC GTGGGATCCT GATTGGGTTA TTGAATCGTT AAGCGACTCA 
ACAATCTACA TGGCCTTCTA CACAATAGCC CATAAACTTA ATGAAACCGG GTTAGCCGTT 
AAGTTGGGTG AGTTGGCTAA GAGGGTTATT GAAACTAAGG CTGAGGATTC AATTGCCTTA 
AATAAATTAG TGAGCTTCTA TGATTACGTA TTCCTAGGTC AAGGAGACCC TGAGACCATC 
GCTAAATCAC TGGGTGTTGA TAAAAGCATT ATTGAGGGTA TTAGGGCTGA ATTCGAGTAC 
TGGTACCCTG TTGATCAAAG GCATAGTGGT ATAGATTTAA TATCAAATCA CCTAAGCTTC 
TTCATAGCCC ATCACGCCGC AATATTCCCT GAAAGGCACT GGCCCAGGGC AATATCCGTG 
AACAACTACG TAATTAGGGA GGGGAGGAGG ATGAGTAAGT CCCTAGGCAA CGTCATTTAC 
CTTAAGGAGG CTGTTGAACA GTATTCACCA GACTTAGTGA GACTATACGT CTCCTACTCG 
GCGGACTTGG ATAATGTAAT GGATTGGAGG AGTGACGAGG TTGATACAGT GCTTAGTAGG 
TTAATGGATA TTTGGAATAC GGCTCAAGTC ATAGTAAGCA TGGGTGAGGA AACTAAGGAA 
CCCAGTAACC CAACAATACC CACTAAATGG CTGTTAAGCA TCCTAAATAG GACTATTACT 
GAGGGTGCTA AGGCCCTTGA GGAGATGAGG ATTAGGCAAT TTGCATTAAT GGTATTCTTC 
AACCTATATG ATGCAGTGAG GGTATACATG ACGTTGATGG ATGAGTTACC TAAGGATGAG 
GTGAGGTACA CGCTATGGAA GGTTCTGGAT GCTTGGGTTA GGATGATGCA ACCGATTACA 
CCGCATATGG CTGAGGAGAT TTGGCACAGT ATGGGTAAGT CAACATACGT ATCCACTGAG 
AGGTGGCCTA CGGTGGAGCA GCAATACATT AATGATGATG TGGAGAACGC CTTCAAGGTG 
GTTGAGAGGC TTATAGATGA TATTAGGGAA GTCATTAGGG TTAGGGGTCA GGTTGGGGCT 
GTGAACATTT ACGTCGGCCC CCCTGATTAC GTTTACGATA TTTTCAATGA AGCCATTGAA 
ATGATGGACA GGGGCATTGC TGTTAAGGAT GTGATAAGGA ACCTGGCCAG TAAGTATAAG 
GGTAAGGGTG AGGTGGTTGC TAGGATTGTT AACGATATTG CTGACGGTAA GTTACCTAGG 
TTTAAGTTAT CAAGGGATAT GGAGATGAGT GTAATGCATA GTTTCAAATC GTACATTGAG 
AGGAGGCTTG GCATTAAGGT AACCATACAG GATGCAGTGG CGCCCATTAA TGACCCAGCC 
AATAGGGCTA GGTTATCGCT ACCAGGTAGA CCCGCTATTT ACATTGAACC CACATACACT 
AATATATATT AA

Protein sequence

MAEKWQEEWY SNGVFNANPS NSRPKFFITV PYPYIEGPPH MGHGRTFTVG DVVARFKRMM 
GYNVLFPIAF HITGTPIQAV ADRLSKGDVE YENRLRREVN MYVKDPVKAS EIVNGFKDPW 
NIVNFFKGTY INDFKSIGYS MDFRRIFMTG DPHYSSFIIW QYVKLASKGY LVRGRHQVLY 
APDENQAVGE HDIRGGDELK IDILQFNLLK FKLNDSYLVA ATLRPETIYG ATNVWVNPDS 
IYVEAIVNGE RWIISKAAAW KLQYQDKDVK VLREFKGSEL VGKFVESPIG VKLPILPASF 
VDDDTATGVV YSVPAHAPYD YAALMDLKSN DELLRRYGIE SIVKAIEPIS IIKLPGFSKY 
PARDVIEKLN VKNQNDRERL DEATSIVYRE EYYNGVMGDN TPFNGVKVND ARVKVTEELR 
GRGLLDVMYE IEPRRVYTRG GSRVIVAVIK DQWFLNFGDP TWKSLMLKAL DNMKIIPEEY 
RQNFKATLDW LNMRPCARKR GLGTRMPWDP DWVIESLSDS TIYMAFYTIA HKLNETGLAV 
KLGELAKRVI ETKAEDSIAL NKLVSFYDYV FLGQGDPETI AKSLGVDKSI IEGIRAEFEY 
WYPVDQRHSG IDLISNHLSF FIAHHAAIFP ERHWPRAISV NNYVIREGRR MSKSLGNVIY 
LKEAVEQYSP DLVRLYVSYS ADLDNVMDWR SDEVDTVLSR LMDIWNTAQV IVSMGEETKE 
PSNPTIPTKW LLSILNRTIT EGAKALEEMR IRQFALMVFF NLYDAVRVYM TLMDELPKDE 
VRYTLWKVLD AWVRMMQPIT PHMAEEIWHS MGKSTYVSTE RWPTVEQQYI NDDVENAFKV 
VERLIDDIRE VIRVRGQVGA VNIYVGPPDY VYDIFNEAIE MMDRGIAVKD VIRNLASKYK 
GKGEVVARIV NDIADGKLPR FKLSRDMEMS VMHSFKSYIE RRLGIKVTIQ DAVAPINDPA 
NRARLSLPGR PAIYIEPTYT NIY