Gene Msed_2213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_2213
Symbol
ID	5105433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	2123340
End bp	2125055
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	45%
IMG OID	640508106
Product	glycyl-tRNA synthetase
Protein accession	YP_001192275
Protein GI	146304959
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0423] Glycyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00389] glycyl-tRNA synthetase, dimeric type

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.472902
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.00000523773
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCAGAGT CTGACAAAGT GATCGAGTTA GCGAAGAGGA GAGGGATATT CTGGCCCTCC 
TATGAGATAT ATGGTGGAGT AGCTGGGTTG TATGATATAG GACCTGTTGG TGCAAGAATT 
AAGAACAAAA TAATTAATAC TTGGAGGAAA ATATTTGTTG AAGAGAACAG CGAATTTGTT 
GTAGAAATTG AAACTCCCAT GATAACTCCA TCTAAAGTGC TTGAGGCCAG CGGACATGTG 
GAGAACTTCA CTGACCCCAT AGTGGAGTGT ACTAAGTGTC ACAAAATATA CAGGGCCGAC 
CATTTGGTGG AGGAAATGTT AAAGATCAAT GTGGAGAGAC TTAAACCATC TGAGCTGACT 
TCCCTCATAT CTGAGAAGGG ACTTAAGTGT CCATCATGCG GAGGCGATTT AGGAGAAGTT 
AGAAGTTTCA ATCTTCTCTT TGCGACCAAC ATAGGTCCCT ACTCTGGTAC GACCGGATAT 
CTAAGGCCAG AGACAGCTCA GGGCATGTTT ACCTCCTTTA AGAGGGTTTA TGAGGCTACG 
AGGCAGAGGT TACCCCTTGG GATAGCCCAA GTGGGAAGGG TAGCTAGGAA CGAGATCTCC 
CCGAGGCAAG GTTTAGTTAG AATGAGGGAG TTTACCATCA TGGAGGTGGA ATTTTTCATT 
GACCCCGATG ACAGGAATGT TCCCTGGTTA GATAGATACT ACAATGAGGA GTTTAGAGTT 
CTATTTGGGG ATGCTAAGGT AAAGGGTCTG AAACCGGCTA CGATGAAGGT AAAGGAAATG 
ATTGAGGAGG GTCTGCTCGT AAATCCGTGG ATGGGCTTTT GGATGGCATC AGCGTCCAGG 
TTTGTCCAGG CACTGGGTAT ATCTAAGGAT AGTTTCTATT TCGAAGAGAA ATTACCTGAG 
GAAAGGGCTC ACTACTCATC GCAAACCTTT GATCAGATAG TCGAGATCAT GGGGGAGAAG 
GTGGAAATAT CGGGGCATGC GTACAGGGGA AACTATGACC TGAGCAGGCA CTCAAAGTTC 
AGTAACGAAG ATCTAACTGT TTTCAAGAAG TTCGATCAAC CTAGGACAGT GGTAAAGAAG 
ACCGTCATAG TGAACAGGGA TAGGTTCAAG GATAATCCAG AACTTCAGAA GGAAGTCATG 
ATGCTGGTGT CTGGAAAATC GCCAGAGCAA GTTGAGGAGT TGCTAAATAA ACAGGTCCAG 
GTTGCTGGAA GACCGCTGTC TGAGTTTGTC CGGATTATGA ACAGGGAAGA GAAGGAACAC 
GGAATTAAGT TCTACCCACA TGTGGTTGAA CCGTCATTTG GGGTAGAAAG ATGTCTCTAC 
CTAAGCGTGC TTTCAGCTTA CAGAGAGAAG AAGGATCGAG TGGTATTGGC CTTACCTAAG 
GATTTAGCTC CCTATCAAGT CGCAGTATTT CCGCTTTTAG AGAGGGATGA ACTCATAAAG 
AAGGCTAGGG AGATATATAA TCTCCTTTCC GGGAAGTATG AGGTCCTATT TGATGACGCA 
GGAAGCATAG GAAAGAGATA TGCAAGAGTG GATGAGATTG GTGTACCATA CGCAGTCACG 
GTTGACCCAC AGACATTGTC TGATGATTCT GTGACCATTA GGGACAGGGA CTCTTGGAGC 
CAAATTAGAA TCAAAACATC CGATCTGGAA TCTGTTATGG ACAAGTTATT TAGTGGGCAA 
GATTTTAGTA TGTTAACAGG AGAGGCGAAA AGATGA

Protein sequence

MPESDKVIEL AKRRGIFWPS YEIYGGVAGL YDIGPVGARI KNKIINTWRK IFVEENSEFV 
VEIETPMITP SKVLEASGHV ENFTDPIVEC TKCHKIYRAD HLVEEMLKIN VERLKPSELT 
SLISEKGLKC PSCGGDLGEV RSFNLLFATN IGPYSGTTGY LRPETAQGMF TSFKRVYEAT 
RQRLPLGIAQ VGRVARNEIS PRQGLVRMRE FTIMEVEFFI DPDDRNVPWL DRYYNEEFRV 
LFGDAKVKGL KPATMKVKEM IEEGLLVNPW MGFWMASASR FVQALGISKD SFYFEEKLPE 
ERAHYSSQTF DQIVEIMGEK VEISGHAYRG NYDLSRHSKF SNEDLTVFKK FDQPRTVVKK 
TVIVNRDRFK DNPELQKEVM MLVSGKSPEQ VEELLNKQVQ VAGRPLSEFV RIMNREEKEH 
GIKFYPHVVE PSFGVERCLY LSVLSAYREK KDRVVLALPK DLAPYQVAVF PLLERDELIK 
KAREIYNLLS GKYEVLFDDA GSIGKRYARV DEIGVPYAVT VDPQTLSDDS VTIRDRDSWS 
QIRIKTSDLE SVMDKLFSGQ DFSMLTGEAK R