Gene Msed_2124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_2124
Symbol	pheS
ID	5104417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	2043862
End bp	2045259
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	48%
IMG OID	640508013
Product	phenylalanyl-tRNA synthetase subunit alpha
Protein accession	YP_001192187
Protein GI	146304871
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0016] Phenylalanyl-tRNA synthetase alpha subunit
TIGRFAM ID	[TIGR00468] phenylalanyl-tRNA synthetase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.258233
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.247036
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAGCG AGAACGAGAT CAAAATCTTG GATTTTTTAA AGAGGAGAAA GGAATCAACC 
TCCCAGGAGA TTGCAGAGGG AACAGGTCTT CCCCTGAGCT CAGTGTTTAG TATTATCGCA 
ACCCTAGAAT CTAAAGGTAT AGTGAAAGTC ATCTCAGAGG AGACCAGGAA AGTAGTCAGA 
CTAACGGACG AGGGAAAACT TAGGACCGAA CAAGGGCTTC CAGAGGACCG TTTAGTTACT 
CTCCTCAACG GAAGACCCTT AAAGATCCAG GAGTTGAGAA ATGCACTGGG CAAGGATTTT 
GAAATAGGGT TCGGATGGGC CAGAAGAAAG GGATTAATAA CCTTGGAGAA CGACACGGTA 
ATACCCAAGG TTTCGCAGTA CGTATCACCT GAGTACACGG CGTTAAAGGA TCTGCAGGCT 
GGAAAGGAAC CTACTGGCGA GGTTCTAGAG ATCCTTCTAA GGAGGAAACT TGTTGAGGTG 
AAGGAAGAGA AGATGCTAAG GGTTCAACTC CTGAGGGAAG TAGAGACAAG GCCAGCCGAA 
CTTTACGTAA CTCACGAGAT GTTAACCACG GGTTCTTGGA GAGAATACGA GTTTAAACCC 
TACAACGTGG AGGCTAATCC GCCTTTCTTT CCCATAGGGA AGACCCACTA CTTTAGGGAC 
TTCATTGAGA AAGTGAAGGA CCTCATGGTG GGGCTTGGTT TCGTGGAAGT GTCTGGAGAC 
TTCGTGGAGA CTGAATTCTT CAATTTCGAC ATGTTGTTCC AGCCACAGGA TCATCCGGCC 
AGGGAAATTC ACGATTCCTT TGTGATTGAG GGAAAGGGTA ACTTACCTGG TTCTGACCTC 
GTTAGGAAGG TTAAGGAGGT CCACGAGAAG TGGTGGAGAT ATTCTTGGAG CGAGGATAAC 
GCAAGAAGGC TTGTTCTGAG GAGTCAGACC ACCGCTGTTA CTGCCAGGGT CTTAAGTGGT 
GCACCAAAGA GAATAAGAGC CTTTACCATA GGTAAGGTGT TTAGGCCAGA CTCCATTGAC 
GCTACTCATC TCATAGAGTT TCATCAGATG GATGGACTGG TCATAGAGGA GGACTTCACG 
TTCAGGGACC TCCTTTCTAC TTTACGTGAT ATATTTCAGG GACTTGGGGT CAAGCAGGTA 
AAGTTCAAGC CTGGGTATTT CCCATTCACC GAGCCCAGCG TAGAGGTTTA CGGTTTCATT 
GAGGGCCTAG GTTGGGTGGA GATGGCTGGG GCGGGACTGC TCAGAAAGGA GGTTACGGAA 
CCAGCAGGAG TTTTCTCGCC AGCAGGAGCA TGGGGGATAG GTATAGACAG ATTGGCCATG 
CTCTTTCTAG GTGTCAAGGA TATAAGGGAT CTATACTCGC TCGATATAGA GTACCTGAGA 
TCGAGGAGGG TGATCTAA

Protein sequence

MLSENEIKIL DFLKRRKEST SQEIAEGTGL PLSSVFSIIA TLESKGIVKV ISEETRKVVR 
LTDEGKLRTE QGLPEDRLVT LLNGRPLKIQ ELRNALGKDF EIGFGWARRK GLITLENDTV 
IPKVSQYVSP EYTALKDLQA GKEPTGEVLE ILLRRKLVEV KEEKMLRVQL LREVETRPAE 
LYVTHEMLTT GSWREYEFKP YNVEANPPFF PIGKTHYFRD FIEKVKDLMV GLGFVEVSGD 
FVETEFFNFD MLFQPQDHPA REIHDSFVIE GKGNLPGSDL VRKVKEVHEK WWRYSWSEDN 
ARRLVLRSQT TAVTARVLSG APKRIRAFTI GKVFRPDSID ATHLIEFHQM DGLVIEEDFT 
FRDLLSTLRD IFQGLGVKQV KFKPGYFPFT EPSVEVYGFI EGLGWVEMAG AGLLRKEVTE 
PAGVFSPAGA WGIGIDRLAM LFLGVKDIRD LYSLDIEYLR SRRVI