Gene Msed_0228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0228
Symbol	pyrG
ID	5104094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	+
Start bp	188583
End bp	190178
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	48%
IMG OID	640506133
Product	CTP synthetase
Protein accession	YP_001190329
Protein GI	146303013
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0504] CTP synthase (UTP-ammonia lyase)
TIGRFAM ID	[TIGR00337] CTP synthase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0116565
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAAAAT ACATCGTAGT GACCGGCGGA GTTCTTTCCA GTGTTGGCAA GGGTACTGTT 
TCAGCCTCGT TAGGGCTCAT CCTAAAAAAC ATGGGTTATA ACGTGAGTAT AATCAAGGTG 
GATCCCTACA TTAACGTTGA TGCAGGGACA ATGAACCCCT ATATGCATGG TGAGGTCTTC 
GTTACAGAGG ACGGTGCTGA GACTGACCTG GATCTGGGTC ACTACGAGAG ATTCCTTAAC 
ATTAACACAA GCAAGCACAA CAATATAACC GCTGGGAAGG TCTATTTCGA GGTCATAAGA 
AAGGAAAGAG AAGGTAAGTA CATGGGCCAG ACGGTCCAGA TTATCCCTCA CGTGACAGAC 
GAAATCAAGG CTATGGTCAG GAAAGTCGGT GAAGTGGAGA AGGCTGACAT AGTGATAGTT 
GAGGTAGGAG GGACCGTTGG GGACATCGAG GGACTGCCGT TCCTTGAGGC CATGAGGGAA 
CTCAGACTAG AGGAGGAAGA GCATAACGTA ATATTCGTCC ATGTAGCCCT TGTGGAGTAC 
CTTTCTGTTA CTGGGGAACT AAAGACAAAG CCTCTACAGC ACAGCGTTCA AGAGCTCAGG 
AGGATAGGGA TACAGCCAGA TATAGTTATT GCTAGATCCA TAATAGAGCT TGACGAGGAT 
ACCAAGAGGA AGATCGCGCT TTTCACCAAT GTAAGGCCTG AGTACATATT CTCGAGCTAT 
GACGTGGAAA CGGCATACGA GGTACCGCTC ATTCTCCAGA GACAGGGACT AGGGGCAAGG 
GTCACATCTA AGCTTGGACT CCCACAAAAA ACTCCTGATT TTGGAGAGTG GGAGAAATTT 
GTGTACTCGG TAAAGAGGAA AGAAGGTAAA AGGGTAAAGA TAGCCCTTGT GGGAAAATAC 
ACAAAGCTCA AGGATAGTTA CCTTAGTATA AAGGAGGCAA TATATCACGC CTCTGCTCAC 
CTTGGCGTGA TTCCTGAACT ACTTTGGATC GAGTCGTCGG ACCTGGAGAG GGAGAACCCA 
GAGGCAATAC TGAAACAGGC AGAAGGTATC ATAGTATTGC CTGGATTCGG CTCCAGGGGT 
ACAGAGGGAA AGATCAAGGC AATTAACTAC GCTAGGGTTA ATAACGTTCC CTTCCTAGGA 
ATATGCTTCG GGTTACAACT GGCAGTGGTT GAGTTTGCCA GGAACGTTGT GGGTCTTCAG 
GGTGCACATA GCACGGAAAT AGACCCTAAC GCTCCCCATC CAGTGGTGAC CCTGTTAGAT 
GAGCAGAAAA AGGTTACGCA ATTTGGCGGA ACAATGAGGT TGGGAGCCCA GAGGATAAGC 
CTAGTTCGAG GAACCCTGGC CCACTCAATT TACGGGAAGG ACGTAATCTA CGAAAGGCAT 
AGGCACAGGT ATGAGGTGAA CCCCTCCTAC GTGGATCTAC TTCAGAAGCA CGGGTTAACA 
ATCTCAGGAA TTAGTGACAA TGGTCTTGTG GAGATGATAG AGCTTAAGGA TCACAGATTC 
TTCATAGCTA CCCAGGCCCA CCCCGAGTTC AAGAGTAGGC CCTTAAATCC AGCTCCCCTA 
TTCCTTGGTT TCCTCAGGGC CGTCGTCGGG AACTAG

Protein sequence

MTKYIVVTGG VLSSVGKGTV SASLGLILKN MGYNVSIIKV DPYINVDAGT MNPYMHGEVF 
VTEDGAETDL DLGHYERFLN INTSKHNNIT AGKVYFEVIR KEREGKYMGQ TVQIIPHVTD 
EIKAMVRKVG EVEKADIVIV EVGGTVGDIE GLPFLEAMRE LRLEEEEHNV IFVHVALVEY 
LSVTGELKTK PLQHSVQELR RIGIQPDIVI ARSIIELDED TKRKIALFTN VRPEYIFSSY 
DVETAYEVPL ILQRQGLGAR VTSKLGLPQK TPDFGEWEKF VYSVKRKEGK RVKIALVGKY 
TKLKDSYLSI KEAIYHASAH LGVIPELLWI ESSDLERENP EAILKQAEGI IVLPGFGSRG 
TEGKIKAINY ARVNNVPFLG ICFGLQLAVV EFARNVVGLQ GAHSTEIDPN APHPVVTLLD 
EQKKVTQFGG TMRLGAQRIS LVRGTLAHSI YGKDVIYERH RHRYEVNPSY VDLLQKHGLT 
ISGISDNGLV EMIELKDHRF FIATQAHPEF KSRPLNPAPL FLGFLRAVVG N