Gene Nwi_2035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_2035
Symbol	thrS
ID	3677105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	2224074
End bp	2226134
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	63%
IMG OID	637713599
Product	threonyl-tRNA synthetase
Protein accession	YP_318646
Protein GI	75676225
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0441] Threonyl-tRNA synthetase
TIGRFAM ID	[TIGR00418] threonyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAAA ACCAAGACCC CGCCGGATTC CGGTACGGCC TCGCCAACCT GAAACCCGTC 
TCGCCCGCCG ACAACGTCGT CCTCACCTTC CCCGACGGCG CGACACGCGA ATTCCCGAAG 
AATACCACCG GCCTGGAAAT CGCCAAGGGG ATCTCGCCGT CGCTGGCCAA GCGCACGGTG 
GCCATGGCGC TCGACGGCAT CGTCAACGAT CTCGCCGACC CGATCGAACA GGACGCTACA 
ATTGAATTCA TCAGCCGCGA CGACCCTCGC GCGCTGGAAC TGATCCGCCA TGACGCCGCG 
CATGTGCTGG CGGAAGCCGT GCAGACATTG TGGCCGGGCA CGCAGGTCAC CATCGGCCCG 
GTGATCGAGA ACGGCTTCTA TTACGACTTC TTCCGCAACG AGCCGTTCTC GGTTGAGGAT 
TTCGCCGCGA TCGAGAAGAA GATGCGCGAG ATCATCGCGC GCGACCAGCC CTTCACCAAG 
GATGTCTGGG ACCGCGAGAA GACCAAGCAG GTGTTTCGCG ACAAGGGCGA GGCCTTCAAG 
GTCGAACTCG TCGACGCCAT CCCCGGCAAC GAGCCGATCC GGATCTACTA CCAGGGTGAC 
TGGTTCGATC TCTGCCGCGG CCCGCACATG ACCTCGACCG GCAAGATCGG CAACGCGTTC 
AAGCTGATGA AGGTGGCCGG CGCTTACTGG CGCGGCGACA GCAACAATCC GATGCTGACG 
CGCATCTATG GCACCGCCTT CGCGAACCAG GCCGATCTCG ACGCATACCT CAAGCAGATC 
GAGGAAGCCG AGAAGCGCGA CCACCGAAAG CTCGGCCGCG AACTCGACCT GTTCCACTTT 
CAGGAGGAAG GTCCGGGCGT GGTGTTCTGG CACGCCAAAG GCTGGACCAT CTTCCAGGCC 
GTGATCGCCT ACATGCGCCG GCGGCTCGCG GAAGATTATG ACGAGGTCAA CGCGCCGCAG 
ATGCTCGACA AGTCGCTGTG GGAGACGTCG GGACATTGGG AATGGTATCG CGAGAACATG 
TTCGCCGCGC AGTCCGCCGG CGATGAAGCC GAGGACAAGC GCTGGTTCAC AATCAAGCCG 
ATGAACTGTC CAGGCCATGT GCAACTCTTC AAGCACGGAC TCAAAAGCTA CCGCGACCTG 
CCGCTGCGGC TCGCTGAATT CGGCGTCGTG CATCGCTACG AGCCGTCGGG CGCAATGCAC 
GGCCTGATGC GGGTGCGCGG CTTCACCCAG GACGACGCGC ATGTTTTCTG CACCGAGGAG 
CAGCTCGCCG ACGAGTGCCT CAAGATCAAC GAGCTGATCT TGTCGACCTA TGCCGATTTC 
GGCTTCGACG GTGAGCTGAC GGTGAAGCTT TCGACGCGTC CCGAGAAGCG CGTGGGCTCG 
GACGCGGCGT GGGATCACGC CGAAGCGGTG ATGGCGGATG TCCTCAAGCA CATCGCGGCA 
TCGAACAACC GCATCAGGAC CGAGACCAAT CCCGGCGAGG GTGCGTTCTA CGGGCCGAAG 
TTCGAGTACG TCCTGCGCGA TGCCATCGGC CGCGACTGGC AGTGCGGCAC GACCCAGGTG 
GACTTCAACC TGCCGGAGCG GTTCGGCGCC TTCTACATCG ACGCGGACGG CGGCAAGAAG 
GCGCCGGTGA TGGTGCATCG CGCGATCTGC GGATCGATCG AGCGCTTCAT CGGCATCCTG 
ATCGAGCACT TCGCCGGCCA CTTTCCGCTC TGGCTCGCGC CGGTGCAGGC GGTCGTCACC 
ACCATTACGT CGGACGGCGA TGAATACGCG AAAGTGGTCG CGTCCGCCGC GCGGCGCGCG 
GGGCTTCGCG TCGAACTGGA CCTGCGCAAC GAAAAGATCA ACTACAAGGT GCGCGAGCAC 
TCGCTGGCGA AGATCCCCGC CTTGCTCGTT GTCGGCAAAA AGGAGGCCGA GACCCAATCG 
GTGTCCATCC GCCGGCTCGG CAGCGACGGC CAGAAAGTGA CGCCGACCGG CGAGGCCATT 
GCCGCGCTTG TAGCGGAAGC CGTTCCGCCG GATATCCAAC GCATCAAGAC AGCGCCCCAG 
AGCCTTTCCG CTTCTGATTG A

Protein sequence

MSENQDPAGF RYGLANLKPV SPADNVVLTF PDGATREFPK NTTGLEIAKG ISPSLAKRTV 
AMALDGIVND LADPIEQDAT IEFISRDDPR ALELIRHDAA HVLAEAVQTL WPGTQVTIGP 
VIENGFYYDF FRNEPFSVED FAAIEKKMRE IIARDQPFTK DVWDREKTKQ VFRDKGEAFK 
VELVDAIPGN EPIRIYYQGD WFDLCRGPHM TSTGKIGNAF KLMKVAGAYW RGDSNNPMLT 
RIYGTAFANQ ADLDAYLKQI EEAEKRDHRK LGRELDLFHF QEEGPGVVFW HAKGWTIFQA 
VIAYMRRRLA EDYDEVNAPQ MLDKSLWETS GHWEWYRENM FAAQSAGDEA EDKRWFTIKP 
MNCPGHVQLF KHGLKSYRDL PLRLAEFGVV HRYEPSGAMH GLMRVRGFTQ DDAHVFCTEE 
QLADECLKIN ELILSTYADF GFDGELTVKL STRPEKRVGS DAAWDHAEAV MADVLKHIAA 
SNNRIRTETN PGEGAFYGPK FEYVLRDAIG RDWQCGTTQV DFNLPERFGA FYIDADGGKK 
APVMVHRAIC GSIERFIGIL IEHFAGHFPL WLAPVQAVVT TITSDGDEYA KVVASAARRA 
GLRVELDLRN EKINYKVREH SLAKIPALLV VGKKEAETQS VSIRRLGSDG QKVTPTGEAI 
AALVAEAVPP DIQRIKTAPQ SLSASD