Gene Nmul_A1550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1550
Symbol
ID	3785272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1775740
End bp	1777173
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	54%
IMG OID	637811638
Product	threonine synthase
Protein accession	YP_412245
Protein GI	82702679
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCTACA TTTCCACTCG TGGCGGCATG CCGCCTAAAA AGTTCTCCAG GATTCTTCTC 
GGCGGCCTTG CTCCGGATGG CGGGCTGACG CTGCCGGAAA CCTATCCCAG GTTCGATGAC 
GCAAAATTGC AGGAACTGCG GGACATGGAT TACCCGGAAC TTGCGTTCGA GATCCTTTCC 
GGTTTTGCGG ATGACATTCC TGCTGCGGAC TTGCGCGCAA TCATCGGGCG AACCTATACT 
GCCCAGTCGT TTCAAAACGA TGAAATCACG CCGCTTAAAA CCCTGGAACC GGGGCTGCAC 
ATACTTGGTT TGTCGAATGG CCCGACGCTG GCCTTCAAGG ATATCGCCCT GCAATTGCTG 
GGCAACCTGT TCGAGTACGC GTTGGACAAG AATGGCGAGC AGCTGAATAT CCTCGGTGCA 
ACTTCCGGCG ATACCGGGCC GAGCGCAGAG TATGCCATGC GGGGCAAGCG CGGCATTCGT 
GTGTTCATGC TTTCGCCGCA TGGAAAAATG AGCCCGTTCC AGACAGCTCA AATGTTTTCC 
CTGCATGATC CGAATATTTT CAATATCGCC ATTCGCGGCG TGTTCGACGA TTGCCAGGAC 
ATTATCAAGG CTGTCAGCAA TGATTATGCC TTCAAGCAGA AATACCGCAT TGGTACGGTT 
AATTCCATAA ACTGGGCACG CATTGCGGCG CAGACCGTTT ATTACTTCAA AGGTTATTTT 
GCTGCCACCC GCTCGAATAC AGAGCAGGTA TCTTTCGCGG TGCCATCGGG AAATTTCGGC 
AACATTTGCG CAGGGCACGT GGCGCGCATG ATGGGCCTGC CTATCAAAAA GCTGATACTT 
GCCACCAATG AAAATGATGT GCTGGATGAA TTTTTCCGGA CGGGACATTA TCGCCCGCGC 
ACGACCGCCG AGACCGTCCA GACCAGTAGT CCCTCGATGG ATATTTCCAA GGCCTCGAAC 
TTCGAGCGCT TCATTTTCGA CTTAACCGGA AGAGATGCCG CCAAAGTGAA GGAATTATGG 
CAGGCAGTAG ATGAGGGCGG AGCCTTTGAT CTCGCCGATA CGCCCCTGTG GGAGAGAATC 
GAAGACTTTG GCCTTGTATC AGGGACCAGC AGTCATGCAG ACCGAATCGC CACCATCCGC 
CGGGTGCATG ACCGATATGG CTTGGTGATA GACCCGCATA CAGCTGACGG CGTGAAAGCG 
GGATTGGAAC ATCGTGACGC CAGCGTGCCG CTGATCTGTC TTGAAACGGC ATTGCCAGTC 
AAATTCTCAG CAAGCATTGT CGAGGCGATC GGACATGAGC CTGAGCGTCC CGCAGGATAT 
GAGAATATTG AAGAAAAAGC ACAGCGCTAT GTAGTCATGG ATGCTGACGC AGGGGCGGTC 
AAGGCGTTTA TTGTGGAGCA GGCGGGGCCG CCCCAAACCG CGGCGGCGAT ATAA

Protein sequence

MLYISTRGGM PPKKFSRILL GGLAPDGGLT LPETYPRFDD AKLQELRDMD YPELAFEILS 
GFADDIPAAD LRAIIGRTYT AQSFQNDEIT PLKTLEPGLH ILGLSNGPTL AFKDIALQLL 
GNLFEYALDK NGEQLNILGA TSGDTGPSAE YAMRGKRGIR VFMLSPHGKM SPFQTAQMFS 
LHDPNIFNIA IRGVFDDCQD IIKAVSNDYA FKQKYRIGTV NSINWARIAA QTVYYFKGYF 
AATRSNTEQV SFAVPSGNFG NICAGHVARM MGLPIKKLIL ATNENDVLDE FFRTGHYRPR 
TTAETVQTSS PSMDISKASN FERFIFDLTG RDAAKVKELW QAVDEGGAFD LADTPLWERI 
EDFGLVSGTS SHADRIATIR RVHDRYGLVI DPHTADGVKA GLEHRDASVP LICLETALPV 
KFSASIVEAI GHEPERPAGY ENIEEKAQRY VVMDADAGAV KAFIVEQAGP PQTAAAI