Gene Nmul_A0437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0437
Symbol
ID	3785905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	484639
End bp	486150
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	54%
IMG OID	637810513
Product	threonine dehydratase
Protein accession	YP_411137
Protein GI	82701571
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01124] threonine ammonia-lyase, biosynthetic, long form

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAACA GTTACCTCGA AAGAATTCTT ACAGCGCGGG TTTATGACGT TGCGATAGAG 
AGTCCTCTGG AGCTTGCGCC GAATCTGTCC ACACGTATAA ATAATCAGCT GTTCCTGAAA 
CGGGAAGATG TGCAGGATGT TTTCTCGTTC AAAGTGCGGG GAGCTTACAA CAAAATGGTC 
AAGCTTTCTC CCGCGGCGCT CGAACGCGGA GTGGTGACGG CCTCTGCCGG CAACCATGCG 
CAAGGTGTGG CCCTCGCTGC ACAGCGATTG GGGTGTCGGG CAACCATAGT GATGCCTGTC 
ACCACGCCCC AGATCAAGTT GCAGGCGGTC GAGGCACGCG GAGCGACAGT GGTTTCCTAT 
GGGGACTCCT ATGACGAAGC CTATGCTCAC GCCCACGAAT TCGCCGAAAA GAACCAGGTA 
ACCTTCGTAC ACCCCTATGA CGATCCCGAT GTCATTGCCG GGCAGGGAAC GATCGGAATG 
GAGATACTGC GCCAGCATCC GGGTGAAATT CATGCGATAT TCGCGCCCAT CGGTGGAGGC 
GGGTTGATTT CGGGGGTTGC GGCTTATGTA AAAAGGCTCT ATCCGGAAAT CAGGATTATC 
GGTGTGGAAC CCGTCGACGC CGACTCGATG TATCAGTCGC TAAAAAAGAA CCGGCGTGTC 
CGGTTGGCGC GAGTCGGATT GTTTGCAGAC GGGGTCGCTG TCAAGCAGGT AGGAGTGGAA 
ACTTTTCATT TATGCCGCGA ACTGGTCGAC GAGATCCTGC TGGTAGACAC GGATGCCATC 
TGTGCGGCAA TCAAGGATGT GTTCGAGGAT ACGCGCGCCA TACTGGAACC TTCGGGAGCG 
CTCTCGATTG CAGGGGCCAA GGCGTATGCA AAGCGGGAAG GTATCCGCGG CAAGAACCTG 
ATTGCCATCG CCTCCGGTGC GAATATGAAT TTCGACCGAT TGCGCCATGT GTCCGAACGG 
GCGGAACTGG GAGAGCAGCG GGAAGCGGTC ATGGCGGTGA CGATTCCCGA GGAACCCGGC 
AGTTTCAAGA AGTTCTGCGC AATGCTGGGA CCGAGAAGTA TCACAGAGTT CAACTATCGT 
TTTGCCGGTC CAAAAGAAGC GCATGTGTTT GTAGGGGTGT CGGTAAGAAA CCGGGAGGAA 
GCGGCGAAAC TGATCAAGGA TCTGGAGAAC AACGGCTTGC GCACCGAGGA TCTGAGCGAC 
AATGAAATGG CAAAATTGCA TATCCGCCAT CTCGTGGGTG GGCATGCACG TGATGTTAAA 
AATGAAATCG TCTATCGTTT TGAGTTCCCC GATCGTCCGG GGGCGCTCAT GCAATTTCTG 
AACAGCATGA GCCATCATTG GAATATCAGT CTGTTTCATT ACCGTAATCA CGGGGCAGAC 
TATGGGCGGG TGCTGGTGGG CATGGAGGTG CCCCCGGAGG AGAAGGCGGA TTTCAAGGCA 
TTTCTCGCTC AGCTCGACAA TCGTTATTGG GACGAAACCC ACAATCCGGC CTACAAATTA 
TTCCTGGGAT AG

Protein sequence

MKNSYLERIL TARVYDVAIE SPLELAPNLS TRINNQLFLK REDVQDVFSF KVRGAYNKMV 
KLSPAALERG VVTASAGNHA QGVALAAQRL GCRATIVMPV TTPQIKLQAV EARGATVVSY 
GDSYDEAYAH AHEFAEKNQV TFVHPYDDPD VIAGQGTIGM EILRQHPGEI HAIFAPIGGG 
GLISGVAAYV KRLYPEIRII GVEPVDADSM YQSLKKNRRV RLARVGLFAD GVAVKQVGVE 
TFHLCRELVD EILLVDTDAI CAAIKDVFED TRAILEPSGA LSIAGAKAYA KREGIRGKNL 
IAIASGANMN FDRLRHVSER AELGEQREAV MAVTIPEEPG SFKKFCAMLG PRSITEFNYR 
FAGPKEAHVF VGVSVRNREE AAKLIKDLEN NGLRTEDLSD NEMAKLHIRH LVGGHARDVK 
NEIVYRFEFP DRPGALMQFL NSMSHHWNIS LFHYRNHGAD YGRVLVGMEV PPEEKADFKA 
FLAQLDNRYW DETHNPAYKL FLG