Gene Nmul_A0818 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0818
Symbol
ID	3785862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	932249
End bp	933355
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	53%
IMG OID	637810904
Product	histidinol-phosphate aminotransferase
Protein accession	YP_411517
Protein GI	82701951
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.961154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCTGTTA TGCCTTTTTC CCCCGATCAG ATCATTCGCC CCGAAATTCT CGCGCTTTCC 
GCTTACCACG TGCCTCCCGC ATGCGGAATG ATAAAGCTGG ATGCGATGGA AAACCCTTAC 
CCGCTTCCCC CGGAATTGCG CGATGAAATT GCGAAGCTTG CAGGTGAGAC GCCGGTCAAT 
CGCTACCCCG ACCCCGATGC AGCAGCGCTC AAAGCGGCGT TACGCGAGGC ATTGAGCATC 
CCGGACGGGA TGGATATCAT GCTCGGCAAT GGTTCGGATG AGATCATCCA GATTATTGCT 
TTAGCATGCG GGAAGCCCGG CGCGGTATTG ATGAGCGTGG AGCCTGCATT CGTCATGTTT 
CGCATGATTG CCACTTTTGC TTCGATGAAT TATGTGGGTG TCCCATTACA TCCCGATTTT 
TCACTCGACG CGGAGGCAAT GCTTGCCGCA ATTGCGCGAT ACCAGCCTGC GGTCATTTTT 
ATCGCCTATC CCAATAACCC TACAGGTAAC CTGTTTGACG CCGTTGAAAT CTCACGTATT 
ATTGACGCTG CCCCGGGCGT GGTGGTCGTC GATGAGGCTT ACCATGCCTT CGCCGATGCG 
AGTTTCATGG ACAAGCTCGC GCATCATCCC AATCTGTTGC TGATGCGCAC ACTTTCGAAG 
CTGGGAATGG CCGGCTTGAG GCTGGGCTTG CTGGCGGGAA AACCCGAATG GCTAAGACAG 
CTGGAAAAAT TGCGGCTGCC GTATAATGTA GGAATCGTTA CTCAACGGAT TGCAGAGAAA 
TTACTGCAGC ACCGTGATGT CCTGCTGCAA CAGGCGGCAG CCATCAAGCT TGAACGTTCA 
TCGATGAGCA GGCGGCTGGC GGAATTGGAA GGTATCGAGG TTTTTCCGAC GGATGCGAAT 
TTCATCCTGT TTCGCCTGAA CCAGGATCAT AAGGCAACCC AGGTATTTCA GGAACTCAAA 
CAACGTGGCA TATTGGTCAA AAATCTGGAC GGCGCTCACC CATTGCTCAA AAACTGCTTG 
CGGGTGACCG TGGGAATGCC GGATGAAAAT GCGCAGTTTC TGGAGGTCCT GCAAACTTTG 
CTCGTGAAGG TTGAAGCGAA AGCCTGA

Protein sequence

MAVMPFSPDQ IIRPEILALS AYHVPPACGM IKLDAMENPY PLPPELRDEI AKLAGETPVN 
RYPDPDAAAL KAALREALSI PDGMDIMLGN GSDEIIQIIA LACGKPGAVL MSVEPAFVMF 
RMIATFASMN YVGVPLHPDF SLDAEAMLAA IARYQPAVIF IAYPNNPTGN LFDAVEISRI 
IDAAPGVVVV DEAYHAFADA SFMDKLAHHP NLLLMRTLSK LGMAGLRLGL LAGKPEWLRQ 
LEKLRLPYNV GIVTQRIAEK LLQHRDVLLQ QAAAIKLERS SMSRRLAELE GIEVFPTDAN 
FILFRLNQDH KATQVFQELK QRGILVKNLD GAHPLLKNCL RVTVGMPDEN AQFLEVLQTL 
LVKVEAKA