Gene Nmul_A2193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2193
Symbol
ID	3786218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2491657
End bp	2492835
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	56%
IMG OID	637812280
Product	histidinol-phosphate aminotransferase
Protein accession	YP_412877
Protein GI	82703311
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATTT GCGATCTCGC TCCTGCATAT ATCCGTGCCA TCAGTCCCTA TCAGCCCGGC 
AAGCCTATTT CTGAACTGGC CCGGGAGATG GGGATGGATG AACAGTCCAT CATCAAGCTT 
GCGTCCAATG AAAACCCCCT GGGAACCAGT CCAATGGCCC TGAACGCAAT GAGCAAGGCG 
CTCGACGAGG TTTCGTTGTA TCCGGACGGA AGCGGATTTG AGCTGAAAGC AGCGCTGTCC 
GAGCGCTATG GCGTGACCAG CGATCAGATT GTGCTGGGCA ACGGTTCCAA TGACGTTCTG 
GAGTTGGCCG CGCGCGTATT CCTGAAGCCG GGGGCCTCGA CCGTTTACTC GCAGCATGCG 
TTTGCGGTTT ATCCCCTGGT GACGAAAGCG GTGGGTGGAA TCGGCATTTC CGTTCCCGCC 
CGGAACTATG GCCATGATCT TGACGCCATG CTGGATGCTG TCGCGCCTGA AACACGGGTT 
GTATTTATTG CCAATCCCAA CAATCCCACC GGCACCCTGC TGCCTGCCGA CGATGTGCTG 
CGCTTTCTCG AGCGAGTGTC CCCGGATGTG CTGGTCGTAC TGGATGAAGC ATACAACGAG 
TATCTGCCGC CCGCCCTCAA GGGAGATAGC ATTGCCTGGC TGAAGCAGTT TCCCAATCTC 
CTCATTACCC GCACTTTCTC CAAAGCTTAC GGTATGGCAG GCGTGCGCGT CGGTTTCGGC 
CTCGGGCATC CTGACGTCGC CGGTCTGATG AACCGCGTGC GCCAGCCATT CAACGTCAAC 
AATATCGGTC TTGCCGGCGC GGTGGCTGCG CTGCAGGATG AGGAGTTCGT AAAGCGTTCT 
TATGCGCTCA ACCAGGCAGG CATGCTGCAG ATTGTCACCG GATTGCGGCA GATGGGAATC 
GAGTACATTC CGTCCTACGG GAATTTCCTG AGCTTTCGGG TGCCAGGCAA TGTCAAGGCA 
ATAAACGAGA GTCTGCTGAA GCAGGGTGTG ATTGTCCGCC CCATCAGCAT TTATGAAATG 
CCGGAACATC TCCGGGTAAC TGTCGGGCTC GAATCTGAAA ATGAGAAATT CCTGAAATCG 
CTGGCGATAG CCCTGGAGAC GACGGAAGGG GCAGCAGCAG ACACAATACC TGAGATGGCG 
GTAAGCTTTC CCAAAGTTGC ATCGGGGGGA ACAGCGTGA

Protein sequence

MNICDLAPAY IRAISPYQPG KPISELAREM GMDEQSIIKL ASNENPLGTS PMALNAMSKA 
LDEVSLYPDG SGFELKAALS ERYGVTSDQI VLGNGSNDVL ELAARVFLKP GASTVYSQHA 
FAVYPLVTKA VGGIGISVPA RNYGHDLDAM LDAVAPETRV VFIANPNNPT GTLLPADDVL 
RFLERVSPDV LVVLDEAYNE YLPPALKGDS IAWLKQFPNL LITRTFSKAY GMAGVRVGFG 
LGHPDVAGLM NRVRQPFNVN NIGLAGAVAA LQDEEFVKRS YALNQAGMLQ IVTGLRQMGI 
EYIPSYGNFL SFRVPGNVKA INESLLKQGV IVRPISIYEM PEHLRVTVGL ESENEKFLKS 
LAIALETTEG AAADTIPEMA VSFPKVASGG TA