Gene Nmul_A1540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1540
Symbol
ID	3785613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1759287
End bp	1760189
Gene Length	903 bp
Protein Length	300 aa
Translation table	11
GC content	54%
IMG OID	637811628
Product	dihydrodipicolinate synthase
Protein accession	YP_412235
Protein GI	82702669
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR00674] dihydrodipicolinate synthase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.336283
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAACG TCGCAATAAA AGGCAGTCTG GTCGCCATTG TCACCCCGAT GCATGAAAAT 
GGCGAACTGG ATCTGGAGCG CTTCCAATCC TTGATCGACT TTCATGTGAC GGAAGGGACC 
GATGGTATCG TGGTGGTAGG AACCACCGGC GAATCACCGA CCGTGGATTT CGAAGAGCAC 
CATCTGTTGA TCAAAACCGC AGTGGAGCAG GCGGCAGGGC GGGTACCGGT AATTGCGGGA 
ACCGGAGCCA ATTCCACGCG CGAGGCAATT GACCTTTCCA TCTATGCGAA GAATGCGGGA 
GCGGATGCAA GCCTGTCGGT TGTACCGTAT TACAACAAGC CCACGCAGGA GGGTTTATAC 
CAGCATTTCA GAGCGGTGGC GGAGGCTGTG GATATACCGC AGATACTATA CAACGTGCCC 
GGCAGGACGG TGGCAGATAT TGCCAACGAT ACGGTCCTTC GTCTTGCGCA AATTCCCAAC 
ATTGTCGGAA TCAAGGATGC AACGGGTGAT ATCGGTCGCG GATTCGATCT GTTGTGCCGT 
GCTCCCGAAG ATTTTGCAAT CTATAGCGGC GATGATGCCA GTGCCCTGGC TTTGTTGCTG 
CTCGGCGGGC ATGGCGTTAT TTCCGTCACC GCCAACGTGG CGCCGAAGCT CATGCATGAG 
ATGTGCATTG CGGCATTTGC CGGTGACCTG GCTGCTGCCC GCGCTGCAAA CAGAAAGCTT 
TTGAGATTGC ATCTGGATTT ATTCATAGAG GCCAATCCTA TTCCTGTGAA ATGGGCGGTT 
GCGCAAATGG GATTGATAGG CGAGGGGTTG CGGTTGCCAC TCACACCGTT GTCGAATCGA 
TATCATCAGA CTCTCAGGGA AGCGATGAGC GAGGCGGGAA TCGATTTGGC GATATCTGTT 
TAA

Protein sequence

MDNVAIKGSL VAIVTPMHEN GELDLERFQS LIDFHVTEGT DGIVVVGTTG ESPTVDFEEH 
HLLIKTAVEQ AAGRVPVIAG TGANSTREAI DLSIYAKNAG ADASLSVVPY YNKPTQEGLY 
QHFRAVAEAV DIPQILYNVP GRTVADIAND TVLRLAQIPN IVGIKDATGD IGRGFDLLCR 
APEDFAIYSG DDASALALLL LGGHGVISVT ANVAPKLMHE MCIAAFAGDL AAARAANRKL 
LRLHLDLFIE ANPIPVKWAV AQMGLIGEGL RLPLTPLSNR YHQTLREAMS EAGIDLAISV