Gene Nmul_A0675 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0675
Symbol
ID	3784052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	773738
End bp	774895
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	60%
IMG OID	637810757
Product	aminotransferase, class V
Protein accession	YP_411374
Protein GI	82701808
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00811405
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTACG CCTATTTCGA CCATAACGCC ACGACTGCTG TCGATAAAGC CGCGCTTGAT 
GCCATGTTGC CGTATTTCCA GGAAGAGTAC GGCAATCCCT CCAGCCGGCA TGCTCCTGGC 
ATTGCAGCTC GCCGGGCGGT TGATCGCGCC CGTGAGCAAG TGGCGGATGC AGTGGGAGTG 
CAGCCGTCGC AGGTGGTTTT CACCAGCGGG GGATCGGAAG CCAATAACCT CTTCATTCAG 
GGCGCCGCGG GCTACATGAA GCCGGGACAG ATTGCGATAA GCGCGATCGA GCATCCCTGC 
GTGATGAAAA CTGCGCAGGA ATTGGCGCGT GCTTCGCGGG GAAGCTGGAA TCTGCGTCGG 
CTAGCAGTGG ATAATCAGGG CCGCCTGGAC CCGGCCGCTC TTGACGAGGC ACTGTCGTCT 
CAACAGTCGG GGCTGGTTTC AGTCATGCTG GCAAACAACG AAACAGGCGT GATTCAGGAT 
GTTTCGATGG TGGGGGAGAA GGCCCGCGCG CGAGGTGCCT GGATTCACAC GGACGCAGTG 
CAGGCGTTTG GCAAGATACC TGTCGATTTT GCCTCGCTCA ATGTACATGC CCTGACGCTG 
TCGTCCCACA AGATTTGCGG TCCCAAGGGG GCCGCGGCGC TTATCATGGA TAAGCGGCTC 
CTGCTCAAAC CTCTCATCTA CGGTGGGGGG CATGAAGGCG GATTGCGTTC GGGTACCGAA 
AACGTTCCCG CAATTGTGGG ATTCGGCGTG GCCTGCGAGT TGGTCAAGAG ACGAATAGCG 
GAACATACCA CGCATATCTC GGCATTGCGC CAGCAACTGG AGCGGGGCCT GCTGGAGATG 
GGCGGGACTG TTTTTGGTCT CGGCGCTTCC CGTCTGCCCA ATACCTGCTA TTTTGCGCTC 
CCGGGTATCG AAGGAGATAC TTTGGTAGTA CGTCTCGATA AAGCGGGTTT CGCGGTGGCA 
AGCGGCGCGG CGTGTTCCAG CGTCAACCCC GGGCGAAGCC ATGTGCTGGA AGCAATGGGG 
GTGGATCCTG CCCTGGCTCG TTGCGCTGTG CGGGTAAGCC TGGGGGCCTC CAATTCTTCG 
GTGCAGGTTG CTGATTTCCT TCGCGCTCTC GGTGCTATCG TGGGGGAGCT GGAGCAGATG 
AGCGCGCTTT CGATCTGA

Protein sequence

MTYAYFDHNA TTAVDKAALD AMLPYFQEEY GNPSSRHAPG IAARRAVDRA REQVADAVGV 
QPSQVVFTSG GSEANNLFIQ GAAGYMKPGQ IAISAIEHPC VMKTAQELAR ASRGSWNLRR 
LAVDNQGRLD PAALDEALSS QQSGLVSVML ANNETGVIQD VSMVGEKARA RGAWIHTDAV 
QAFGKIPVDF ASLNVHALTL SSHKICGPKG AAALIMDKRL LLKPLIYGGG HEGGLRSGTE 
NVPAIVGFGV ACELVKRRIA EHTTHISALR QQLERGLLEM GGTVFGLGAS RLPNTCYFAL 
PGIEGDTLVV RLDKAGFAVA SGAACSSVNP GRSHVLEAMG VDPALARCAV RVSLGASNSS 
VQVADFLRAL GAIVGELEQM SALSI