Gene Nmul_A1610 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1610
Symbol
ID	3784842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1848630
End bp	1849571
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	60%
IMG OID	637811699
Product	hypothetical protein
Protein accession	YP_412303
Protein GI	82702737
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACCGC GTGCGCACCA TGTACTGATC GGATTCTTTA CCGTTATGAC GGTAACGGCT 
GCACTGCTGT TCACTCTGTG GCTGAGCAAG GCTCCGGGCG ACTCCGTGCA GCGCTACTAC 
ACTGTGGTCT TCAATGAAGC AGTCAGGGGG CTCTCCATAG GTAGCCCCGT TCAGTACAGC 
GGCATCACGG TCGGTGACGT GGTCAATCTC GCGCTGGATC CGCAGGATCC CCGCAACGTG 
ATCGCGCGGG TGCGCGTGCA GGGCAGCACG CCGATCAAGG AGGATACCCA GGCACGACTC 
GCACTGACAG GCATCACCGG CAATTCGGTG ATCGAATTCA GCGGCGGGTC TCCCGACAGC 
CCCGACCTCG TGGCAAAGGA TGACCACAAG GACCCGGTCA TCGTGGCCAC CCCATCGCCC 
ATCGCCAAGC TGCTGGAGCA CAGCGACAAC ATGATGGCCG ATGTCACCCA GCTGGTGATG 
CGGGCCAAGG AGATCCTTTC TCAAGAAAAT GCCAAGCGGC TGAGCAGGAC GCTGGAGAAC 
CTAGAGCAGA CTACTGCAGT GATCGCCAGC CAGAACGATA GCGTGCGGGG AATCGTGGGT 
GAACTGGCCA CTGCCAGCGC ACAGGCGAAC TCCGCATTGC GGGAGGCTAC GCAACTGATG 
GCGGCAACGA ATACGCTCGT GAGCGAGAAG GGCGTTCCAA CTCTTGGCAA CCTCGATCGC 
GCCACAGCTT CCCTGGCGAA AGTCAGCGCG TCGGTCGATC AGTTGCTGCT GGAGAATCGG 
GCCGCGTTGA GCGGGGGCAT GCAGGGCATG AACGAACTGG GACCTGCCCT CCAGGAACTA 
CGCAATACCA TGTCTGCACT GGCAAGAACC GTACGTCGTC TCGATGAGAA TCCTGCTGCC 
TACCTTACGG GGCGGGAAAA AATCGAGGAG CTTGAACCAT GA

Protein sequence

MEPRAHHVLI GFFTVMTVTA ALLFTLWLSK APGDSVQRYY TVVFNEAVRG LSIGSPVQYS 
GITVGDVVNL ALDPQDPRNV IARVRVQGST PIKEDTQARL ALTGITGNSV IEFSGGSPDS 
PDLVAKDDHK DPVIVATPSP IAKLLEHSDN MMADVTQLVM RAKEILSQEN AKRLSRTLEN 
LEQTTAVIAS QNDSVRGIVG ELATASAQAN SALREATQLM AATNTLVSEK GVPTLGNLDR 
ATASLAKVSA SVDQLLLENR AALSGGMQGM NELGPALQEL RNTMSALART VRRLDENPAA 
YLTGREKIEE LEP