Gene Nmul_A0893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0893
Symbol
ID	3785935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1014174
End bp	1015334
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	57%
IMG OID	637810975
Product	putative AttH
Protein accession	YP_411588
Protein GI	82702022
COG category	[R] General function prediction only
COG ID	[COG5621] Predicted secreted hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.27416
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAGTCG TAAAGCGTAA TCCCGGATAT TTCACCCGTT CCCGCAAACA AAGGTGGCAC 
GATGCCGGAT TCAAACGGCT GACTGGAACC GCTTTCCTTG TTGCAGCTTT GTTCCTTGCT 
TTCTTTACCA CCGGTCGTGT TCTGGCAGAA CGGCCACAAC TCTCACCGGT AGTTCGAAAC 
GTGCCCCTTG TGTTCCCACG GGATTTCGGG GCGCATCCTG GTTTCAGAAA TGAGTGGTGG 
TATGTAACCG GCTGGCTGGA AACACCCGAA AAAGAACCGC TTGGCTTCCA GATCACCTTT 
TTCCGTGTGG CGACCGAACA CGATCGCGCC AACCCCAGCC GCTTTGCCCC CAGAGACCTC 
ATCATTGCCC ACGCCGCCTT GTCTGATCCG GCAGCGGGTA AACTCCTGCA TGACCAGAAA 
AGTGCACGGG ATGGTTTTGG TCTGGCATAT ACCACAGAGG ACAACACGAA CGTCAAACTG 
GGCGATTGGT TTATGGTGCG GGAGGAAAAC GGGCGCTACC AGACACGCAT AAAAGCAGAC 
CATTTCCGGC TCGATTTTTC GCTGACGCCC ACGCAATCCC CCATGCTGCA AGATCTCAAC 
GGTTTTTCCA GGAAGGGGCC GCACCCGGAG CAGGCCAGCT ATTACTACAG TGAGCCTCAC 
CTGCAGGTAA GTGGGAAAGT AACGCGCGAT GGCGAGGAAA TCACCGTGAA GGGCATCGCG 
TGGCTCGACC ACGAGTGGTC TACTGCCTAC CTCGATCCGA AAGCGGTAGG ATGGGATTGG 
GTTGGCGCCA ATCTTGACGA TGGGTCAGCC CTGATGGCGT TTCAGATCCG CGGCAAGGAC 
GGCAGCAAGG TCTGGGCGTA TGCCGGGATC CGGAAGCCGT CGGGGCAGTT CACGCGCTTT 
GAACCGGATC AGGTAAGCTT TGAACCGCAA CGCACCTGGC ATTCAACACG CACCAACACC 
ACCTATCCAG TCAAAATACG AATCCGGACC GGCACTACCG GCTGGATCCT CACACCCCTG 
ATGGACGACC AGGAACTTGA CTCGCGGCAA TCCACCGGCG CCGTCTATTG GGAAGGCGCG 
GTGACCGTTA CCCGCGATGG CGAACCTGCG GGGCGCGGCT ACCTCGAACT GACCGGTTAC 
GTGGAGCCGC TGAATCTCTA A

Protein sequence

MRVVKRNPGY FTRSRKQRWH DAGFKRLTGT AFLVAALFLA FFTTGRVLAE RPQLSPVVRN 
VPLVFPRDFG AHPGFRNEWW YVTGWLETPE KEPLGFQITF FRVATEHDRA NPSRFAPRDL 
IIAHAALSDP AAGKLLHDQK SARDGFGLAY TTEDNTNVKL GDWFMVREEN GRYQTRIKAD 
HFRLDFSLTP TQSPMLQDLN GFSRKGPHPE QASYYYSEPH LQVSGKVTRD GEEITVKGIA 
WLDHEWSTAY LDPKAVGWDW VGANLDDGSA LMAFQIRGKD GSKVWAYAGI RKPSGQFTRF 
EPDQVSFEPQ RTWHSTRTNT TYPVKIRIRT GTTGWILTPL MDDQELDSRQ STGAVYWEGA 
VTVTRDGEPA GRGYLELTGY VEPLNL