Gene Nmul_A0529 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0529
Symbol
ID	3784518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	604712
End bp	606016
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	50%
IMG OID	637810611
Product	hypothetical protein
Protein accession	YP_411229
Protein GI	82701663
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.474153
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACCTC AATCCAGCTT CATGATTGTT GCGGCTGTAC GTAACGGGCA GTTGAAAGAC 
CTGCGCGCCT TGCTGGCTTC GATGAATAAC CTGCCCGGTC ATGCTGACCC CAACAATGAA 
CTGATGCCAT TTGGGAAGTT TGATCGCCTG CACTTTGCAC GTTTCGTGCT CATAGAAGCA 
AGAACCGCGC AGGAAATCAG AGCATTCGGC GTAACGCCGA GACCGTGGCA ACCCACGCTC 
GCCTTTCTTG GCGATATTGA CGGGGATATG CAGACTTTTT TTCTGGAACT GATCGAGCGC 
GCGGAGCCGG GTCTGAAAAA AATCTTTTCT CATTGCGAAG GTTTTTCCGA GGAAAATCAG 
GATCTCCTGG GCTGGATGAA GGCAAACAAT ATAAATGCCA GCGCCACCTA TGTTAACTGG 
ATCGGGCGAA CGGTCAGGCA AATCCATGAA GAAGCAGCGC TCCATCGAAG TTTGTCTGCC 
TATCTGCCGA AAACTGTTGA CGATGTGGGC CGGGAGAATG TGCGTGCCTT GCGGCAAAAG 
CTGTTGTCTT ATGTGGAAAT GGAAAAATAT AAAGGCAGGC TTACGTTAAC CCCGCCAGAA 
CCCACGCCCC CCGAATGGAA AATGCGCAAT CTTCTGCATA TGATCGGGGT TCCATTGATC 
CTGCTTCTTC TATCTCCGCT ATTACTGGTT ATCGCACTTA TCTTTGCACT ACGTTTGAGA 
ATGCTCGAAC GCTCTGACCC TGAGCTCTTT ATCCGGCCCA GCCGTGAACA TTTGGCGGAG 
CTTACCGTGC AGGAAGATCG GGATGTCAGT AACCAGTATA GTGTGTTCGG TGACGTGAAA 
CCTGGGGGGG TCCGCTTACT GACTTTCAAA TTCGTACTCC TGGTGACCGA CTATTTGGCC 
CGGCACATAT ACAACCGTGG ATTTCTCGCC CGAATAAAAA CGATTCATTT TGCCCGGTGG 
GTGTTCATGG ACAATAACCA CAGGGTTTTT TTCGCCAGCA ATTACGATGG CAGCCATGAA 
AGCTATATGG ATGATTTTAT CAATAAGGTC GGCTGGGGCC TCAATCTTAC CTTCACCAAT 
GGTGTCGGCT ACCCTACCAC CCGGTGGATC ATCAAGGAAG GTGCAAACCG GGAACATGCA 
TTCAAATATA CGCAAAGGCG GCATCAAATA CCCACCGAGG TTTGGTATAA GGCGTACCCG 
GGATTAACGG CCGTTGATCT GGCGCGAAAC AGTCGTATCC GGCAAGGTGT GGAAATTCGG 
CAATCCAATG ATGCGGAAAT CCGTGAATGG CTCAGCCTGA TCTGA

Protein sequence

MTPQSSFMIV AAVRNGQLKD LRALLASMNN LPGHADPNNE LMPFGKFDRL HFARFVLIEA 
RTAQEIRAFG VTPRPWQPTL AFLGDIDGDM QTFFLELIER AEPGLKKIFS HCEGFSEENQ 
DLLGWMKANN INASATYVNW IGRTVRQIHE EAALHRSLSA YLPKTVDDVG RENVRALRQK 
LLSYVEMEKY KGRLTLTPPE PTPPEWKMRN LLHMIGVPLI LLLLSPLLLV IALIFALRLR 
MLERSDPELF IRPSREHLAE LTVQEDRDVS NQYSVFGDVK PGGVRLLTFK FVLLVTDYLA 
RHIYNRGFLA RIKTIHFARW VFMDNNHRVF FASNYDGSHE SYMDDFINKV GWGLNLTFTN 
GVGYPTTRWI IKEGANREHA FKYTQRRHQI PTEVWYKAYP GLTAVDLARN SRIRQGVEIR 
QSNDAEIREW LSLI