Gene Nmul_A2087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2087
Symbol
ID	3786091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2380050
End bp	2381135
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	49%
IMG OID	637812176
Product	hypothetical protein
Protein accession	YP_412773
Protein GI	82703207
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTATTGG CAGCCTTTTT TCTTCTAAAT GCAAGCCCCT CCGCAGGAGC AGGGGGTGAC 
CTTGACGATA GACTGCGCTC GCCACTGACA CTCGCTGCCT ATGTTGAAGG TTACTACAGT 
CACGATTTCA ACGAACCGGT AAATAACGCT AAACCTCCCT TTCTCACCAG CTTCAGCAAA 
AGCAATCAAC CCGCAGTAAA TCTCGCCTTC ATAAAGGCAT CGTACGCAAC ACCCAATATC 
AGGGCAAACT TTGCGCTCGC AGCAGGCACC TACATGAACA CGAACTATGC TGCAGAACCT 
GGCATTCTGG GCCATTTATA CGAAGGCAAC ATCGCCTTGA GACTATCCGG CGAAAATAAA 
CTCTGGCTGG AAGCTGGCGT TTTCCCTTCG CATATCGGCT TTGAAAGCGC AACAGGGAAA 
AACAATTGGA CCCTGACGAG AAGCATGGCG GCGGAGAACA CACCCTATTT CGAGTCAGGC 
GTCAGGATCG ACTTCACTTC GGCTGATGAT AAATGGTTTT TAAGCGGATT GGTGCTGAAC 
GGCTGGCAAC ATATAAAACC GGTGGACGGA AACACGCTTC CCGCCTTCGG CACACAGATT 
ACCTACCGAC CTTCTCCTGA AATAACGTTC AATAGCAGCA CCTTTGCGGG CAGCGACAAG 
CCCGACAGTC ACCGGCAAAT GCGTTACTTC CATAATTTCT ACGGAATTTT CAAACTGAAT 
GAGGAGCTTG CAGCGACTGT TGGATTCGAT ATCGGCGTCG AACAAAAAAG CAAGCATTCG 
GGCAGCCTTA ACACGTGGTT CAACCCTACA GTCATTCTGA GATATGTGCA AACGCCCAGA 
ACAGCGGTTG CTGTAAGGGC AGAATACTAC AATGACAAAC AAGGCGTAAT GATTGCATCC 
GCAAAGCCTC ATGGTTTCCG GACATGGGGT TTTTCAGCCA ATTTCGATTA CAACATCACT 
GACAATCTGC TGTGGAGGCT TGAGGCCAGA ACGCTGCTCA GTAAAGACGA TATTTTTGCT 
GGTAAAAATG GTACTTCCAG AGATAGCGCC ACTTTTTTCA CTACGTCGAT CGTCGCCCAT 
TTTTAA

Protein sequence

MVLAAFFLLN ASPSAGAGGD LDDRLRSPLT LAAYVEGYYS HDFNEPVNNA KPPFLTSFSK 
SNQPAVNLAF IKASYATPNI RANFALAAGT YMNTNYAAEP GILGHLYEGN IALRLSGENK 
LWLEAGVFPS HIGFESATGK NNWTLTRSMA AENTPYFESG VRIDFTSADD KWFLSGLVLN 
GWQHIKPVDG NTLPAFGTQI TYRPSPEITF NSSTFAGSDK PDSHRQMRYF HNFYGIFKLN 
EELAATVGFD IGVEQKSKHS GSLNTWFNPT VILRYVQTPR TAVAVRAEYY NDKQGVMIAS 
AKPHGFRTWG FSANFDYNIT DNLLWRLEAR TLLSKDDIFA GKNGTSRDSA TFFTTSIVAH 
F