Gene Nmul_A0439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0439
Symbol
ID	3785907
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	488291
End bp	489646
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	53%
IMG OID	637810515
Product	hypothetical protein
Protein accession	YP_411139
Protein GI	82701573
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.286489
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCC TACCGAAACG CAGAAGAGGG ATGATCTTTG CCTCTGCGGT CAGCCTGTTT 
ACAACTCTCG AGAATCCCGA CAGCGCTTAC GCCAATACCG CCTTGGAATG GTTCAACGAC 
AATGGCATTA GACTCGGGGG CTGGATCAAC GGTGGGGCGA CATTCAATCC CAGCCAGCTC 
ACCGGTTTCA ATGGGCCAGT CACATTTGCC GATCGCTCCA ACAGATTCCA GTTAAACCAG 
TTCAATATTT ATGTGCAACG CCCGGTAGTA GCCGAGGGCA GCACCTGGGA TTTCGGGGGG 
CGTATCGATT TCATGTTTGG AACGGATGCA ATTTTTACCC AGGCTTATGG CGTTCCCGCG 
TTCGACGTGA ACACAGGCCA GCCTTTAAAC AGGAGCAATT GGGATCTTGA TGTGTGTTGC 
GCTTCAACCC GATATTATGG CATTGCGTTT CCGCAGGTTT TTGCCGAAGC CTATGTTCCC 
GTTGGGAACG GATTGAACGT CAAGGTAGGC CATTTTTACA CTCCAATCGG TTACGAGTCG 
GTACCGGCGC CCGACAATTT CTTTTACACT CATGCCTATA CGATGCAGTA TGGAGAGCCG 
TTCACGCATA CTGGTGTGCT GGGCAACTAT AAAATCACGC AAAACTGGAC GTTCATGGGG 
GGCGTTACCA CAGGTAGTGC CACTGGCGGT TGGGACGGGG GATTCGACAA GCAGTTGGGT 
AATTGGGGGG GGATTGCAGG CATTACCTGG ACCAGCGAGG ATATGGGAAC GTCGGCCAAT 
ATCAGCGGAA CCTACAGCGC AACCTCGACA CGCAGCGATG AACCGTGGAT GTTGTACAGC 
ATCGTGCTGA AGCATAAATT CACCGAAAAG ACCCATTTTG TGCTGCAACA CGACCACGGG 
TTCGCGGGAA ATGTTTTACT GAATAATGTC TTTTATAGTA ACGTGATCAA GGATGCCGAA 
TGGTACGGCA TCAACACTCA TCTGTATTAC GATCTCATGC CGGAATTGAC GATCGGAGTG 
CGGGCCGAGT GGTTCCGCGA CCGGGACGGG TTCCGTGTAT TTTCACCGGG ACGGGTGGCT 
GCCGCCACCG ACAACCGGGG ATTCAGTTAC GCGCTAGGCC GCAATCAGCT TGGCAACAGC 
ACCAGCAGTC CGGCTGATTA TTATGCAGTC ACGGTAGGCA TGAACTGGAG GGCGGCGAAG 
AGGTTGAAGC TCGACTGGAA GCCGTTGCAG CAGCTCAATA TTCGTCCAAA CGTTCGCTAC 
GATGCCGCCG ACGGATTACA TGGCATCGAT TATCGGCCCT TCGGGGGGCA TAAAGATCAG 
GTGGTTTTAT CCCTTGATTT TATGGTTCCG TTTTGA

Protein sequence

MKRLPKRRRG MIFASAVSLF TTLENPDSAY ANTALEWFND NGIRLGGWIN GGATFNPSQL 
TGFNGPVTFA DRSNRFQLNQ FNIYVQRPVV AEGSTWDFGG RIDFMFGTDA IFTQAYGVPA 
FDVNTGQPLN RSNWDLDVCC ASTRYYGIAF PQVFAEAYVP VGNGLNVKVG HFYTPIGYES 
VPAPDNFFYT HAYTMQYGEP FTHTGVLGNY KITQNWTFMG GVTTGSATGG WDGGFDKQLG 
NWGGIAGITW TSEDMGTSAN ISGTYSATST RSDEPWMLYS IVLKHKFTEK THFVLQHDHG 
FAGNVLLNNV FYSNVIKDAE WYGINTHLYY DLMPELTIGV RAEWFRDRDG FRVFSPGRVA 
AATDNRGFSY ALGRNQLGNS TSSPADYYAV TVGMNWRAAK RLKLDWKPLQ QLNIRPNVRY 
DAADGLHGID YRPFGGHKDQ VVLSLDFMVP F