Gene Nmul_A1511 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1511
Symbol
ID	3786097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1728258
End bp	1729556
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	54%
IMG OID	637811599
Product	hypothetical protein
Protein accession	YP_412206
Protein GI	82702640
COG category	[S] Function unknown
COG ID	[COG1262] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03440] conserved hypothetical protein TIGR03440

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.92317
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACGC CGTTGTACGT AAAATATTCC TCGATCCGCG ACCGGACTTT GAGTCTGATC 
GAGCCGCTGA TCGACGAGGA CTGCTGTGTC CAGTCCATGC CCGGGACAAG CCCGGTAAAG 
TGGCACCTGG GGCATGCTTC CTGGTTTTTT GAGAAGTTTG TATTGCAGCA CTATGAAAAG 
CCCTTCACCC CTTTTCACCC GGCTTTTCTC ATGATGTTCA GCTCGTACAA TAAATCAGGT 
CAGACCCATC CTGATCCGAA ACGCGGGCTG TTCACCCGCC CATCCTTGTC CTTGACGCGA 
GAATACCGCA ATAACGTCAA CGAACGTATG GAGCAGGTCC TGAAACGTTC GGAAGAAGAC 
GAAATGCTGC GCATGCTCGC GGTGCTGGGA ATGCATCATG AGCAGCAGCA CCAGGAACTC 
ATGCTGGCCG ACGTCAAACA TCTGCTTTCC CAAAGCCCTT TGAACCCTTC CTATAATAGC 
CAGCCGCTCC TTGATTCCCC TGTCCCCCCG CCCCTCGAAT GGTGTCGTTT TGACGGGGGT 
CTCGTTGAAA TAGGCTATAA GGGAGACGAG TTCAGCTACG ACAATGAATC GCCCCGTCAC 
AAGCAATACC TGCAACCCTA TCAGCTCGCA TCCCGGCTTG TCACCAATCG CGAATACCTC 
GAATTCATGA AAGCCGGCGG ATATGACAAT CCCGGCGTGT GGCTTTCCGA AGGATGGGAC 
TGGATGAAAG CCAACCGCCG GTCGCATCCT CTTTACTGGC GGGAAAGCGA TCAGGGATGG 
GAGGAATTCA CTCTCAGCGG TGCCATGCCA CTGGACCTGA ATCTGCCGGT CATTCATGTG 
TCCTTCTACG AAGCCGATGC CTTCGGACGA TGGGCGGGCG CCAGACTCCC CACGGAAGCT 
GAATGGGAAA ATGCTGCTTC TCAACAGGAA ATAGAAGGTT GCTTCGCTGA TAACAACCGT 
TTTCATCCCT CCTCCGCAGG CGGCTCTACG CCATCTGCAA ATACCGGGGG TCTTGCTCAA 
CTCTATGGTG ATGCATGGGA ATGGACGCAG TCGAGCTACT CCCCTTACCC GGGTTACAAT 
CCTGCAAAAC CCAACGAGAA CGAACCGATG TCCTTTGTCT GGGATGAGGC GGTAGGCGAA 
TATAACAGCC GGTCTATGGT GAACCAGTAT GTGTTGCGCG GCGGGTCATG CGCAATTCCA 
AAAGAGCGGA TACGGGCAAG TTTTCGTAAT TTCTTCCCCG CGGATACATG CTGGCAGTTT 
TCCGGAATTC GTCTTGCAAG AGACTTGAGA GATTCTTAA

Protein sequence

MTTPLYVKYS SIRDRTLSLI EPLIDEDCCV QSMPGTSPVK WHLGHASWFF EKFVLQHYEK 
PFTPFHPAFL MMFSSYNKSG QTHPDPKRGL FTRPSLSLTR EYRNNVNERM EQVLKRSEED 
EMLRMLAVLG MHHEQQHQEL MLADVKHLLS QSPLNPSYNS QPLLDSPVPP PLEWCRFDGG 
LVEIGYKGDE FSYDNESPRH KQYLQPYQLA SRLVTNREYL EFMKAGGYDN PGVWLSEGWD 
WMKANRRSHP LYWRESDQGW EEFTLSGAMP LDLNLPVIHV SFYEADAFGR WAGARLPTEA 
EWENAASQQE IEGCFADNNR FHPSSAGGST PSANTGGLAQ LYGDAWEWTQ SSYSPYPGYN 
PAKPNENEPM SFVWDEAVGE YNSRSMVNQY VLRGGSCAIP KERIRASFRN FFPADTCWQF 
SGIRLARDLR DS