Gene Nmul_A1956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1956
Symbol
ID	3785134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2247040
End bp	2248287
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	52%
IMG OID	637812044
Product	hypothetical protein
Protein accession	YP_412643
Protein GI	82703077
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCTACA CGTCAAGTAA CCCCATTCCC CGCTGTTTGA CGCGAGCGAT TATCCGGCTC 
GTCGTGGTGG GTGCTGCCCT TTCGAATTGT ATTGCTTACG CGCAAAAACT GCCGATTCCC 
CAGAACCTGC CGAACAACCT GCAAATACAT GGTTTTGTTA GCCAGAGTTG GCTCAAGAGC 
ACGGACAACA ATAACGTTTT CGGGAAAAGC AGTTCCGATA GTGGAAGTTT TGACTTCAGG 
GAATTGGGAC TGAATGCTTC CATGAGGCCC AAGCCCAACC TCCAGTTTTC GGCTCAGATG 
ATTTCCCGCA CTGCGGGAAA AGGAAGTCCG GGCAATATCC GGTTCGATTA CGGATTCATC 
GATTATGCGT TTCTATCGGA AGAAAACAGC AAGATAGGAA TACGCCTGGG CAGGATGAAG 
AATCCGCTCG GCTTTTACAA CGACACACGC GACGTTCCCT TCACGCGGCC CAGCATACTT 
TTACCTCAAT CCATCTACTT CGATCGCACG CGCAAATTGG GGATTGCAGC AGATGGGGTA 
CATTTATACG GTGAATACCG TTTCGAGCAC GGCGTCCTGT CTTTTCAGGG TGGACCGGTA 
CGTCCACTAG TCAGAGGTGC TGAAGCAGAA GTAGCGCTGT TGGGCCAGGG GATGCCAGGC 
CATCTTGCTC CAGACATCTC CTATATTGGC CGTATAAGCT ACGAACTCGA CGAGGGCCGG 
CTTCGTTTTG CAGTCAGCGG AACGAATTTG AACATAGATT ATGACCCCGC AAGCGGGGAC 
CGGCTTGGCG CGGGCTCAAT TCGCTTTACA CCTCTCATTT TCTCCGCGCA ATATAACGCA 
GAACGCTGGA GTTTCACTTC GGAATACGCG ATACGCCATT TCGAATATAA AAATTTTGGC 
AGGGCGGCCC TCAATCTGGA TTTCTTTGGC GAAAGCTATT ACCTTCAGGG AGCTTATCGA 
ATCACGCCGG AATTGGAAGC GATCGCTCGC TACGACGTAC TGTATACGGA CAGTAATGAC 
CGCAGCGGAA AAAAATGGGC AGCGGCTACA GGCGGCGATC CGCATCGGCG GTTTGCTAAA 
GACATTACCG TAGGGTTGCG CTGGAACGTC ACGCCTGAGT TCATGTTGCG CGCCGAGTAT 
CACCGCGTGA ACGGAACAGG CTGGCTTTCG ACTCTTGACA ATCCCAATTC GGGAGACCTT 
TCACCGCATT GGAATCTGTT TTCCATTCTC GGCTCCTACC GGTTCTAG

Protein sequence

MFYTSSNPIP RCLTRAIIRL VVVGAALSNC IAYAQKLPIP QNLPNNLQIH GFVSQSWLKS 
TDNNNVFGKS SSDSGSFDFR ELGLNASMRP KPNLQFSAQM ISRTAGKGSP GNIRFDYGFI 
DYAFLSEENS KIGIRLGRMK NPLGFYNDTR DVPFTRPSIL LPQSIYFDRT RKLGIAADGV 
HLYGEYRFEH GVLSFQGGPV RPLVRGAEAE VALLGQGMPG HLAPDISYIG RISYELDEGR 
LRFAVSGTNL NIDYDPASGD RLGAGSIRFT PLIFSAQYNA ERWSFTSEYA IRHFEYKNFG 
RAALNLDFFG ESYYLQGAYR ITPELEAIAR YDVLYTDSND RSGKKWAAAT GGDPHRRFAK 
DITVGLRWNV TPEFMLRAEY HRVNGTGWLS TLDNPNSGDL SPHWNLFSIL GSYRF