Gene Nmul_A1433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1433
Symbol
ID	3784626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1645228
End bp	1646802
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	44%
IMG OID	637811521
Product	hypothetical protein
Protein accession	YP_412128
Protein GI	82702562
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.158089
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCAAC CCCAAGAAAA TAAGCTTCCA GTTTTTCAAA TACTGGTTTT CTCCAGTCTT 
GTTGTGCTCG CACTTTTTCT ATGGCAGGGG CATAAAGGAT TCTCACTATG GGATGAAGGT 
TTTCTTTGGT ATGGGGTTCA ACGTGTGATG CTAGGTGAGG TGCCTATCCG CGATTTCATG 
GCTTACGACC CCGGCCGTTA CTACTGGTCC GCTACACTCA TGTGGCTGTG GGGAGACAAT 
GGCATAGTGG CCTTAAGGGG TAGCTTGGCG GTTTTTCAAG TGATGGGATT ATTCGTCGCT 
CTACTGTTAA TTGCTCGAAA TACAAGAACG CTAAATTTTC CTTATTTACT TCTTTCAGCC 
ATCACATTGG TGGTCTGGAT GTATCCACGC CACAAATTAT TTGATGTCTC TTTATCTATT 
CTGCTGATTG GAGTATTGGC CTTTCTTGTG CAGAACCCTA CAAGGAGACG TTACTTTTTC 
ACCGGTTTAT GTGTAGGTTT TGTAGCTGTT TTTGGCCGTA ACCATGGGGT ATACGGTGTC 
TTAGGTAGTT TTGGGGTTAT GATATGGCTG ACCATCAGGC AAGCGGATAA GCTTGAATTT 
ATCAAGGTGG CTATGCTATG GGCAGTAGGA GTAGCAATTG GTTATATTCC AATACTTCTC 
ATGATATTGC TGGTACCAGG CTTTGCTCCT GCCTTCTGGG AAAGCTTGCT CTTTTTCCTT 
GAAATTAAAG CAACTAATCT TACTCTACCC GTTCCTTGGC CTTGGCGTTT GGAATTTGAC 
TCCGTATCTA TTGGTAAGAC GATTCGTGGA GTGCTGGTTG GCTTGTTTTT CATCGCTATA 
GTCGTTTTTG GCGTACTTGC TATCATATGG GTTACTCGCC AGAAATTTCA CAAGCGGGCT 
GTTCCATCGG CCTTGGTTGC AACTGCATTC TTGGCATTGC CCTATGCGCA TTATGCTTAT 
TCCCGAGCTG ATGTAAGTCA TCTTGCTAAA AGCATTTTTC CTCTATTAGT CGGTTGCCTA 
GTGCTGTTGT CCACAAAACC AGCGAGGATC AAATGGCCGT TGGCACTTTT GTTATGTGGG 
TCAAGTTTAT TAGTGATGGT GCATTTTCAT CCCGCCTGGC AATGTCGGCC TAGCAAACAA 
TGTGTGAGCA TCGTAATTTC AGACACCAAA GTGACTGTTG ATGCTCGCAC AGCGAGTGAG 
ATCAGTCTAT TAAAGAAATT AGTTGCTAAG TATGCAGCCG ATGGTCAAAG TTTTATCACA 
ACTCCTTTCT GGCCGGGAGC TTATCCCCTG TTCGAAAGAA AGTCTCCTAT GTGGGAGATA 
TACGCCTTGT TCTCGCGAAG TGAAAGCTTT CAACAGCTAG AAATTGAACG AATCAAGGTG 
ACAAATCCAG GTTTTATCCT GATATTCGAT TTCCCTCTTG ATGGGCGGGA GGAGTTACGT 
TTCTGCAATA CACATCCCCT AATTCATAAA TATATCTCGG ATAACTTCGA GATGCTGCAC 
GATTCGCCAA ACCTGATCTA TCAAATATAT ACAGTCAAGA AGACAATCTT ATCAGAGCAT 
TCTGGATCCC CCTAA

Protein sequence

MHQPQENKLP VFQILVFSSL VVLALFLWQG HKGFSLWDEG FLWYGVQRVM LGEVPIRDFM 
AYDPGRYYWS ATLMWLWGDN GIVALRGSLA VFQVMGLFVA LLLIARNTRT LNFPYLLLSA 
ITLVVWMYPR HKLFDVSLSI LLIGVLAFLV QNPTRRRYFF TGLCVGFVAV FGRNHGVYGV 
LGSFGVMIWL TIRQADKLEF IKVAMLWAVG VAIGYIPILL MILLVPGFAP AFWESLLFFL 
EIKATNLTLP VPWPWRLEFD SVSIGKTIRG VLVGLFFIAI VVFGVLAIIW VTRQKFHKRA 
VPSALVATAF LALPYAHYAY SRADVSHLAK SIFPLLVGCL VLLSTKPARI KWPLALLLCG 
SSLLVMVHFH PAWQCRPSKQ CVSIVISDTK VTVDARTASE ISLLKKLVAK YAADGQSFIT 
TPFWPGAYPL FERKSPMWEI YALFSRSESF QQLEIERIKV TNPGFILIFD FPLDGREELR 
FCNTHPLIHK YISDNFEMLH DSPNLIYQIY TVKKTILSEH SGSP