Gene Nmul_A1922 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1922
Symbol
ID	3784160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2210900
End bp	2212048
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	54%
IMG OID	637812008
Product	major facilitator transporter
Protein accession	YP_412609
Protein GI	82703043
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATCCA TCCCCTATTG GCGTCTTTCC GGCTTCTATT TCTTCCATTT TGCCTTTATT 
GGCGCCTTTG CTCCTTACTG GACCCTTTAC CTCAAATCCC TTTCTTTCGC TTCCTTTCAG 
ATCGGGGTGC TCATGTCCCT GCTGCATGTC ACTCGCATCT TTGCCCCGGC TGCATGGGGC 
TGGCTTGCAG ATCACGTCGG CAAGCGAATG TTCATTGTAC GCTCGGCTGC AATTGCAGGC 
TTGGTCAGCT ACTGTGGCGT TTTTCTCGGC GAGTCCTATA GCTGGCTGTT TGTGGTCATG 
GCGCTGATGA GTTTTTTCTG GAGCGCTTCC CTGCCGTTGA TCGAGGCAAC CACACTTTCA 
TACCTGGGAG AAAACATCAC AAAATACGGA CTCATCCGGG TGTGGGGTTC AGTAGGATTC 
ATTCTGGCGG TAACCGGGGT TGGTTATCTG CTGGATGCGA CCAGCATCAG CTCGCTGCTA 
TGGGCTGTCC TTGGCTTCAA GCTCGGTATT GTCTTTTTTT CACGACTGAT TCCTGAAGTC 
GGGACAGCAA CGCATCCTGC CACCGAGCAT TCCATTCCAC AAATATTCCG GCGGCCAGAA 
GTACTGGCCT TTTTTGCAGC GTGCCTGTTG ATGGTGTTTG CGCACGGCCC CTACTACACC 
TTTTATTCGA TCTATCTTGT CGAGTACGGA TACAGCAAAA GTCTCGTAGG CTGGCTGTGG 
GCCACAGGGG TTATCTGTGA GATCGGCATA TTTTTCCTGA TGCCGCAGTT GATGCGCCGA 
TTCCGCATGA AACAGATCAT GGTGTTCAGT TTCAGCTGTG CCGTAGCACG CTTCCTGATG 
ATAGGCTGGG GCGTGGAATG GCCGTTTGTC ATATTTTCTG CACAGGTGCT GCATGCCGCA 
ACCTACGGGG CGCATCACGC CACCGCCATG ATGGTGGTGC ATCGGCTCTT CGGTGGGCGC 
CACCAGGCGA AGGGGCAAGC CCTCTACACC AGTCTCACAT TCGGGCTCGG CGGCACTATT 
GGGGGCATAT TCAGCGGTTA TTCGTGGGAT TGGCTGGGGG CAGGACTCAC TTTTACGATC 
AGTGCGATGG CCGTGTCGCT GGGCTTGGGG CTGGTAGTCT GGAAGATGGA CATCGACGGG 
TCCGCGTGA

Protein sequence

MQSIPYWRLS GFYFFHFAFI GAFAPYWTLY LKSLSFASFQ IGVLMSLLHV TRIFAPAAWG 
WLADHVGKRM FIVRSAAIAG LVSYCGVFLG ESYSWLFVVM ALMSFFWSAS LPLIEATTLS 
YLGENITKYG LIRVWGSVGF ILAVTGVGYL LDATSISSLL WAVLGFKLGI VFFSRLIPEV 
GTATHPATEH SIPQIFRRPE VLAFFAACLL MVFAHGPYYT FYSIYLVEYG YSKSLVGWLW 
ATGVICEIGI FFLMPQLMRR FRMKQIMVFS FSCAVARFLM IGWGVEWPFV IFSAQVLHAA 
TYGAHHATAM MVVHRLFGGR HQAKGQALYT SLTFGLGGTI GGIFSGYSWD WLGAGLTFTI 
SAMAVSLGLG LVVWKMDIDG SA