Gene Nmul_A0402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0402
Symbol
ID	3785395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	445010
End bp	446086
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	54%
IMG OID	637810478
Product	permease YjgP/YjgQ
Protein accession	YP_411102
Protein GI	82701536
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0017509
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAATAA TAGAACGATA TATCACGCGG GAACTGCTGA TACCGTTTAT GGTAGTCACC 
GTAATCCTTG CGACATTGTT TGCAAGTTTC AGTATGGCCC GTTTTCTTGC CGGAGCAGTG 
ACAGATTCGC TTGGCCTTAT CCCCGTGCTC AGGCTCGTGT TTCTGAAAAC GCTGATCGCA 
CTGGAAGTGC TGATGCCCAT TGCCCTGTAC GTGGCTGTCA TCATGGGACT GGGTCGCCTG 
CACCGGGATC AGGAAATAGT CGTTTTGCGT TCCGCTGGGG TCAGCGAACA CCGCATTATC 
TATGCGGTGC TCATCGTTGC GATTCCTATG GGGCTTATCA GTGGTTTATT TTCCATTTTT 
GCGCGTCCAT GGGCGTATGA GGAAAGCTAC CTACTCAATG CCCAGGCAGA GGCAGAGTTG 
AATACGGATC GGTTCCGCGC CGGGCGTTTC TACGGCAGCG AAAAAAAAGG CCGGGTGATT 
TATGTGCAGG CCAAGGATAG CTCGGGCAAG CAGATGGGAG AGGTATTCCA CTATCTGAAC 
AAGCATGACA GCAGCGAGAT CATTCTTGCC AAGAAAGCTC ACCAGCCTGA GCTTGTGTTC 
GGCCAGCGCC CCCAGATACA TCTGCTGGAT GGCTCCATTT ACCGGCTATC GCACACCGGA 
AAAGGCGATA CCGTCGTCCA GTTTGAAAAG CTGGTTTATT TCACGGACAG CGGAAACGTA 
ACGGATTACA GGCGCAAGGC TGCCTCTACC GCGGCATTGA TGCAATCTGA TCAGCCGCGG 
GATACTGCCG AGCTTCAGTG GCGGCTGTCG CGCCCGCTGG CAACGATCCT GCTGGCGCTG 
ATAGCGGTGC CCTTCAGCCG CGCTTCACCC CGCCAGACAA AGGGAGATAA GACTTATTAT 
CTGGCAGCTC TGGTTTTCGC CATTTACTAC ATTTTGAGCG GATTGGCCCA GACTTGGGTC 
GAGCAGGGCA CGATCGGGAG GGTGCCGGGT GTGTGGTGGC TCTATGCTGT CATGCTGCTG 
TTTGCAATCT CGTTATTATC GCCTGGTTTC TGGCGGAAGT TGCCTTTGCG CAGATGA

Protein sequence

MKIIERYITR ELLIPFMVVT VILATLFASF SMARFLAGAV TDSLGLIPVL RLVFLKTLIA 
LEVLMPIALY VAVIMGLGRL HRDQEIVVLR SAGVSEHRII YAVLIVAIPM GLISGLFSIF 
ARPWAYEESY LLNAQAEAEL NTDRFRAGRF YGSEKKGRVI YVQAKDSSGK QMGEVFHYLN 
KHDSSEIILA KKAHQPELVF GQRPQIHLLD GSIYRLSHTG KGDTVVQFEK LVYFTDSGNV 
TDYRRKAAST AALMQSDQPR DTAELQWRLS RPLATILLAL IAVPFSRASP RQTKGDKTYY 
LAALVFAIYY ILSGLAQTWV EQGTIGRVPG VWWLYAVMLL FAISLLSPGF WRKLPLRR