Gene Nmul_A1509 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1509
Symbol
ID	3786095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1724956
End bp	1726155
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	55%
IMG OID	637811597
Product	hypothetical protein
Protein accession	YP_412204
Protein GI	82702638
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGCTG TGCCGGAAAA GCTGCTTCCT GAAAGACTGG ATGGGGAATC AGAAGAAGGT 
CCTCCCGGCA CTTCCGCTCA GGCGATAGAT GAGGAGGCCG CGGCACCTCG CGCTCTACCT 
CGTTTTGGGA CAGCTATCGC ACTCTGGATA ATCGCGCTGG TCGTGCTGTT GGGAGGCCTG 
CATTTCGCGC AGACCTTTTT TGTTCCCTTG TTGTTCGGCG TTCTCGTGAG TAACGCGTTA 
AGTCCTGTAG TTGATTGGCT CGAGCGCTGC CGCGTCCCTC GCATACTCGG GGCTGCGCTT 
GTGCTTGTTG TCCTGCTTGG CGGCGTTTCA TGGGTAACCT TATCCTTGAG CGGTGATGCA 
AGTCTTATAG TTGAAAAACT TCCTGAAGTT GCGCACAAAT TGCGGCATAG TCTGAGAACG 
CTGCGATCCG AGGGTCCAAG CGTATTGCAG CAGGTCGAGA AAGCGGCGAA AGAGCTTGAG 
AAGGCGGCGG TAGATGCAGG GTTGAAATCG CCCGCGGCGG CAGTGGTTAT TACAAGCCAC 
GCGGAAGATG GCGCATGGGT CAAGGATTTT CTACTCAAGC AATCCGCGTT GCTGGTCTCG 
TTTGCCGCGC AAATGCCGGT CGTGTTGCTG CTGACCTATT TCCTGCTGGC AGCAGGGACA 
CATTTTCGCC GCAAGCTCAT AAAACTGGTC GGGCCATCTC TGACACGCAA AAAGGATGCG 
GTTCGAATAC TGGAGGAAGT ACATTTGCAG GTCCAGCGCT ACCTGCTTGT CTTGATCATA 
TCGAATACTT TGATCGCCGT ACTCACCTGG TGGGCATTTG AATTGTATGG ATTGGAACAC 
GCCGGAGTGT GGGGGGTCGC TGCCGGCATA TTACGTTTTG TTCCTTATCT CGGGACGATG 
ACTATCCTGC TGGCAAGCGG TATAGCAGGC TTGCTGCAAT TTGGTTCTCT TCCGCTTGCG 
CTCGCGATAG CTGCGACAGC AGTTTTGATT TCCGGCTCTA TTGGAATGTT GTTCGGCACT 
TGGTTGCAGG GAAGATTCGC GCGAGTGAAT GAGGCGGTGC TGTTCATCGT GCTGTTATTT 
TTTGGCTGGC TGTGGGGCGT GGCCGGCTTG CTTCTGGGGG CGCCGCTATT GGCCGTCGCA 
AAAGTGGTTT GCGATCGGAT CGAATCGCTC AAGCCCGTGG GTGAAATGCT GGGGCGGTAG

Protein sequence

MSAVPEKLLP ERLDGESEEG PPGTSAQAID EEAAAPRALP RFGTAIALWI IALVVLLGGL 
HFAQTFFVPL LFGVLVSNAL SPVVDWLERC RVPRILGAAL VLVVLLGGVS WVTLSLSGDA 
SLIVEKLPEV AHKLRHSLRT LRSEGPSVLQ QVEKAAKELE KAAVDAGLKS PAAAVVITSH 
AEDGAWVKDF LLKQSALLVS FAAQMPVVLL LTYFLLAAGT HFRRKLIKLV GPSLTRKKDA 
VRILEEVHLQ VQRYLLVLII SNTLIAVLTW WAFELYGLEH AGVWGVAAGI LRFVPYLGTM 
TILLASGIAG LLQFGSLPLA LAIAATAVLI SGSIGMLFGT WLQGRFARVN EAVLFIVLLF 
FGWLWGVAGL LLGAPLLAVA KVVCDRIESL KPVGEMLGR