Gene Nmul_A0140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0140
Symbol
ID	3784112
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	145691
End bp	146890
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	55%
IMG OID	637810211
Product	hypothetical protein
Protein accession	YP_410841
Protein GI	82701275
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGATTG CAGGCCAGCC AAAAAAAATT ACTGCATTGA CACGTGTGCG AGACACGTTA 
GCGATACCTC TCGCTGGAAT TGCCACATTT TTCTATGTTC TATGGCAATT GGTGACGGAG 
CAGCAGCTTT TTCTGCGTAC CTTTCTTGTG GAGCGCATGG GCAAGCGTGC TGTGAAGAAA 
CTGCCGCTGG GATATTGGAA TGTGCTGGCG CTCAAAAGCA TCATGTTGTG CCAGCATTTG 
TCTCATAACC CGAACCTGCT GCGAGATGCC CGCAAGCGTA CCGAATCGCG CATCCTGCAA 
CGGTTGCAGG ATCGGGGCGT GCCGCGCGGG CAAGTTCTCC CCATCACGGA ATATCAACCC 
GTCCAGATAG AGCCCCATCG GTTTTACCGG GAGCATGTGA AGCGCGGCGT ACCGTGCATT 
ATGCGCGGGT TCGTGGGTAA CGCGCCGATC GACTGGACGC TCGACAAACT TGCGGAACGT 
TTTCCGGATA CCATCGTCCA GGCGCTGGAC AAGCGGAGCA AGAAGATGGT GAATGTCTCT 
CTGCGCGAGA TTGCGGAGGA CCGCCGCTGC AATTACATTC CGCAGCAATT GTTGCTCGAT 
CAAAATCCGA CTTTCTACGA ATATTTCCGC ATTCCGCGCT CGCATGCGTA TTTCCCCGTC 
ATGGGACGGC CCTCGAAGCC GGTTCTGAGT TTTCTGATCT TAGGCCTGGG AGCGGGATTG 
AACGCCAACT ACCACTGTGA GGAAGGGCCC AACTGGTATC TTGCCGTTTC CGGTTCCAAG 
CGCTGGACCT TGATCGAATC CGAATATTCC TGGTTGCTAT ACCCGGCAGC GCTTGGCAAC 
GGCATGCGCC GGTTTGCGGA GTTCATCGCG GATAAGGAAG GGGAACCGAG CGACCGGGAT 
GCGTATCCCC TGGTGGAGTA TGCGCCGCGT TACGAGTTCG AGCTTCATCC CGGCGACGTT 
CTGTTTTTCC CTGCCTGGAT GTGGCACAAG ACGATCAACC TCAATGAAGA AGGCCTGGGG 
GTCACCTGCC GTTACACTGC CCCGACCGAA ATCTCCAACA GATATTTCCG GGCCCTGCAA 
CTGCTCTCCG GAGGGTTCTG GAAAAGCTGC GTGGAAGTCA TTAGTTGCGG CATACGGGGT 
AATATCGCCT CTCTCGCCAG TGATACCGAC CACAACGAGC AGGAAACAGT GTTGTACTGA

Protein sequence

MEIAGQPKKI TALTRVRDTL AIPLAGIATF FYVLWQLVTE QQLFLRTFLV ERMGKRAVKK 
LPLGYWNVLA LKSIMLCQHL SHNPNLLRDA RKRTESRILQ RLQDRGVPRG QVLPITEYQP 
VQIEPHRFYR EHVKRGVPCI MRGFVGNAPI DWTLDKLAER FPDTIVQALD KRSKKMVNVS 
LREIAEDRRC NYIPQQLLLD QNPTFYEYFR IPRSHAYFPV MGRPSKPVLS FLILGLGAGL 
NANYHCEEGP NWYLAVSGSK RWTLIESEYS WLLYPAALGN GMRRFAEFIA DKEGEPSDRD 
AYPLVEYAPR YEFELHPGDV LFFPAWMWHK TINLNEEGLG VTCRYTAPTE ISNRYFRALQ 
LLSGGFWKSC VEVISCGIRG NIASLASDTD HNEQETVLY