Gene Nmul_A0719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0719
Symbol
ID	3786065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	834224
End bp	835924
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	56%
IMG OID	637810801
Product	glycoside hydrolase family protein
Protein accession	YP_411418
Protein GI	82701852
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1449] Alpha-amylase/alpha-mannosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACCAG TACAATTAGT CTTGCTGTGG CACATGCATC AGCCGGATTA TCGCAATTAC 
GAGACCGGCG AATTCATGCT CCCATGGGTA TACCTGCATG CGATCAAGGA TTACAGCGAT 
ATGGCTGCTC ACCTTGAGGC TCATCCCCAC ATGAAGGCGG TGGTCAATTT CGTGCCGGTA 
TTGCTCGATC AGCTCGAGGA CTATGCCACC CAGTTTGCTT CCGGAGAGAT CCGGGATCCG 
CTGTTGCGGT TGCTGGCTAT CCCCAGCCTG GATGACGTTT CCGAAGAAGA TCGGTTACGC 
GCCTTCGACA GTTGTTTTCG CAGCAATCAT CTGACCATGA TGCAGCCATA TCCCGCGTAC 
AAACGCCTGT ACGACATCCA TGAAATGTTG AGGGAATACG GAGATGGGGA ATTGACCTAT 
CTTTCCGGCC AGTATCTTGC GGATCTGCTT GTCTGGTATC ACCTGGCTTG GACGGGTGAA 
AGTGTGCGGC GAAGCAGTGA GGTTGTGATC CAGTTGATGA CCCAGGCGAA GGGTTTCAGC 
TATGCAGACC GAATGCAGTT GCTCGATGTG ATCGGAGAGG TTGTGCAGGG CTTGATTCCT 
CGTTATCGCA AGTTGGTGGA GTCGGGGCAG ATCGAGCTTT CCACCACACC GCATTACCAT 
CCGCTCGCAC CCTTGCTGAT CGATTTTTCA TCCGCTCGCG AAAGTGTGCC GGGTTCGGCT 
CTGCCGATCG AACCGGTTTA TCCCGGCGGG CGGAGCCGCG TCGCATCCCA ACTGGTTTCC 
GCCATTGAAA GCCATGCCGC GCGTTTTGGC GCAAGACCCG AGGGAGTATG GCCGGCGGAA 
GGAGCGGTAT CGGCACCGCT ACTTGAGATA CTGGGTGAAA AAGGTTGCCA GTGGTGCGCC 
AGTGGCGAAG GGGTGCTGGC GAACAGTTTG CGTCACTCCT ATCCGGGCGA GCCTCTGCCG 
GAGAGGAGCC GCTTTCTTTA CCGGCCATAT CGGGTTGACG GCAAATCAGG CGATGTCATT 
TGCTTCTTCC GGGACGAGAA GTTGTCGGAC ATGATCGGTT TCGAATATGC CAAGTGGTTT 
GGTCGGGACG CTGCCGAGCA CCTGGTGCGA TCTCTGGAGG AGATCGGGCA CAGCGCATTG 
CCGGGAGAGA AACCGGTGGT GAGCGTGATT CTCGACGGTG AGAATGCCTG GGAATACTAT 
CCTTACAATG GATATTATTT CCTCAATGAT CTGTACGAAA TTCTGGAAAA CCATCCTTCC 
ATCCATTCCA CGACCTATCG CGACTATATC GCGTCCGAGA ACGAGAAGGA AGCGGCCCGC 
CTGCCGCTTC TGACCGCCGG CAGCTGGGTG TATGGAACTT TCTCCACCTG GATCGGGGAT 
CGGGACAAGA ACCGTGCGTG GGATCTGCTG AGCGCCGCCA AGCACAGTTA TGATCTTGTC 
ATGCAAAGTG GGCGCCTGAC CCCTGACGAA AGAAAGAAAG CGGAGCGGCA GCTTGCGTCC 
TGCGAAAGCT CCGACTGGTT CTGGTGGTTG GGGGACTATA ATCCGCCTTA CGCGGTATCG 
AGCTTCGACC AGTTATTCCG CGACAATCTT GCCAATCTTT ATGTCCTGCT GAAATTGCCC 
GTACCCATTT CCATCACTGA GCCAATCAGC CACGGAGGAG GAGTGCATGA AACGAGTGGT 
GCGATGCGGC GTGCTTCCTG A

Protein sequence

MQPVQLVLLW HMHQPDYRNY ETGEFMLPWV YLHAIKDYSD MAAHLEAHPH MKAVVNFVPV 
LLDQLEDYAT QFASGEIRDP LLRLLAIPSL DDVSEEDRLR AFDSCFRSNH LTMMQPYPAY 
KRLYDIHEML REYGDGELTY LSGQYLADLL VWYHLAWTGE SVRRSSEVVI QLMTQAKGFS 
YADRMQLLDV IGEVVQGLIP RYRKLVESGQ IELSTTPHYH PLAPLLIDFS SARESVPGSA 
LPIEPVYPGG RSRVASQLVS AIESHAARFG ARPEGVWPAE GAVSAPLLEI LGEKGCQWCA 
SGEGVLANSL RHSYPGEPLP ERSRFLYRPY RVDGKSGDVI CFFRDEKLSD MIGFEYAKWF 
GRDAAEHLVR SLEEIGHSAL PGEKPVVSVI LDGENAWEYY PYNGYYFLND LYEILENHPS 
IHSTTYRDYI ASENEKEAAR LPLLTAGSWV YGTFSTWIGD RDKNRAWDLL SAAKHSYDLV 
MQSGRLTPDE RKKAERQLAS CESSDWFWWL GDYNPPYAVS SFDQLFRDNL ANLYVLLKLP 
VPISITEPIS HGGGVHETSG AMRRAS