Gene Nmul_A2008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2008
Symbol
ID	3784499
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2307292
End bp	2308578
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	57%
IMG OID	637812097
Product	hypothetical protein
Protein accession	YP_412695
Protein GI	82703129
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATATCC ACCGCTGCAT TCAGCGCGAG GTCTGGAGCA AGGAGGCCCT TGGCGATCGG 
ATCATCATGC GCGTCGCGTT GCCGTTCGTA CCGTTCATAC TTGCTGTTCT GGTAGCGGTT 
TTCACAGCGA TCAATGGTCG CGCTATCAAG AAGCGGACGG GGAAAGGTTT AATCCGCCAG 
ATCCAGGAGC AGATTGAGCT TGCGATACGC TTTGCGATTC TACCCCCATG GTATTACATC 
TTCGAACTGC ATGACGATGA CAAGAAACTG CATGCAGGGG AGTATCTGAA CCGGCTTGAG 
ACGAAAGGGG GACTCTATCG CTTCCTGCGC GATAACAACG GTGGTCTCCC TATTCCCGCG 
GAACGCAGCA CCGGCTCCAT AAAGGATAAG GGACGCTTCC GGGCTCGCTG TCGTGCGCAT 
GGGATCACAA CTGCTCCCGT TTTTTTTAAT GTGGCGCAGG AAAAGATTAC GGCGGTGGAT 
TGGGGTTTGC CGGAACTACC GGCACTGCCC GAATTACCCG AGCGCGATCT CTTCATAAAA 
CCCGTTCACG GACAGGGCGG GAAAAAGGCC ACGCGCTGGG ATTATCTCGG TTCCGGGCAA 
TTCCGCCGCA ATGACGGCGA AGTTGCTACT GGAAGTCAAG TGTTGGAGCG GCTGCGGCAC 
GCATCGCGGC ACGCGGCTTT CCTGGTGCAG CCGCGGCTTG TGAGTCACTG TGAGATTGCC 
GATCTGGCCA ATGGAACACT TTCCACCGTT CGCGTGATGA CATGCCGTAA CGAAAAGGGG 
GAGTTCGAAG TGACCAATGC GGCTTTTCGC ATGGCGCGAA ACAAGCTGGT CGTCGTCGAT 
AACTTTCACG CTGGGGGTAT TGCAGCCAAT GTCGACATTT CCACCGGTAC GCTCGGAAGG 
GGTACGCGCG GGGCTTGGGG AGCCACGGGC GACGGATGGT ATGAACAACA TTCCGAAACC 
GGGGCGCAGA TCCAAGGTCG CAAGCTGCCG TGCTGGTTTG AGTTGGTCGA GCTGGTGCAA 
TATGCGCATG GCGCCGCGTT TTCTGACCAG GTTGTCATTG GATGGGATGT TGCTCTGCTC 
GACAGTGGTC CATGCATCAT GGAAGCCAAC AAGGCGCCCG ATCTGGACAT TATCCAGCGG 
GTGGAAGGCG TGCCCCTGGG CAATCAGCGC CTGGGAAAAC TTCTGGCATT CAATCTGATG 
CGTACCGTCG AGGCGCAGCA TGCACCTGCA GCGGGCGCCC GAAAGAGCGC CGATAGTTCG 
CTGGGAACGC AAACGGAAAA ACCGTGA

Protein sequence

MYIHRCIQRE VWSKEALGDR IIMRVALPFV PFILAVLVAV FTAINGRAIK KRTGKGLIRQ 
IQEQIELAIR FAILPPWYYI FELHDDDKKL HAGEYLNRLE TKGGLYRFLR DNNGGLPIPA 
ERSTGSIKDK GRFRARCRAH GITTAPVFFN VAQEKITAVD WGLPELPALP ELPERDLFIK 
PVHGQGGKKA TRWDYLGSGQ FRRNDGEVAT GSQVLERLRH ASRHAAFLVQ PRLVSHCEIA 
DLANGTLSTV RVMTCRNEKG EFEVTNAAFR MARNKLVVVD NFHAGGIAAN VDISTGTLGR 
GTRGAWGATG DGWYEQHSET GAQIQGRKLP CWFELVELVQ YAHGAAFSDQ VVIGWDVALL 
DSGPCIMEAN KAPDLDIIQR VEGVPLGNQR LGKLLAFNLM RTVEAQHAPA AGARKSADSS 
LGTQTEKP