Gene Nmul_A0641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0641
Symbol
ID	3785414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	736043
End bp	737203
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	53%
IMG OID	637810723
Product	hypothetical protein
Protein accession	YP_411340
Protein GI	82701774
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGTTATC TGAATATCAT CGCAGCCATG TTGTTTTTTA CCTCAACTGT CCATGCTGCG 
GTAACGGAGG ATGCCTATAT CGCCGGTTAC GCGGCGGGTG TCCTGAAACA TGGCTTTGGA 
ATGGAGATTC CGACTCTGGT GGTGAAAGAT GGCATCATTA CCGTACCTGA AGATAAACTG 
AAATCCGAGA ACCAAGCGCA GGTTGTTCAG GCACTGTCGA AAATCCCTGG TGTGACCGGA 
GTGACCATAG CGGAAAAAAG TGTCAGCAGA ATCGCAGAAC GCGAGGCATT CAAGCCTATT 
CAACACCCTT CCGCCATCTC TCGGGAGCCT GGAGCGGCAA CGACCGAGAC CGCAGGCGTA 
CCTGCGGCGG GTCCCACCGT TCTGGCAACC GGAATGCTGC CGGAAGGACA TTTGTTCAAG 
CCTTTACTGG CCGATCCGCG CTGGGCGCAT TTCTCCGCCG CATATCGCAA CTATGTCGGA 
AACAATATTG ACGGAAATAA CAATGCCGCT GTCAGTTTTG GTGAAACCAT TCCCTTCTAC 
CGCGCGAATT TCGGACAATC TACTGTGCAG TGGGAAGCAG GTCTTCAGGC TGCTGTCTTC 
AGCGACTTCA ATCTCGGCGC GCCTTCGTCC GATCTCATCA ATAGCGATTT CATAGCATCC 
GCTTATGGAA GCGTGCGGGC AGGCCATTTT TCTGCTTTCG GCCGTATCTA TCATCAAAGC 
TCTCATCTTG GAGACGAATT ATTGCTGCGC AGATTAACCA GCCTGCAGCG GATCAATCTC 
AGCTATGAGG GAGCCGATCT CAGATTGTCG TATGAGCTTC CGTATGGATT GAGGGTTTAC 
GGGGGTGGAG GTGGAATCTT TCACAAGGAA CCCTCGAACA TCAAGCCCTG GTCGATACAA 
TATGGCGTCG AGTTTCGCAG CCCGTGGCGG ATCGCGTTTT TACCGCTGCG ACCGATCGTG 
GCGGTTGACC TCAAGAACCA TCAGCAGAAC GACTGGAATG CCGATGTATC CGCGCGGGCA 
GGTGTTCAAC TGGATCACTT CCGGGCATTC GGCCGCAATC TTCAGTTCCT GGTTGAGTAT 
TTTCACGGAA ACTCCCCGAC GGGCCAGTTT TTCAGGCAGC GGGTGGATTA TCTCGGTATT 
GGAGCGCACT ATCATTTCTG A

Protein sequence

MRYLNIIAAM LFFTSTVHAA VTEDAYIAGY AAGVLKHGFG MEIPTLVVKD GIITVPEDKL 
KSENQAQVVQ ALSKIPGVTG VTIAEKSVSR IAEREAFKPI QHPSAISREP GAATTETAGV 
PAAGPTVLAT GMLPEGHLFK PLLADPRWAH FSAAYRNYVG NNIDGNNNAA VSFGETIPFY 
RANFGQSTVQ WEAGLQAAVF SDFNLGAPSS DLINSDFIAS AYGSVRAGHF SAFGRIYHQS 
SHLGDELLLR RLTSLQRINL SYEGADLRLS YELPYGLRVY GGGGGIFHKE PSNIKPWSIQ 
YGVEFRSPWR IAFLPLRPIV AVDLKNHQQN DWNADVSARA GVQLDHFRAF GRNLQFLVEY 
FHGNSPTGQF FRQRVDYLGI GAHYHF