Gene Nmul_A2547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2547
Symbol
ID	3786273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2916261
End bp	2917445
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	55%
IMG OID	637812638
Product	hypothetical protein
Protein accession	YP_413228
Protein GI	82703662
COG category	[R] General function prediction only
COG ID	[COG2081] Predicted flavoproteins
TIGRFAM ID	[TIGR00275] flavoprotein, HI0933 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.374165
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAGAAAG ATGTCGTCGT AATAGGCGCT GGCGCAGCCG GCATGATGTG CGCAATGGAA 
GCGGGAAAGC GTGGACGAAG TGTGTTGCTG GTGGATCATG CCAGCAAACT GGCGGAAAAA 
ATCCGTATCT CGGGAGGGGG GCGGTGTAAT TTCACGAATC GCCACACTGT TCCGGAAAAT 
TTTCTGTCGC AGAATCCGCA TTTCTGCCGA TCCGCACTTG CACGTTTCAC TCCTCGCCAC 
TTCATAGAGC TGGTGGAAAA GCACCGCATC CGTTATCACG AAAAAAAGCT GGGACAGCTA 
TTTTGCGATG AGGCCTCGCA GCAAATCATC GACATGCTGC GCAGTGAATG CGAGGCAGCC 
GGAGTCATCT TTCAAATGCC CTGCGAGGTA AGCCGCATAG ACCGGGACTC CGGCAATACT 
GGATTCGTAT TGGAAACCAG CTGTAGCAAA GTGATGGCAG ACGCGCTGGT AATCGCGACC 
GGAGGTCTTT CCATTCCGCA AATCGGCGCC AGTCCTTTTG GCTATCGCAT CGCAGAACAG 
TTCGGCATAA ACGTTACGGC GCTACGTCCC GCCCTGGTAC CGCTGACTTT TGCGCCGGAA 
CAGTTATCCG CTTTTTCAGG GCTCACGGGA ATTGCGCTCG ATACAATAGT GAGCTGTAAC 
GGCGCGCATT TTAGAGAAAA TCTGCTGATC ACGCATCGGG GTCTGAGCGG GCCTGCAATC 
CTCCAGATTT CCTCATACTG GCGGCCGGGA GATCCGATCC ATATCAACCT GTTACCTGAA 
CTGGATGCAG ACGATTGGTT GCGCGATCGC AGACACAGCG GGGTCCTGCT ATCCAATCTG 
TTAGCGCAGC ATCTGCCCCG GCGGTTTGCA GAGGCCTGGC TGGGTGCAAT GATGGGTGGG 
CTCCCGGAAA CACCTGTAAA CCAGTATGGC AACAAGAGCT TGAGGCAACT GGCTCCTCAA 
TTGCATGCCT GGCAGGTTAT TCCGAGCGGC ACCGCCGGCT ATAAAAAGGC GGAAGTAACC 
CTTGGAGGCA TCGATACTGC CGAGCTTTCT TCCAAAACGA TGGAATCGAA AAAAGTACCC 
GGCCTTTATT TCGTGGGAGA AGTCGTCGAT GTCACGGGCC AACTGGGGGG CTTCAATTTC 
CAGTGGGCCT GGTCATCGGG TTATGCGGCA GGGCAATCAG TGTAA

Protein sequence

MKKDVVVIGA GAAGMMCAME AGKRGRSVLL VDHASKLAEK IRISGGGRCN FTNRHTVPEN 
FLSQNPHFCR SALARFTPRH FIELVEKHRI RYHEKKLGQL FCDEASQQII DMLRSECEAA 
GVIFQMPCEV SRIDRDSGNT GFVLETSCSK VMADALVIAT GGLSIPQIGA SPFGYRIAEQ 
FGINVTALRP ALVPLTFAPE QLSAFSGLTG IALDTIVSCN GAHFRENLLI THRGLSGPAI 
LQISSYWRPG DPIHINLLPE LDADDWLRDR RHSGVLLSNL LAQHLPRRFA EAWLGAMMGG 
LPETPVNQYG NKSLRQLAPQ LHAWQVIPSG TAGYKKAEVT LGGIDTAELS SKTMESKKVP 
GLYFVGEVVD VTGQLGGFNF QWAWSSGYAA GQSV