Gene Nmul_A1617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1617
Symbol
ID	3784849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1856881
End bp	1858128
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	57%
IMG OID	637811706
Product	radical SAM family protein
Protein accession	YP_412310
Protein GI	82702744
COG category	[L] Replication, recombination and repair
COG ID	[COG1533] DNA repair photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGACG CTGATTCACC CATGGAAGCC GAGCCGCCAT TCGTGCAGCC GACCTTGAAA 
GCAAAGAAAG GAAGAGGAGC GGTATCCAAT CTCCAGGGGC GGTACGAGCA ATGGACGCGT 
CAAACCATCG ATGATGGCTG GGGAAATGAC GGTCTCATCG GAACCGCCGA CAGAGACAAG 
ACAGAAGATG ACGAGCCGGA CACAAGCTCG ACATGGAAGA CCCAGATCAT CGAGGAACAT 
GCCAAAACCA TACTAAGCCG CAATCAGTCG CCGGATGTGC CGTTCAGTAT TTCGCTCAAT 
CCTTATCGCG GATGCGAACA TGGTTGCATC TACTGTTTCG CGCGTCCCAC TCACAGTTAC 
CTGGGTTTGT CGCCCGGGCT GGATTTCGAA AGCAAAATAT TCGCCAAGAT CAATGCACCG 
GAGCTTTTGA GACGGGAGCT GGCAAAACAA TCATATGTGC CGGAACCCAT CGCGCTCGGC 
GTCAATACGG ACGCATATCA GCCCTGCGAG CGCGACTTGC GGTTGACACG GCGCGTGCTG 
GAAGTGCTAC GTGAGTGCGA ACATCCGGTT GCCTTGATTT CCAAGTCATC GCTGATGGAA 
CGCGACATGG ATTTGCTCTC CGATATGGCT TCAAGACGAT TGGCTGTGGC CGCGGTGACA 
ATCACCACTC TCGATCCCGC GGTTGCGCGC ACGCTCGAAC CGCGGGCAAC CGCTCCGGCA 
CGCCGTCTAC GGACGATTCG CACGCTGACG GATGCCGGAA TTCCGGTCGG CGTCAGCGTT 
GCACCGGTGA TTCCGTTTGT CACCGAGCCC GATCTGGAGC GAGTACTGAC GGCAGCAGCA 
GAAGCCGGAG CAATCAATGC AGGCTATGTC ATGTTGCGCC TGCCGTGGGA GATCAGCCCC 
CTGTTCAGGC AGTGGCTGGA AGCACATTTT CCTGATCGCG CTGCCCGGGT CATGAACCGG 
GTGCGCGACA TCAGGGGTGG CAAGGATTAC GATTCGAGCT TCGGCAGGCG CATGCGCGGC 
GAGGGCATCT GGGCCGACCT GATTCGGCAG CGATTCGACA AAACGGTGAA ACGCCTTGGG 
CTCAGTGCGC ATTCGCACCG ATTCACAGGA CTGGACAGCT CGCGTTTCCG TGCGCCTTCT 
GTCAATCCAG TAGCTCTCCA ATCACCCATG AGCGAAAAAT CGAAGGGAAA GGATTGGAAA 
GCAAAAACCG GAGAGCAAAA ACCAAACGAC CAGCTTGAGC TTTTTTGA

Protein sequence

MSDADSPMEA EPPFVQPTLK AKKGRGAVSN LQGRYEQWTR QTIDDGWGND GLIGTADRDK 
TEDDEPDTSS TWKTQIIEEH AKTILSRNQS PDVPFSISLN PYRGCEHGCI YCFARPTHSY 
LGLSPGLDFE SKIFAKINAP ELLRRELAKQ SYVPEPIALG VNTDAYQPCE RDLRLTRRVL 
EVLRECEHPV ALISKSSLME RDMDLLSDMA SRRLAVAAVT ITTLDPAVAR TLEPRATAPA 
RRLRTIRTLT DAGIPVGVSV APVIPFVTEP DLERVLTAAA EAGAINAGYV MLRLPWEISP 
LFRQWLEAHF PDRAARVMNR VRDIRGGKDY DSSFGRRMRG EGIWADLIRQ RFDKTVKRLG 
LSAHSHRFTG LDSSRFRAPS VNPVALQSPM SEKSKGKDWK AKTGEQKPND QLELF