Gene Nmul_A0064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0064
Symbol
ID	3785788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	69640
End bp	70902
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	55%
IMG OID	637810133
Product	Phage integrase
Protein accession	YP_410765
Protein GI	82701199
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAAGC TAACAGACAT GGAGATCCGC AACTGGATCA AGGCGGGCGA ACGGTTTGAA 
GGCCGTGCTG TAGGTGGTGG CCTATATCTG AGTTTTCGTG AAGGTTATGC CATTCCTATC 
TGGCGTTTCA GATACCGTTT TTGTGGCAAG CGCCGCGTTA TGAATATTGG CAGTTACGGT 
ACGCTATCCC TGGCGGATGC CAGGGATGAA GCCAAGAAGC TGTCCGCTCG CGTTGCTTTG 
GGCTACGACG TGGCCGGAGA AAAACAGCAG CGCAAGGGCG AAGCCATTGC CAGGATAGAA 
GCGGAGAAGA ATGCGTACAC CGTGGCGCAG CTGGCCGACG AATATTTTGA AAGGATGATT 
GCAGGGCGAT GGAAGCACCC AAACATCGTA CGATCCAGGA TCGAGAAAGA CATCAAGCCC 
GCGATTGGCA GCTTGAAGGT TGAGGATGTA AAGCCCAGGC ATATTGATGA TGTGCTCAAG 
GCTGTAATGA AACGGGGTGC GCCTTCCATA GCGAACGATA CACTGCGCTG GCTTAAGCGC 
ATGTTCAACT ATGCTATCAA GCGCCACATC ATCGAATACA ATCCCGCGGC TGCATTTGAT 
CCAGGTGACG CTGGCGGCAA GGAGAAAAGC CGGACGCGCT GGTTGACCAG CGAGGAGCTG 
GTCACGCTCT TTGAAGCAAT GCGGCAAGCA CCTGGTTTCA GTGTGGAGAA CGGCTTGAGC 
ATCAAACTGC TATTACTGCT TGCGGTGCGA AAGGGTGAGC TGATCGGCGC CAGGTGGTCT 
GAGTTCGACC TGGATAAAGC TGTCTGGTAT CTGCCTGCCG AACGCACGAA AACCGAATCT 
GCCATTGACA TACCCTTGCC TCCGATTGCA GTAGAGTGGC TGCGCGAGTT GCAGCGCCTG 
GCGGGTGTTA GCAAGTGGGT GTTGCCGGCT CGCAAGATGC AGGATCGGAT GATTCCACAT 
ATTGCGGAAA GCACGCTGAG CGTGGCTCTG GCAAAGATCA AGCACGGCCT GGAACCCTTC 
ACTATCCATG ATCTACGCCG TACTGCGCGT ACGCATTTCG AAGCCCTGGG CGTTGCCCCT 
CACATTGCCG AGCGTTGCCT GAATCACAAG ATCAAGGGGA TCGAGGGCAT CTATAACCGG 
CACGACTACT TTGAAGAACG CAAGGCGGCA CTGGAGGCCT GGGCGGGACT GTTGCTCCAG 
ATCGAGCGGG GCGAGGCTGA TAAGGTTGTG CCGATCAGGC GTGCCGTAGC AACAAAACAA 
TAA

Protein sequence

MAKLTDMEIR NWIKAGERFE GRAVGGGLYL SFREGYAIPI WRFRYRFCGK RRVMNIGSYG 
TLSLADARDE AKKLSARVAL GYDVAGEKQQ RKGEAIARIE AEKNAYTVAQ LADEYFERMI 
AGRWKHPNIV RSRIEKDIKP AIGSLKVEDV KPRHIDDVLK AVMKRGAPSI ANDTLRWLKR 
MFNYAIKRHI IEYNPAAAFD PGDAGGKEKS RTRWLTSEEL VTLFEAMRQA PGFSVENGLS 
IKLLLLLAVR KGELIGARWS EFDLDKAVWY LPAERTKTES AIDIPLPPIA VEWLRELQRL 
AGVSKWVLPA RKMQDRMIPH IAESTLSVAL AKIKHGLEPF TIHDLRRTAR THFEALGVAP 
HIAERCLNHK IKGIEGIYNR HDYFEERKAA LEAWAGLLLQ IERGEADKVV PIRRAVATKQ