Gene Nmul_A0450 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0450
Symbol
ID	3785918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	499228
End bp	500937
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	54%
IMG OID	637810526
Product	prolyl-tRNA synthetase
Protein accession	YP_411150
Protein GI	82701584
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00409] prolyl-tRNA synthetase, family II

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.543628
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAGCAT CAGGTTTTTT CATTTCGACA CTCAAGGAAG CCCCCGCCGA AGCGGAATTG 
ATCAGCCACA AGCTGATGCT GAGGGCCGGT ATCATCCGGC GGCTGGGGAG CGGTCTCTAC 
ACGTGGATGC CCCTCGGCTT GAAGGTTCTG CGCAAAGTTG AAAACATCGT GCGGGAGGAA 
ATGGATGCCG CGGGCGCACT GGAACTGCTG ATGCCGGCTG TGCAGCCTGC GGAGCTATGG 
CGGGAAACAG GGCGATGGGA CGTCTTTGGT CCCCAGATGT TGAAAATTAG AGACAGACAC 
GAGCGCGATT TCTGTTTTGG TCCAACCCAT GAAGAGGTCA TAACGGATAT TGCACGGCGT 
GAAATCAAGA GTTACCGGCA GTTACCTCTC AATTTTTATC AGATACAAAC CAAATTTCGC 
GACGAGGTTC GCCCCCGCTT CGGCGTCATG CGCGCGCGCG AGTTCGTGAT GAAAGATGCC 
TATTCGTTCC ACACCGATAT ACCCAGCCTG GAAGAGACCT ATCAGGCCAT GCATGTGGCC 
TATTGCCGGA TATTCGATCG CCTGGGGCTG AAGTTTCGTC CCGTCAAGGC CGATACGGGT 
GCGATTGGTG GCAGCAGTTC GCATGAATTT CATGTCCTGG CCGATTCCGG CGAAGACGCC 
ATCGCTTTTT GTTCCGATTC CGATTACGCA GCGAACGTTG AAATGGCCGA GTCGTTGCCG 
CCAGCAGGAC TGCGGGAGGC TGCGGCGGGC GAGATGCAGA AAGTGCGAAC AATCGCCCAA 
AAGACATGCG AAGAGGTTGC TGCCTATCTC AATGTATCCA TCGAGCAGAC GGTAAAAACG 
CTGGCGGTCA TGGCCAATGG CGGAATGCAT CTTTTGCTGC TGCGTGGCGA TCATCATCTC 
AACGAGACAA AAGTTCGAAA GATTCCTTTT CTTTCCGATT TCCGGCTTGC CAGCGAAGAA 
GAAATTCGCA CCGAAACAGG ATGTCTTCCC GGGTTTATCG GCCCAGCCGG ATTGTCTCTT 
CCGGTTATCG CAGACCTTAC CGTAGCCACC ATGAGTAACT TTGTGTGCGG CGCCAACGAA 
GAGGATTACC ATCTCGTCAA CGTCAATTTC GGGCGTGATC TGAAAGAGCC GGATCATGTT 
TTCGATATCC GCAACGTGGT TTCCGGTGAC TTGTCGCCGG ACGGAAAGGG TAAGCTGGAA 
ATCTGTCGCG GCATAGAAGT CGGCCATATT TTCCAATTGC TCACAAAGTA TTCGGAAGCG 
ATGAAAGCCA ATTATCTCGA TGAATCCGGG CAAGCGCGTC CCATGGAAAT GGGCTGCTAC 
GGGATCGGGG TTTCACGTAT TGTGGCAGCT GCCATCGAGC AGAACCATGA CGAGCGCGGC 
ATTATATTTC CCGCGGCAAT GGCGCCATTT CAGGTAGTCA TCATTCCGAT CGGGTTGAAG 
AAGAATGCAG AAGTGAGGGC TGAGGCGGAG AAACTATACG CGACGCTTTC CAGTGTCGGC 
ATCGAGGTTC TGCTCGACGA CCGGGATGAC CGCCCCGGTG TCATGTTCGC CGACATGGAA 
CTGATCGGTA TTCCTCACCG GGTTGTCGTC GGCGAGCGGG GCTTGAAGGA AGGAAATGCC 
GAGTATCGCG GGCGGCGTGA CGAAAAATCG GAGGTCGTCC CCCTTCCCGA GATCGCAGAT 
TTTATAAAAT CAAAATTAGC CGGGGGTTGA

Protein sequence

MRASGFFIST LKEAPAEAEL ISHKLMLRAG IIRRLGSGLY TWMPLGLKVL RKVENIVREE 
MDAAGALELL MPAVQPAELW RETGRWDVFG PQMLKIRDRH ERDFCFGPTH EEVITDIARR 
EIKSYRQLPL NFYQIQTKFR DEVRPRFGVM RAREFVMKDA YSFHTDIPSL EETYQAMHVA 
YCRIFDRLGL KFRPVKADTG AIGGSSSHEF HVLADSGEDA IAFCSDSDYA ANVEMAESLP 
PAGLREAAAG EMQKVRTIAQ KTCEEVAAYL NVSIEQTVKT LAVMANGGMH LLLLRGDHHL 
NETKVRKIPF LSDFRLASEE EIRTETGCLP GFIGPAGLSL PVIADLTVAT MSNFVCGANE 
EDYHLVNVNF GRDLKEPDHV FDIRNVVSGD LSPDGKGKLE ICRGIEVGHI FQLLTKYSEA 
MKANYLDESG QARPMEMGCY GIGVSRIVAA AIEQNHDERG IIFPAAMAPF QVVIIPIGLK 
KNAEVRAEAE KLYATLSSVG IEVLLDDRDD RPGVMFADME LIGIPHRVVV GERGLKEGNA 
EYRGRRDEKS EVVPLPEIAD FIKSKLAGG