Gene Nmul_A2472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2472
Symbol
ID	3784821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2826044
End bp	2827270
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	58%
IMG OID	637812563
Product	patatin
Protein accession	YP_413153
Protein GI	82703587
COG category	[R] General function prediction only
COG ID	[COG1752] Predicted esterase of the alpha-beta hydrolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.797753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTCCCGT CATCCTCACG GGTACCGAAA GTGGGCCTCG TCCTGACTGG AGGAGGGGCC 
CGTGCCGCCT ATCAGGTGGG TGTTCTGCAG GCTATCGCGG CGATGCTGCC CAAGAGAACG 
CGCACCCCCT TTCCCGTAAT TTGCGGTACA TCCGCCGGCG CATTCAATGC CGCGGTTCTC 
GCCATCTCGG CCCGGAACTT TCAGGAGGGT GTGCGACGCC TGTCGGGGGT ATGGGAAAAC 
GCGCACGTCA ACCAGGCCTA CCGGACAGAC CCTCTAGGCG TATACGCAAA TGCAATACGC 
TGGCTCGCAT CTCTCCTGTT TGGAAGCGTG AAAAACCAGG GCGCGACCTC CCTGCTCGAC 
AACTCGCCAC TTGCGCAACT GCTGGAAAAC AGCCTGCCGC TTCAAAGCAT TCAGAAGAGT 
ATCGATACCG GCGCCTTGCA TGCTCTCGGC ATTACCGCCT GGGGCTATAC CAGCGGACAA 
TCGGTGACGT TCTATCAGGG TGCGGACAGC ATACGGTCGT GGAAGCGGGA ACGCCGCATC 
GGTGTCGCCG TTCCTATCGA AATTGAGCAT CTGCTGGCCT CTTCCGCCAT TCCGCTTCTT 
TTTCCAGCCG TGCGGCTGAA CCGCGAGTAC TTCGGAGACG GTTCAATGCG CCAGCTTGCG 
CCGTTGAGTC CCGCGCTGCA TCTCGGGGCA GACCGTGTGC TGGTGATTGG CGTGCGCAAG 
ATAGAGGAAA CACAGCCCGA GCGTGTCAAG GTAGACACCT ATCCCACGCT CGCGCAGATC 
GGCGGTCATA TCATGAGCAG TATTTTTCTC GATAACCTTT ATGTCGACTT GGAACGGTTG 
CAGCGCATCA ATCGGACCCT ACGCATGATT CCCGAAGAAA AAATGAGAAA TCACGACATG 
CCGCTGCGCC AGATTCAACA TATGGTCATT TCCCCCAGCG TTGAATTCAC TGAAATCGCG 
CAGCAGCACG CTGCAACCCT GCCGCATACT ATCCGGCTTT TTTACCGGGC CATCGGGGCA 
ATGAGACGCG ACGGCTCGTC TCTCCTGAGC TATGTTCTGT TTGAAGAACC CTTCTGCCGC 
GCACTCATCG ATCTCGGCTA TCAGGATACG CTGCCGCGCA AAGCCGAACT CTTGCGGTTT 
CTCAATGCAG CGCCAATCAA TGGGCCGACG CAAGCAGATT TATCCGACGC TGGTATAATC 
CGCAATCCAG TTCCGGGGAT AGGCTGA

Protein sequence

MLPSSSRVPK VGLVLTGGGA RAAYQVGVLQ AIAAMLPKRT RTPFPVICGT SAGAFNAAVL 
AISARNFQEG VRRLSGVWEN AHVNQAYRTD PLGVYANAIR WLASLLFGSV KNQGATSLLD 
NSPLAQLLEN SLPLQSIQKS IDTGALHALG ITAWGYTSGQ SVTFYQGADS IRSWKRERRI 
GVAVPIEIEH LLASSAIPLL FPAVRLNREY FGDGSMRQLA PLSPALHLGA DRVLVIGVRK 
IEETQPERVK VDTYPTLAQI GGHIMSSIFL DNLYVDLERL QRINRTLRMI PEEKMRNHDM 
PLRQIQHMVI SPSVEFTEIA QQHAATLPHT IRLFYRAIGA MRRDGSSLLS YVLFEEPFCR 
ALIDLGYQDT LPRKAELLRF LNAAPINGPT QADLSDAGII RNPVPGIG